JP2011053922A - Code-based multilingual interpretation device and method - Google Patents

Code-based multilingual interpretation device and method Download PDF

Info

Publication number
JP2011053922A
JP2011053922A JP2009202346A JP2009202346A JP2011053922A JP 2011053922 A JP2011053922 A JP 2011053922A JP 2009202346 A JP2009202346 A JP 2009202346A JP 2009202346 A JP2009202346 A JP 2009202346A JP 2011053922 A JP2011053922 A JP 2011053922A
Authority
JP
Japan
Prior art keywords
language
code
multilingual
native
native language
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009202346A
Other languages
Japanese (ja)
Inventor
Heigen In
炳元 尹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to JP2009202346A priority Critical patent/JP2011053922A/en
Priority to KR1020100084555A priority patent/KR20110025108A/en
Publication of JP2011053922A publication Critical patent/JP2011053922A/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/53Processing of non-Latin text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/221Announcement of recognition results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a code-based multilingual interpretation device and method capable of rapidly interpreting into multiple languages. <P>SOLUTION: The code-based multilingual interpretation device and method capable of rapidly interpreting multiple languages by defining words and set phrases for communication common to languages as codes and then mapping the languages to the codes are provided. The device comprises a multiple language standard database in which words and set phrases of one's own language are mapped to the words and set phrases of other languages based on the codes; a one's own language speech recognition device for recognizing the speech of the one's own language; an interpretation search engine that receives the one's own language recognized by the one's own language speech recognition device, retrieves the corresponding codes, searches for another language corresponding to the codes retrieved, and outputs the result; a word order converter which, if the other language received from the interpretation search engine is a set phrase, directly outputs it and which, if the language received is a plurality of words, converts the word order of the one's own language into the word order of the other language and outputs the sentence of the language converted; a speech output means; and a display means. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、多国語通訳装置及び方法に関し、さらに詳しくは各国言語に共通する意思伝達のための単語や簡単な慣用文をコード(インデックス)で定義した後、各国の言語をコードにマッピングして迅速に多国語を通訳できるコード基盤多国語通訳装置及び方法に関する。   The present invention relates to a multilingual interpreting apparatus and method, and more specifically, a word for communication and a simple idiom common to each language are defined by a code (index), and then the language of each country is mapped to the code. The present invention relates to a code-based multilingual interpreting apparatus and method capable of quickly translating multilingual languages.

最近、交通手段が発達し経済水準が向上することによって海外旅行が頻繁になって外国人の訪問も増加している。ところが、外国語が上手でない場合、海外旅行や外国人に会った時、意志疎通が図れないことが多い。このような問題点を解決するために本願出願人は大韓民国特許庁に音声認識を用いた多国語通訳/学習装置及び方法を特許出願して大韓民国登録特許第10−0593589号として登録を受けている。特許登録された第10−0593589号の技術によれば、多国語コンテンツを様々な状況(エピソード)とケース(ユニット)に分けて構築した後、状況とケースを基準に通訳を処理する。   Recently, overseas travel has become frequent due to the development of transportation and improved economic standards, and the number of foreign visitors has also increased. However, if you are not good at foreign languages, you often cannot communicate when you travel abroad or meet foreigners. In order to solve such problems, the present applicant has filed a patent application with the Korean Patent Office for a multilingual interpreting / learning apparatus and method using speech recognition, and has been registered as Korean Patent No. 10-0593589. . According to the technique of the patent registered No. 10-0593589, after constructing multilingual content divided into various situations (episodes) and cases (units), interpretation is processed based on the situations and cases.

大韓民国登録特許第10−0593589号Korean Registered Patent No. 10-0593589

従来の多国語通訳システムはそれぞれの状況とケース毎に予めコンテンツを構築しておいた後、状況とケースに応じた内容を探して相手の国の言葉に変換していたので状況とケースが正確に一致しない場合には、通訳ができなくなり自然な通訳が難しく、状況とケースを探して通訳する手順が複雑で、時間が遅れる問題点がある。   In the conventional multilingual interpreter system, the contents were constructed in advance for each situation and case, and then the contents according to the situation and case were searched and converted into the language of the partner country, so the situation and case were accurate. If it does not match, there is a problem that interpretation is not possible and natural interpretation is difficult, and the procedure for searching for situations and cases is complicated and time is delayed.

本発明は、前記のような問題点を解消するために提案されるものであり、本発明の目的は各国言語に共通する意思伝達のための単語や簡単な慣用文をコードで定義した後、コードを基準に各国の言語のデータベースを構築し、音声認識によって自国語を認識した後、コードを基準に他国語を検索して迅速に多国語への通訳を行うことができるコード基盤多国語通訳装置及び方法を提供することにある。   The present invention is proposed in order to solve the above-mentioned problems, and the object of the present invention is to define words and simple idioms for communication that are common to the languages of each country after code. A code-based multilingual interpreter that builds a database for each country's language based on the code, recognizes the native language through speech recognition, and then searches for other languages based on the code to quickly translate to other languages It is to provide an apparatus and method.

前記のような目的を達成するために、本発明の装置は、コードを基準に自国語単語と慣用文が他国語単語と慣用文にマッピングされている多国語標準データベースと、マイクを介して入力された自国語を音声認識する自国語音声認識器と、前記自国語音声認識器で認識された自国語を受信して対応するコードを検索し、検索されたコードに対応する他国語を探して出力する通訳検索エンジンと、前記通訳検索エンジンから受信した他国語が慣用文であればそのまま出力し、複数の単語であれば自国語の語順を他国語の語順に変換してその変換された他国語の文章を出力する語順変換器と、前記語順変換器の他国語テキストを音声信号に変換するTTS(Text to Speech)と、前記TTSの音声信号を増幅してスピーカに出力する音声出力手段と、前記語順変換器のテキスト出力を文字で表示するディスプレイ手段と、を具備したことを特徴とする。   In order to achieve the above-described object, the apparatus of the present invention inputs a multilingual standard database in which native language words and idiomatic sentences are mapped to other language words and idiomatic sentences based on a code, via a microphone. A native language speech recognizer that recognizes the recognized native language, and retrieves the corresponding native language recognized by the native language speech recognizer, searches for a corresponding code, and searches for another language corresponding to the retrieved code. Interpretation search engine to be output, and if the other language received from the interpreter search engine is idiomatic, it is output as it is. A word order converter for outputting a sentence in Japanese, a TTS (Text to Speech) for converting another language text of the word order converter into a voice signal, and a voice output means for amplifying the voice signal of the TTS and outputting it to a speaker The above Display means for displaying the text output of the word order converter in characters.

また前記のような目的を達成するために本発明の方法は、意思伝達のための単語や慣用語でコードを定義し、前記コードを基準に多国語標準データベースを構築するステップと、自国語と他国語を設定するステップと、設定された自国語の音声を受信して自国語を音声認識するステップと、前記認識された自国語に対応するコードを検索するステップと、前記検索されたコードにマッピングされた他国語を自国語順で検索するステップと、前記自国語順で配列された他国語を他国語の語順に変換して他国語テキスト文章を形成するステップと、前記他国語テキスト文章を他国語音声信号に変換するステップと、を具備したことを特徴とする。   In order to achieve the above-mentioned object, the method of the present invention includes a step of defining a code with words and idioms for communication, constructing a multilingual standard database based on the code, A step of setting another language, a step of receiving voice of the set native language and recognizing the native language, a step of searching for a code corresponding to the recognized native language, and Searching the mapped foreign language in the native language order, converting the foreign language arranged in the native language order into the language of the foreign language to form a foreign language text sentence, and the foreign language text sentence Converting to a foreign language audio signal.

本発明によれば、各国言語に共通する意思伝達のための単語や簡単な慣用文を手話に基づいたコード(手話コード)で定義した後、手話コードを基準に各国の言語のデータベースを構築し、音声認識によって自国語を認識した後、手話コードを基準に他国語を検索して迅速かつ正確に自国語を他国語に通訳することができる。また、本発明によれば、自国語をNヶ国語に同時通訳することができ、テキストとともにTTS技術を用いて他国語の音声を即時出力できる。   According to the present invention, after defining words and simple idioms for communication common to the languages of each country using codes based on sign language (sign language codes), a database for each language is constructed based on the sign language codes. After recognizing the native language by voice recognition, it is possible to search for the other language based on the sign language code and quickly and accurately interpret the native language into the other language. In addition, according to the present invention, the native language can be simultaneously translated into N languages, and voices in other languages can be immediately output using the TTS technology together with the text.

本発明によって多国語標準データベースを構築する概念を示した概略図である。It is the schematic which showed the concept which builds a multilingual standard database by this invention. 本発明による標準コード基盤多国語通訳装置の第1実施の形態を示す図である。[BRIEF DESCRIPTION OF THE DRAWINGS] It is a figure which shows 1st Embodiment of the standard code base multilingual interpretation apparatus by this invention. 本発明による第1実施の形態の動作手順を示すフローチャートである。It is a flowchart which shows the operation | movement procedure of 1st Embodiment by this invention. 本発明による標準コード基盤多国語通訳装置の第2実施の形態を示す図である。It is a figure which shows 2nd Embodiment of the standard code base multilingual interpreting apparatus by this invention. 本発明による第2実施の形態の動作手順を示すフローチャートである。It is a flowchart which shows the operation | movement procedure of 2nd Embodiment by this invention.

本発明と本発明の実施によって達成される技術的課題は、次に説明する本発明の好ましい実施の形態によってより明確になるであろう。次の実施の形態は本発明を説明するために例示したものに過ぎず、本発明の範囲を制限するためのものではない。   The technical problems achieved by the present invention and the practice of the present invention will become clearer by the preferred embodiments of the present invention described below. The following embodiments are merely examples for explaining the present invention and are not intended to limit the scope of the present invention.

図1は、本発明によって多国語標準データベースを構築する概念を示した概略図である。   FIG. 1 is a schematic diagram illustrating the concept of constructing a multilingual standard database according to the present invention.

本発明は、意思伝達のために共通する単語や慣用文をコード化して標準コードを生成した後、各国言語を標準コードとマッピングさせて標準コードを基準に次の表1のような多国語標準データベースを構築する。本発明の実施の形態では各国の手話が意思伝達に必要な最適の手段であることに着目して手話を基準にコード(14)を定義するが、頻繁に使用する簡単な文章もコードで定義する。このように本発明によって各国の手話単語と頻繁に使用する簡単な慣用文をコード化して共通の意味を示すように定義したものを「手話コード(14)」とする。   The present invention generates a standard code by coding common words and idiomatic sentences for communication, and then maps the national language to the standard code and uses the standard code as a reference for the multilingual standards as shown in Table 1 below. Build a database. In the embodiment of the present invention, the sign (14) is defined on the basis of the sign language, focusing on the fact that the sign language of each country is the optimum means necessary for communication, but simple sentences frequently used are also defined by the code. To do. In this way, the sign language code (14) defined by coding the sign language word of each country and the frequently used simple idiomatic sentence according to the present invention so as to indicate a common meaning is defined.

Figure 2011053922
Figure 2011053922

前記表1で第1国語(12-1)は韓国語、第2国語は英語、第n国語(12-N)は日本語である。本発明では韓国語の

Figure 2011053922
に該当する意味を手話コード(14)「00000001」で定義した後、この手話コード(14)と同じ意味の英語である「mountain」をマッピングさせ、日本語の「やま」をマッピングさせる。このように本発明の多国語標準データベース(16)には各国の単語と簡単な慣用文が手話コード(14)を基準にマッピングされている。 In Table 1, the first language (12-1) is Korean, the second language is English, and the nth language (12-N) is Japanese. In the present invention, Korean
Figure 2011053922
After defining the meaning corresponding to the sign language code (14) “00000001”, “mountain” which is English having the same meaning as the sign language code (14) is mapped, and “yama” in Japanese is mapped. As described above, the multilingual standard database (16) of the present invention maps the words of each country and simple idioms based on the sign language code (14).

図2は、本発明によるコード基盤多国語通訳装置の第1実施の形態であり、独立した端末機の形態で実施した例である。このような端末機としては専用端末機も使用可能であるが、携帯電話、電子辞典、ポータブルマルチメディアプレーヤー(PMP)などのような携帯端末機に追加搭載されることもできる。   FIG. 2 is a first embodiment of a code-based multilingual interpreting apparatus according to the present invention, which is an example implemented in the form of an independent terminal. As such a terminal, a dedicated terminal can be used, but it can be additionally installed in a portable terminal such as a mobile phone, an electronic dictionary, and a portable multimedia player (PMP).

本発明によるコード基盤多国語通訳装置(100)は、図2に示すように、マイク(102)、アナログデジタル(A/D)変換器(104)、デジタルアナログ(D/A)変換器(106)、増幅器(108)、スピーカ(110)、キー入力部(112)、音声認識器(121)、通訳検索エンジン(122)、語順変換器(123)、TTS(124)、多国語標準データベース(16)及びLCD(130)で構成される。ここで、音声認識器(121)、通訳検索エンジン(122)、語順変換器(123)及びTTS(124)は、MCU(120)で実行されるソフトウェアであり得る。   As shown in FIG. 2, a code-based multilingual interpreting apparatus (100) according to the present invention includes a microphone (102), an analog / digital (A / D) converter (104), and a digital / analog (D / A) converter (106). ), Amplifier (108), speaker (110), key input unit (112), speech recognizer (121), interpreter search engine (122), word order converter (123), TTS (124), multilingual standard database ( 16) and LCD (130). Here, the speech recognizer (121), the interpretation search engine (122), the word order converter (123), and the TTS (124) may be software executed by the MCU (120).

図2に示すように、多国語標準データベース(16)はHDDやフラッシュメモリのような保存媒体に保存されており、手話コードを基準に自国語単語と慣用文が他国語単語と慣用文にマッピングされている。   As shown in FIG. 2, the multilingual standard database (16) is stored in a storage medium such as an HDD or a flash memory, and local language words and idiomatic sentences are mapped to other language words and idiomatic sentences based on sign language codes. Has been.

アナログデジタル変換器(104)はマイク(102)からアナログ音声信号を受信してデジタルに変換し、自国語音声認識器(121)はマイク(102)を介して入力された自国語を音声認識して認識された文章と単語のテキストを出力する。   The analog-to-digital converter (104) receives the analog voice signal from the microphone (102) and converts it into digital, and the native-language speech recognizer (121) recognizes the native language input via the microphone (102). The sentence and the word text recognized are output.

通訳検索エンジン(122)は音声認識器(121)が認識した自国語文章を受信して多国語標準データベース(16)上の自国語データと比較して一致する文章があれば、その文章の手話コードを探して、その手話コードにマッピングされた他国語文章を探して他国語文章を語順を変換することなくTTS(124)に出力する。また、通訳検索エンジン(122)は一致する文章がない場合、その文章を構成する単語をそれぞれ検索して単語の手話コードを探した後、その手話コードにマッピングされた他国語単語を検索して語順変換器(123)に出力する。   The interpreter search engine (122) receives the native language sentence recognized by the speech recognizer (121), and if there is a sentence that matches the native language data in the multilingual standard database (16), the sign language of the sentence A code is searched, a foreign language text mapped to the sign language code is searched, and the foreign language text is output to the TTS (124) without changing the word order. Also, when there is no matching sentence, the interpreter search engine (122) searches each word constituting the sentence to find the sign language code of the word, and then searches for another language word mapped to the sign language code. Output to the word order converter (123).

語順変換器(123)は通訳検索エンジン(122)から文章や単語を自国語順で入力されて文章の場合には語順を変換することなくそのままTTS(124)に伝達し、単語の場合には文章終了信号に応じて自国語の語順を他国語の語順に変換して変換された他国語文章をTTS(124)に出力する。   The word order converter (123) inputs sentences and words from the interpreter search engine (122) in the native language order and transmits them to the TTS (124) without converting the word order in the case of sentences, and in the case of words According to the sentence end signal, the native language word order is converted to the other language word order, and the converted foreign language sentence is output to the TTS (124).

TTS(124)は語順変換器(123)の他国語テキストを音声データに変換し、デジタルアナログ変換器(124)はデジタルデータをアナログ信号に変換して増幅器(108)に出力する。増幅器(108)はアナログオーディオ信号を受信して増幅した後スピーカ(110)を介して出力する。   The TTS (124) converts the other language text of the word order converter (123) into speech data, and the digital-analog converter (124) converts the digital data into an analog signal and outputs it to the amplifier (108). The amplifier (108) receives and amplifies the analog audio signal, and then outputs it through the speaker (110).

LCD(130)は語順変換器(123)から入力された他国語テキストデータを受信して自国語に対応する他国語文章を文字で表示する。場合によっては語順変換器(130)を介して手話コードを受信して他国語の手話動作を共に出力することができる。またLCD(130)はタッチパネルで実施されキー入力部機能と一体になることもできる。   The LCD (130) receives the foreign language text data input from the word order converter (123) and displays the foreign language text corresponding to the native language in characters. In some cases, a sign language code can be received via the word order converter 130 and a sign language operation in another language can be output together. Further, the LCD (130) can be integrated with a key input unit function by a touch panel.

制御部(125)は電源がオン状態になると、多国語通訳を設定するための初期画面をLCD(130)に出力して通訳可能な言語を案内するとともに、キー入力部(112)を介して使用者の操作を受信して自国語と他国語とを設定する。ここで自国語とは使用者が音声で入力する言語であり、他国語とは相手方が聞いて理解できる相手方の言語である。本発明によれば、多国語標準データベース(16)にNヶ国語のデータを保存する場合にNヶ国語の同時通訳が可能であるが、実際にはデータベースの容量を考慮して韓国語、日本語、英語など3ヶ国語のデータベースを構築した後、自国語−他国語設定に沿って次の表2のように通訳処理を行うことができる。また語順変換器(123)、TTS(124)、デジタルアナログ変換器(106)、増幅器(108)、スピーカ(110)など出力部分を二重に構成する場合には自国語を二つの他国語に同時通訳することもでき、N重に構成する場合にはNヶ国語に同時通訳することもできる。   When the power is turned on, the control unit (125) outputs an initial screen for setting a multilingual interpretation to the LCD (130) to guide the languages that can be interpreted, and via the key input unit (112). The user's operation is received and the native language and the foreign language are set. Here, the native language is a language that the user inputs by voice, and the other language is the language of the other party that the other party can hear and understand. According to the present invention, when N languages are stored in the multilingual standard database (16), simultaneous interpretation of N languages is possible. After constructing a database of three languages such as Japanese and English, the interpretation processing can be performed as shown in Table 2 below according to the setting of the native language and other languages. When the output part such as word order converter (123), TTS (124), digital-analog converter (106), amplifier (108), speaker (110) is doubled, the native language is changed to two other languages. Simultaneous interpretation is possible, and in the case of N-fold configuration, simultaneous interpretation into N languages is also possible.

Figure 2011053922
Figure 2011053922

次に、上記のように構成される多国語通訳装置(100)の動作を説明すれば次のとおりである。   Next, the operation of the multilingual interpreting apparatus (100) configured as described above will be described as follows.

図3は、本発明による第1実施の形態の動作手順を示すフローチャートである。   FIG. 3 is a flowchart showing the operation procedure of the first embodiment according to the present invention.

先ず、本発明による手話コード基盤多国語通訳装置(100)は、意思伝達のための単語や慣用語で手話コードを定義し、手話コードを基準に多国語標準データベース(16)を構築する(S101)。そして、手話コード基盤多国語通訳装置の保存装置には多国語標準データベース(16)と動作のためのソフトウェアが搭載されている。   First, the sign language code-based multilingual interpreter (100) according to the present invention defines a sign language code with words and idioms for communication, and constructs a multilingual standard database (16) based on the sign language code (S101). ). The storage device of the sign language code-based multilingual interpreter is equipped with a multilingual standard database (16) and software for operation.

電源がオン状態になると、MCU(120)はフラッシュメモリやHDDに保存されたソフトウェアを読み込んで多国語通訳のためのメニュー画面をLCD(130)に出力する。メニュー画面には自国語と他国語を設定するための項目があり、方向キーやエンターキーなどを用いて自国語と他国語を設定する(S102)。   When the power is turned on, the MCU (120) reads the software stored in the flash memory or HDD and outputs a menu screen for multilingual interpretation to the LCD (130). The menu screen has an item for setting the native language and the other language, and the native language and the other language are set using the direction keys, the enter key, and the like (S102).

自国語と他国語が設定されるとMCU(120)は自国語を認識するための音声認識器(121)を駆動し、通訳検索エンジン(122)に自国語と他国語の設定を知らせ、設定された自国語の語順を他国語の語順に変換するための語順変換器(123)を駆動させ、設定された他国語テキストを他国語音声に変換するためのTTS(124)を駆動する。   When the native language and the foreign language are set, the MCU (120) drives the speech recognizer (121) for recognizing the native language, informs the interpreter search engine (122) of the setting of the native language and the foreign language, and sets it. The word order converter (123) for converting the word order of the native language thus set is driven, and the TTS (124) for converting the set foreign language text into the foreign language speech is driven.

設定が完了した後、使用者が自国語で話すと、マイク(102)は自国語音声を電気的な信号に変換し、アナログデジタル変換器(104)はデジタル変換して音声認識器(121)に伝達する。音声認識器(121)は一つの文章の最初と最後を認識するとともに文章の内容を認識し、文章を構成する単語を認識して自国語テキストを出力する(S103)。   After the setting is completed, when the user speaks in his / her native language, the microphone (102) converts the native language voice into an electrical signal, and the analog-digital converter (104) converts it into a digital signal and converts it into a voice recognizer (121). To communicate. The speech recognizer (121) recognizes the beginning and end of one sentence, recognizes the contents of the sentence, recognizes the words constituting the sentence, and outputs the native language text (S103).

そして、通訳検索エンジン(122)は先ず音声認識器(121)から伝達された文章を多国語標準データベース(16)の該当自国語データと比較して一致する慣用文があれば、その文章の手話コードを検索する(S104)。そして、検索された手話コードにマッピングされた他国語の文章を引き出して語順変換器(123)を経てそのままTTS(124)に伝達する(S111)、(S112)。   The interpreter search engine (122) first compares the sentence transmitted from the speech recognizer (121) with the corresponding native language data of the multilingual standard database (16), and if there is a matching idiomatic sentence, the sign language of the sentence The code is searched (S104). Then, a sentence in another language mapped to the searched sign language code is extracted and transmitted to the TTS (124) through the word order converter (123) (S111) and (S112).

もし、文章レベル検索で一致する文章がない場合には文章を構成する単語を同じ方式で検索して多国語標準データベース(16)からその単語の手話コードを検索した後、手話コードにマッピングされた他国語単語を探して語順変換器(123)に伝達する(S105〜S107)。   If there is no matching sentence in the sentence level search, the words constituting the sentence are searched in the same way, and the sign language code of the word is searched from the multilingual standard database (16) and then mapped to the sign language code. The foreign language word is searched and transmitted to the word order converter (123) (S105 to S107).

語順変換器(123)は自国語単語順で配列された他国語の語順を変換して他国語文章を形成した後、変換された他国語文章テキストをLCD(130)にそのまま出力して他国語文字に表示するとともに、TTS(124)に伝達して他国語テキストを他国語音声に変換する(S108〜S110)。   The word order converter (123) converts the word order of other languages arranged in the native language word order to form a foreign language sentence, and then outputs the converted foreign language sentence text to the LCD (130) as it is In addition to displaying the text, it is transmitted to the TTS (124) to convert the foreign language text into the foreign language speech (S108 to S110).

したがって、本発明によれば、手話コードを基準に多国語標準データベースから自国語に対応する他国語文章や単語を検索して迅速かつ正確に通訳処理を行うことができる。   Therefore, according to the present invention, it is possible to search for a foreign language sentence or word corresponding to the native language from the multilingual standard database based on the sign language code, and to perform the interpretation process quickly and accurately.

図4は、本発明によるコード基盤多国語通訳装置の第2実施の形態であって、クライアント−サーバ構造で実施した例であり、図5は、本発明による第2実施の形態の動作手順を示したフローチャートである。このようなクライアント−サーバ構造の通訳装置はウェブサーバで実施されインターネットを介して複数のクライアントに本発明による通訳サービスを提供することができる。   FIG. 4 shows a second embodiment of the code-based multilingual interpreting apparatus according to the present invention, which is an example implemented in a client-server structure. FIG. 5 shows the operation procedure of the second embodiment according to the present invention. It is the shown flowchart. Such a client-server interpreting apparatus is implemented by a web server and can provide an interpreting service according to the present invention to a plurality of clients via the Internet.

図4に示すように、本発明による多国語通訳サービスサイト(210)は、多国語通訳サービスのためのソフトウェアを搭載している多国語通訳サーバ(212)と、多国語標準データベース(16)が搭載されたデータベースサーバ(214)とを含む。多国語通訳サーバ(212)はウェブアプリケーションサーバであり、インターネット(202)を介して有線端末機(PC)(220)が連結可能であるとともに、ゲートウェイ(G/W)(204)を介して移動通信網(206)を経て携帯端末機(230)と連結可能である。有線端末機(220)はマイク入力とスピーカ出力機能を有しウェブブラウザが搭載されたPCやノートパソコンであり、携帯端末機(230)は無線ランに接続可能なノートパソコンやウェブブック、又は移動通信網を介して連結されるスマートフォン、携帯電話などである。   As shown in FIG. 4, the multilingual interpreting service site (210) according to the present invention includes a multilingual interpreting server (212) equipped with software for a multilingual interpreting service, and a multilingual standard database (16). And an installed database server (214). The multilingual interpretation server (212) is a web application server that can be connected to a wired terminal (PC) (220) via the Internet (202) and moved via a gateway (G / W) (204). The mobile terminal (230) can be connected via the communication network (206). The wired terminal (220) is a PC or notebook computer equipped with a microphone input and speaker output function and equipped with a web browser, and the portable terminal (230) is a notebook computer or web book that can be connected to a wireless LAN or mobile A smartphone, a mobile phone, and the like connected via a communication network.

図5に示すように、有線端末機(220)や携帯端末機(230)を介して多国語通訳サービスサイト(210)に接続する(S201)。   As shown in FIG. 5, the multilingual interpretation service site (210) is connected through the wired terminal (220) and the portable terminal (230) (S201).

多国語通訳サービスサイト(210)は端末機(220)、(230)が接続すると多国語通訳サービスのためのウェブページを提供した後、自国語と他国語を設定させる(S202)。使用者が端末機(220)、(230)を介して自国語と他国語を選択すると、多国語通訳サーバ(212)は選択された自国語を他国語に通訳するための音声認識器、通訳検索エンジン、多国語標準データベース、語順変換器及びTTSなどを含む通訳ソフトウェアファイルをダウンロードさせる(S203)。   The multilingual interpreting service site (210), when the terminals (220) and (230) are connected, provides a web page for the multilingual interpreting service, and then sets the native language and other languages (S202). When the user selects the native language and other languages through the terminals (220) and (230), the multilingual interpreter server (212) interprets the selected native language into the other languages. An interpreter software file including a search engine, a multilingual standard database, a word order converter, and a TTS is downloaded (S203).

このように自国語と他国語を予め設定する場合、多国語通訳サーバ(212)は使用者が必要とするソフトウェアモジュールとデータベースのみを選択して伝送することができるので伝送容量を低減することができる。そして、選択された自国語と他国語のみが搭載された多国語標準データベースもすべてのファイルを伝送することなく、使用頻度に合わせて頻繁に使用する内容のデータを次の表3のようなGY_XMLファイル形式で先に伝送し、使用頻度の低いデータはクライアントが要求する時に追加的に伝送することができる。   In this way, when the native language and the foreign language are set in advance, the multilingual interpreting server (212) can select and transmit only the software module and database required by the user, thereby reducing the transmission capacity. it can. Also, the multilingual standard database loaded with only the selected native language and other languages also transmits the data frequently used according to the usage frequency without transmitting all files, as shown in Table 3 below. Data that is transmitted first in a file format and less frequently used data can be additionally transmitted when the client requests it.

Figure 2011053922
Figure 2011053922

次に、端末機(220)、(230)はダウンロードしたソフトウェアを実行した後、端末機(220)、(230)に設置されたマイクを介して自国語音声を受信することで自国語を音声認識する(S204)、(S205)。   Next, after the terminal (220), (230) executes the downloaded software, the native language is received by receiving the native language voice via the microphone installed in the terminal (220), (230). Recognize (S204) and (S205).

そして、ダウンロードした多国語標準データベースから認識された自国語に対応する手話コードを検索し、検索した結果該当する手話コードがない場合、多国語通訳サーバ(212)に多国語標準データベースの他の一部を要求してダウンロードする(S206〜S208)。次に、新しくダウンロードした多国語標準データベースから認識された自国語に対応する手話コードを検索する(S206)。   Then, a sign language code corresponding to the recognized native language is searched from the downloaded multilingual standard database, and if there is no corresponding sign language code as a result of the search, another multilingual standard database is stored in the multilingual interpretation server (212). Request and download a copy (S206 to S208). Next, a sign language code corresponding to the recognized native language is searched from the newly downloaded multilingual standard database (S206).

そして、検索された手話コードにマッピングされた他国語を検索し、一つの文章が終了すると、自国語順で配列された他国語の語順を他国語の語順に変換して他国語テキスト文章を形成する(S210〜S212)。次に、他国語テキスト文章をLCD画面上に表示するとともに、TTSに他国語テキスト文章を音声信号に変換してスピーカを介して出力する(S213)、(S214)。   Then, the foreign language mapped to the searched sign language code is searched, and when one sentence is completed, the language order of the foreign language arranged in the native language order is converted into the language order of the foreign language to form the foreign language text sentence. (S210 to S212). Next, the other-language text sentence is displayed on the LCD screen, and the other-language text sentence is converted into an audio signal in the TTS and output through the speaker (S213) (S214).

このように本発明による多国語通訳サービスは、インターネットを介してクライアント−サーバ構造でサービスすることができる。また、本発明は発音機能付語学辞典に応用することができ、携帯電話、スマートフォン、ポータブルマルチメディアプレーヤー、ナビゲーションなどのようなモバイル機器で実施されることができる。   As described above, the multilingual interpretation service according to the present invention can be serviced in a client-server structure via the Internet. In addition, the present invention can be applied to a language dictionary with pronunciation functions, and can be implemented in mobile devices such as mobile phones, smartphones, portable multimedia players, and navigation.

以上、本発明を図面に図示された実施の形態を参照しながら説明したが、本技術分野の通常の知識を有する者であれば、これより様々な変形及び均等な他の実施の形態が可能であることを理解できるはずである。   Although the present invention has been described above with reference to the embodiments illustrated in the drawings, various modifications and other equivalent embodiments can be made by those skilled in the art. You should be able to understand that.

14…手話コード、16…多国語標準データベース、102…マイク、104…アナログデジタル変換器、106…デジタルアナログ変換器、108…増幅器、110…スピーカ、112…キー入力部、120…MCU、121…音声認識器、122…通訳検索エンジン、123…語順変換器、124…TTS、130…LCD。   14 ... sign language code, 16 ... multilingual standard database, 102 ... microphone, 104 ... analog-to-digital converter, 106 ... digital-to-analog converter, 108 ... amplifier, 110 ... speaker, 112 ... key input unit, 120 ... MCU, 121 ... Speech recognizer, 122 ... interpreting search engine, 123 ... word order converter, 124 ... TTS, 130 ... LCD.

Claims (7)

コードを基準に自国語単語と慣用文が他国語単語と慣用文にマッピングされている多国語標準データベースと、
マイクを介して入力された自国語を音声認識する自国語音声認識器と、
前記自国語音声認識器で認識された自国語を受信して対応するコードを検索し、検索されたコードに対応する他国語を探して出力する通訳検索エンジンと、
前記通訳検索エンジンから受信した他国語が慣用文であればそのまま出力し、複数の単語であれば自国語の語順を他国語の語順に変換して変換された他国語文章を出力する語順変換器と、
前記語順変換器の他国語テキストを音声信号に変換するTTS(Text to Speech)と、
前記TTSの音声信号を増幅してスピーカに出力する音声出力手段と、
前記語順変換器のテキスト出力を文字で表示するディスプレイ手段と、を具備したことを特徴とするコード基盤多国語通訳装置。
A multilingual standard database in which native language words and idiomatic sentences are mapped to other language words and idiomatic sentences based on codes,
A native language speech recognizer that recognizes the native language input via the microphone,
An interpreter search engine that receives the native language recognized by the native language speech recognizer, searches for a corresponding code, and searches for and outputs another language corresponding to the retrieved code;
A word-order converter that outputs a translated foreign language sentence by converting the native language word order to the foreign language word order if the foreign language received from the interpreter search engine is an idiomatic sentence, or if it is a plurality of words When,
TTS (Text to Speech) for converting the other language text of the word order converter into an audio signal;
Audio output means for amplifying the audio signal of the TTS and outputting it to a speaker;
A code-based multilingual interpreting apparatus comprising: display means for displaying text output of the word order converter in characters.
前記多国語通訳装置は、
使用者の操作を受信して自国語と他国語とを設定し、前記音声認識器に設定された自国語を音声認識させ、前記通訳検索エンジンに自国語と他国語を知らせ、前記語順変換器に設定された自国語の語順を設定された他国語の語順に変換させ、前記TTSが選択された他国語テキストを他国語音声に変換するように制御する制御部をさらに具備したことを特徴とする請求項1に記載のコード基盤多国語通訳装置。
The multilingual interpreter is
The user's operation is received, the native language and the foreign language are set, the native language set in the speech recognizer is recognized by speech, the native language and the foreign language are informed to the interpreting search engine, and the word order converter A control unit that converts the language order of the native language set to the language order of the set other language and controls the TTS to convert the selected foreign language text into a foreign language speech. The code-based multilingual interpreter according to claim 1.
前記多国語通訳装置は、
前記通訳検索エンジンがコードにマッピングされたNヶ国の言語データをそれぞれN個の語順変換器に伝達し、N個の語順変換器はN個のTTSにそれぞれ伝達した後、N個の音声出力手段に出力して自国語をNヶ国語に同時通訳できることを特徴とする請求項1に記載のコード基盤多国語通訳装置。
The multilingual interpreter is
The interpreting search engine transmits the N language data mapped to the code to N word order converters, and the N word order converters respectively transmit the data to N TTSs, and then N speech output means. The code-based multilingual interpreting apparatus according to claim 1, wherein the local language can be simultaneously translated into N languages by outputting to
前記多国語通訳装置は、
独立型携帯端末機であるか、サーバ−クライアント構造であることを特徴とするコード請求項1に記載の基盤多国語通訳装置。
The multilingual interpreter is
The base multilingual interpreting apparatus according to claim 1, wherein the base multilingual interpreting apparatus is a stand-alone portable terminal or a server-client structure.
前記コードは、
各国の手話単語と頻繁に使用する簡単な手話慣用文をコード化して共通の意味を表すように定義した手話コードであることを特徴とする請求項1に記載のコード基盤多国語通訳装置。
The code is
2. The code-based multilingual interpreting apparatus according to claim 1, wherein the sign-based multilingual interpreting apparatus is a sign language code defined so as to encode a sign language word of each country and a frequently used simple sign language idiomatic sentence to express a common meaning.
意思伝達のための単語や慣用語でコードを定義し、前記コードを基準に多国語標準データベースを構築するステップと、
自国語と他国語とを設定するステップと、
設定された自国語の音声を受信して自国語を音声認識するステップと、
前記認識された自国語に対応するコードを検索するステップと、
前記検索されたコードにマッピングされる他国語を自国語順で検索するステップと、
前記自国語順で配列された他国語を他国語の語順に変換して他国語テキスト文章を形成するステップと、
前記他国語テキスト文章を他国語音声信号に変換するステップと、を具備したことを特徴とするコード基盤多国語通訳方法。
Defining a code with words and idioms for communication and constructing a multilingual standard database based on the code;
Setting a native language and a foreign language,
Receiving a voice of the set native language and recognizing the native language;
Searching for a code corresponding to the recognized native language;
Searching for other languages mapped in the searched code in native language order;
Converting the foreign language arranged in the native language order into the language of the foreign language to form a foreign language text sentence;
A code-based multilingual interpretation method comprising: converting the foreign language text sentence into a foreign language speech signal.
多国語通訳サーバに接続して自国語と他国語を設定するステップと、
前記多国語通訳サーバから多国語標準データベースの一部と通訳ソフトウェアとをダウンロードして実行するステップと、
自国語音声を受信して自国語を音声認識するステップと、
ダウンロードされた前記多国語標準データベースから前記認識された自国語に対応するコードを検索するステップと、
前記検索の結果対応するコードがない場合、前記多国語通訳サーバに前記多国語標準データベースの他の一部を要請してダウンロードするステップと、
前記新しくダウンロードした多国語標準データベースから前記認識された自国語に対応するコードを検索するステップと、
前記検索されたコードにマッピングされた他国語を自国語順で検索するステップと、
前記自国語の語順で配列された他国語単語の語順を他国語の語順に変換して他国語テキスト文章を形成するステップと、
前記他国語テキスト文章を音声信号に変換するステップと、を具備したことを特徴とするコード基盤多国語通訳方法。
Connecting to a multilingual interpreter server to set the native language and other languages;
Downloading and executing a part of a multilingual standard database and interpreting software from the multilingual interpreting server;
Receiving the native language speech and recognizing the native language,
Retrieving the code corresponding to the recognized native language from the downloaded multilingual standard database;
If there is no corresponding code as a result of the search, requesting and downloading another part of the multilingual standard database to the multilingual interpretation server;
Retrieving a code corresponding to the recognized native language from the newly downloaded multilingual standard database;
Searching other languages mapped in the searched code in their native language order;
Converting the word order of the other language words arranged in the word order of the native language to form the other language text sentence by converting the word order of the other language words;
A code-based multilingual interpretation method comprising: converting the foreign language text sentence into an audio signal.
JP2009202346A 2009-09-02 2009-09-02 Code-based multilingual interpretation device and method Pending JP2011053922A (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2009202346A JP2011053922A (en) 2009-09-02 2009-09-02 Code-based multilingual interpretation device and method
KR1020100084555A KR20110025108A (en) 2009-09-02 2010-08-31 Code base multi language interpreting apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009202346A JP2011053922A (en) 2009-09-02 2009-09-02 Code-based multilingual interpretation device and method

Publications (1)

Publication Number Publication Date
JP2011053922A true JP2011053922A (en) 2011-03-17

Family

ID=43932798

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009202346A Pending JP2011053922A (en) 2009-09-02 2009-09-02 Code-based multilingual interpretation device and method

Country Status (2)

Country Link
JP (1) JP2011053922A (en)
KR (1) KR20110025108A (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05135095A (en) * 1991-11-12 1993-06-01 Toshiba Corp Translation system
JPH0668140A (en) * 1992-08-20 1994-03-11 Hitachi Ltd Electronic translation system
JPH11110389A (en) * 1997-09-30 1999-04-23 Meidensha Corp Portable translation machine

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05135095A (en) * 1991-11-12 1993-06-01 Toshiba Corp Translation system
JPH0668140A (en) * 1992-08-20 1994-03-11 Hitachi Ltd Electronic translation system
JPH11110389A (en) * 1997-09-30 1999-04-23 Meidensha Corp Portable translation machine

Also Published As

Publication number Publication date
KR20110025108A (en) 2011-03-09

Similar Documents

Publication Publication Date Title
AU2017202111B2 (en) Speech recognition and translation terminal, method, and computer readable medium
US8909536B2 (en) Methods and systems for speech-enabling a human-to-machine interface
US8032383B1 (en) Speech controlled services and devices using internet
US9063931B2 (en) Multiple language translation system
US8862478B2 (en) Speech translation system, first terminal apparatus, speech recognition server, translation server, and speech synthesis server
JP2002125050A5 (en)
CN101115245A (en) Mobile terminal with speech recognition and translating function
TW201240430A (en) Voice messaging system and processing method thereof
US20080195375A1 (en) Echo translator
US20070038446A1 (en) System and method for selecting audio contents by using speech recognition
CN112580335A (en) Method and device for disambiguating polyphone
CN105955967A (en) Data processing method and data processing device
CN201054644Y (en) Mobile terminal with voice recognition and translation function
CN101114283A (en) Tour machine
KR20000024318A (en) The TTS(text-to-speech) system and the service method of TTS through internet
JP2011053922A (en) Code-based multilingual interpretation device and method
CN101287228A (en) Phoneticizing error correcting technique and device applying to query by short message service of mobile phone
WO2007004391A1 (en) Conversation support apparatus
CN2932492Y (en) Tourism machine
KR101543024B1 (en) Method and Apparatus for Translating Word based on Pronunciation
JP7179512B2 (en) Information processing method, information processing device, and program
JP2010257085A (en) Retrieval device, retrieval method, and retrieval program
KR20050052943A (en) Key-word based speech translation system for travelers and the method
KR20090013876A (en) Method and apparatus for distributed speech recognition using phonemic symbol
CN111667815B (en) Method, apparatus, chip circuit and medium for text-to-speech conversion

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110623

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110705

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111206