WO2020246175A1 - 翻訳装置 - Google Patents
翻訳装置 Download PDFInfo
- Publication number
- WO2020246175A1 WO2020246175A1 PCT/JP2020/017824 JP2020017824W WO2020246175A1 WO 2020246175 A1 WO2020246175 A1 WO 2020246175A1 JP 2020017824 W JP2020017824 W JP 2020017824W WO 2020246175 A1 WO2020246175 A1 WO 2020246175A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- translation
- sentence
- term
- alternative
- replacement
- Prior art date
Links
- 238000013519 translation Methods 0.000 title claims abstract description 376
- 238000004891 communication Methods 0.000 claims abstract description 50
- 238000006467 substitution reaction Methods 0.000 claims description 10
- 230000014616 translation Effects 0.000 abstract description 348
- 238000000034 method Methods 0.000 description 51
- 230000008569 process Effects 0.000 description 45
- 238000012545 processing Methods 0.000 description 27
- 230000015572 biosynthetic process Effects 0.000 description 12
- 238000003786 synthesis reaction Methods 0.000 description 12
- 230000000877 morphologic effect Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000007792 addition Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/51—Translation evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
- G10L13/08—Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Definitions
- This disclosure relates to a translation device that translates sentences input in one language into another language.
- Patent Document 1 discloses an electronic dictionary device that translates an English text input by a user into a Japanese text.
- this electronic dictionary device translates the translated word corresponding to the registered word in the Japanese text that is the translation result into English. It is displayed by replacing it with. That is, the registered words are displayed in English, and the parts other than the registered words are displayed translated into Japanese. For example, when "cheap" is registered as a registered word, "This is a cheap bag.” Is output as the translation result of "This is a cheap bag.” Further, the electronic dictionary device of Patent Document 1 displays registered words in English and Japanese texts and their translated words underlined in response to pressing the translation / decision key. This enables the user to learn a language about registered words.
- the present disclosure provides a translation device capable of easily obtaining a translated sentence showing a translation result of an input sentence by using machine translation from a first language to a second language.
- the translation device obtains an input sentence in the first language, communicates with an external device that performs machine translation from the first language to the second language, and translates the input sentence. Outputs a translated sentence indicating.
- the translation device includes a storage unit, a control unit, and a communication unit.
- the storage unit is used in place of the first dictionary information including the term to be replaced in the first language and the translation of the second language for the term to be replaced, and the term to be replaced. , Stores a second dictionary information containing at least one alternative term.
- the control unit replaces the term to be replaced included in the input statement with a substitute term, and generates a replacement statement indicating the replacement result.
- the communication unit outputs the replacement sentence to the external device, and acquires the translation result of the replacement sentence in the second language from the external device.
- Alternative terms consist of a specific string.
- the control unit detects the specific character string in the translation result of the replacement sentence acquired from the communication unit, and replaces the detected character string with the translated word associated with the term to be replaced in the first dictionary information. And generate a translation.
- a translation device translates an input sentence by acquiring an input sentence in the first language and communicating with an external device that performs machine translation from the first language to the second language. Output a translated sentence showing the result.
- the translation device includes a storage unit, a control unit, and a communication unit.
- the storage unit includes the first dictionary information including the term to be replaced in the first language and the translation of the second language for the term to be replaced, and the term to be replaced in the first language.
- a second dictionary information containing a plurality of alternative terms used instead and a translation of the second language for each alternative term is stored.
- the control unit replaces the term to be replaced included in the input statement with a substitute term, and generates a replacement statement indicating the replacement result.
- the communication unit outputs the replacement sentence to the external device, and acquires the translation result of the replacement sentence in the second language from the external device.
- the control unit determines whether or not there is a translation of the alternative term in the translation result of the replacement sentence obtained from the communication unit. When the control unit determines that there is no translation of the alternative term, it generates a replacement sentence again using an alternative term different from the alternative term associated with the translation in the second dictionary information and outputs it to the communication unit. Let me. When the control unit determines that there is a translation of the alternative term, the control unit replaces the translation with the translation associated with the term to be replaced in the first dictionary information, and generates a translation sentence.
- the translation device it is possible to easily obtain a translated sentence showing the translation result of the input sentence by using machine translation from the first language to the second language.
- Diagram for explaining the translation engine and vocabulary replacement / restoration processing according to the present disclosure The figure which shows the appearance of the translation apparatus in Embodiment 1 of this disclosure.
- Block diagram showing the configuration of the translation system according to the first embodiment The figure which shows an example of the registered word dictionary in Embodiment 1.
- Flow chart for explaining the operation of the translation device in the translation system A flowchart illustrating the vocabulary replacement / restoration process in the first embodiment.
- a flowchart illustrating the vocabulary replacement / restoration process in the second embodiment The figure which shows an example of the replacement information in Embodiment 2.
- FIG. 1 is a diagram for explaining the translation engine 5 and the vocabulary replacement / restoration process according to the present disclosure.
- the translation engine 5 includes a translation dictionary 5a that manages parallel translations of terms in various languages, a morphological analysis unit 5b that analyzes morphemes in sentences, and the like, and machine translates from various first languages to second languages.
- the vocabulary replacement / restoration process is a translation process in which a vocabulary replacement / restoration technique is applied to a specific vocabulary to generate a translated sentence.
- the vocabulary replacement / restoration process applicable in such a case will be described below with an example in which the first language is Japanese and the second language is English.
- the input sentence to be translated is the sentence J1 "The baggage counter is here" in Japanese
- the term "baggage counter" J11 included in the sentence J1 of the input sentence is an unknown word.
- the unknown term for example, a term that is a technical term used only in a scene related to a specific occupation and is not general is assumed.
- the vocabulary replacement / restoration process is realized by, for example, a replacement unit 2a that performs preprocessing of machine translation by the translation engine 5 and a restoration unit 2b that performs post-processing.
- the replacement unit 2a replaces the unknown word J11 in the sentence J1 of the input sentence with a term used in place of the unknown word, that is, a substitute term.
- the replacement unit 2a outputs the sentence J2 including the term J21 to the translation engine 5 as a replacement sentence of the replacement result, "This is Asagiri no Yu.”
- the translation engine 5 executes machine translation processing for the above sentence J2 and outputs "Spa of Asagiri is here.”
- the sentence E2 includes "Spa of Asagiri" as a translation E21 of the term J21 instead of an unknown word.
- the restoration unit 2b performs a process for restoring an unknown word in the translated sentence presented as the translation result of the input sentence from the result of the machine translation of the replacement sentence such as the sentence E2.
- FIG. 1 illustrates a case where the processing of the restoration unit 2b is successful.
- the restoration unit 2b processes the above sentence E2 and outputs the sentence E1 "Baggage counter is here."
- the translation E21 of the alternative term in the sentence E2 is replaced with "Baggage counter" which is the translation E11 of the term J11 to be replaced by the replacement part 2a because it is an unknown word in the input sentence.
- the restoration unit 2b can replace the translation E21 of the alternative term with an unknown word such as the translation E11 in the sentence E2 of the machine translation result of the replacement sentence, the unknown word is appropriately restored. You can get the translated text.
- the translated word E11 after the restoration of the unknown word can be set in advance on the restoration unit 2b and the replacement unit 2a side in association with the term J11 to be replaced independently of the processing of the translation engine 5.
- the translation E21 of the alternative term may change according to the internal processing of the translation engine 5, and may be different from the translation assumed in advance on the restoration unit 2b side. Further, it is assumed that the machine translation result may be defective because the morphological analysis unit 5b cannot properly recognize the morpheme of the alternative term during the processing in the translation engine 5. From these various viewpoints, in the translation process by the conventional vocabulary replacement / restoration technique, it is difficult to avoid the situation where the restoration of the unknown word fails, and the translated sentence can be accurately obtained so as to show the translation result of the input sentence. The problem that is difficult has been clarified by the diligent research of the inventor of the present application.
- FIG. 2 is a diagram showing the appearance of the translation apparatus 1 according to the first embodiment.
- the translation device 1 shown in FIG. 2 is, for example, a tablet-type translation device, which translates conversations between two users in different languages.
- the translation device 1 translates a face-to-face conversation between a Japanese-speaking host (for example, a guide) and an English-speaking guest (for example, a traveler). To do.
- the translation device 1 includes a microphone 10, a speaker 12, a display 14, and a touch panel 16.
- the microphone 10 and the speaker 12 are arranged near the opening on the side surface of the translation device 1, for example.
- the display 14 and the touch panel 16 are arranged on the main surface of the translation device 1.
- An utterance icon 14h and a display area 15h are arranged in an area on one side (for example, the host side) of the display 14 in the longitudinal direction.
- An utterance icon 14 g and a display area 15 g are displayed on the other side (for example, the guest side) of the display 14 in the longitudinal direction.
- a user touch operation is performed on each of the utterance icons 14h and 14g.
- the utterance icon 14h is an operation for the host himself to specify the start time and end time of the host's utterance when the host speaks, that is, when the Japanese utterance is input to the translation device 1 as the translation source. It is an icon.
- the utterance icon 14g is an operation icon for the guest to specify the start time and end time of the guest's utterance when the guest makes a utterance, that is, when the guest inputs an English utterance as a translation source.
- the display areas 15h and 15g are areas for displaying the voice recognition result, the translation result, and the like as character strings.
- FIG. 3 is a block diagram showing the configuration of the translation system 100 according to the first embodiment.
- the translation system 100 includes a translation device 1, a voice recognition server 41, a translation server 42, and a voice synthesis server 43 shown in FIG.
- the translation device 1 performs data communication with each of the voice recognition server 41, the translation server 42, and the voice synthesis server 43 via a communication network 4 such as the Internet.
- the voice recognition server 41 receives voice data from the translation device 1 via the communication network 4, recognizes the received voice data by voice, and voice recognition data composed of a character string of the recognition result, that is, a text of an utterance sentence. It is a server that generates data.
- the voice recognition server 41 is an example of an external voice recognition device of the translation device 1 in the present embodiment.
- the translation server 42 is a server on which the translation engine 5 is installed.
- the translation server 42 receives voice recognition data from the translation device 1 via the communication network 4, executes machine translation on the received voice recognition data by the translation engine 5, and uses text data indicating the result of machine translation. Generate some translation data.
- the translation server 42 is an example of an external device having a function of translating from a first language to a second language.
- the voice synthesis server 43 is a server that receives translation data from the translation device 1 via the communication network 4 and synthesizes the received translation data by voice to generate a voice signal.
- the translation device 1 includes a microphone 10, a speaker 12, a display 14, a touch panel 16, a communication unit 18, a storage unit 20, and a control unit 22.
- the microphone 10 is a device that converts physical voice into voice data. Specifically, the microphone 10 converts the voice input from the outside into the voice signal of the analog electric signal, and further converts the voice signal into digital voice data by the AD converter.
- the microphone 10 is an example of a voice input unit for inputting voice such as an utterance.
- the communication unit 18 has a voice recognition server 41 and a translation server 42 via the communication network 4 according to a communication method such as Bluetooth (registered trademark), Wi-Fi (registered trademark), 3G, LTE (registered trademark), and IEEE802.11. , And a communication module that performs data communication with the voice synthesis server 43.
- a communication method such as Bluetooth (registered trademark), Wi-Fi (registered trademark), 3G, LTE (registered trademark), and IEEE802.11.
- a communication module that performs data communication with the voice synthesis server 43.
- the storage unit 20 is a recording medium composed of a flash memory, a ferroelectric memory, an HDD, an SSD, a RAM, a combination thereof, and the like.
- the storage unit 20 stores the voice data, the voice recognition data, and the translation data of the microphone 10. Further, the storage unit 20 stores various programs for the control unit 22.
- the storage unit 20 stores the registered word dictionary 31, the alternative word dictionary 32, and the replacement information 33.
- the registered word dictionary 31 is an example of dictionary information for registering a specific term to be replaced in the vocabulary replacement / restoration process.
- the alternative word dictionary 32 is an example of dictionary information including alternative terms used in place of the replacement target at the time of translation.
- the replacement information 33 is information indicating the correspondence between the term before replacement and the term after replacement. The data structures of the registered word dictionary 31, the alternative word dictionary 32, and the replacement information 33 will be described later.
- the control unit 22 is composed of a CPU, an MPU, and the like, and controls the overall operation of the translation device 1 by executing various programs stored in the storage unit 20.
- the control unit 22 includes, for example, a replacement unit 2a and a restoration unit 2b as functional configurations.
- the function of the control unit 22 is realized by the cooperation of hardware and software, but it may be realized only by a hardware circuit specially designed to realize a predetermined function. That is, the control unit 22 can be composed of not only a CPU and an MPU but also a DSP, an FPGA, an ASIC and the like.
- the speaker 12 is a device that converts an electric signal into voice.
- the speaker 12 outputs a voice based on a voice signal (electric signal) from the control unit 22.
- the speaker 12 is an example of an output unit that outputs voice such as a translation result to the outside.
- the display 14 is a device for displaying an image, and is composed of a liquid crystal display device or an organic EL display device.
- the display 14 displays the voice recognition data from the control unit 22, the translation data, and the image indicated by the reverse translation data in the display areas 15h and 15g.
- the display 14 is an example of an output unit that displays and outputs voice recognition data, translation data, and the like to the host and the guest. Further, the display 14 displays the above-mentioned utterance icons 14h and 14g.
- the touch panel 16 is an operation unit operated by the user and receives instructions from the user.
- the touch panel 16 is arranged so as to be superimposed on the display 14.
- FIG. 4 shows an example of the registered word dictionary 31.
- the registered word dictionary 31 specific terms to be replaced in the vocabulary replacement / restoration process are registered.
- the term registered in the registered word dictionary 31 of the translation device 1 is an unknown word for the translation engine 5.
- Such terms to be replaced include, for example, various proper nouns.
- the terms included in the registered word dictionary 31 include words and phrases.
- the registered word dictionary 31 includes terms described in parallel translations in a plurality of languages.
- FIG. 4 shows an example in which the plurality of languages are Japanese and English, but the present invention is not particularly limited to this, and various natural languages can be adopted.
- the terms described in parallel translations in a plurality of languages in the registered word dictionary 31 are referred to as "registered terms", and the terms described in the translation destination language are referred to as " It is called "translation of registered terms”.
- the registered word dictionary 31 is provided for each class indicating the type of registered term, for example.
- a class classifies a term and is the category of the object indicated by the term. Classes include, for example, place names, and food.
- the registered word dictionary 31 may include additional information in association with the registered term. The additional information is, for example, information indicating a photograph of the place indicated by the registered term or an access means when the class is "place name".
- the term registered in the registered word dictionary 31 is not necessarily an unknown word, and may be a term that is assumed to be difficult to translate as desired by machine translation by, for example, the translation engine 5.
- technical terms used only in a specific field and terms used only in some places or regions are registered in the registered word dictionary 31 without considering whether or not they are registered in the translation engine 5. May be good.
- the translated word of the registered term according to the parallel translation in the registered word dictionary 31 can be translated into the translated sentence through the vocabulary replacement / restoration process.
- FIG. 5 shows an example of the alternative word dictionary 32 in this embodiment.
- the alternative word dictionary 32 includes alternative terms that are used in place of the registered terms during translation.
- the alternative word dictionary 32 of the present embodiment manages alternative character strings, which are alternative terms composed of special character strings, for example, by class.
- the alternative character string is the character portion w10 arranged between the first symbol m0, the last symbol m1, and the first and last symbols m0 and m1, for example, as in the character string W1 shown in FIG. And include.
- the leading and trailing symbols m0 and m1 in the alternative character string are set to predetermined symbols such as "+". For example, according to the symbols m0 and m1 of "+", it is possible to easily distinguish the inside and outside of the substitute character string in the morphological analysis of the sentence including the substitute character string.
- the symbols m0 and m1 are set to the same symbols, for example, but they do not have to be the same symbols.
- the symbols m0 and m1 may be set to various parenthesis symbols, for example.
- the character part w10 in the alternative character string is composed of a plurality of characters of the same type arranged side by side, as shown in, for example, the character string W1.
- the plurality of characters in the character portion w10 are set so as not to make sense, that is, the sequence of the characters does not become a meaningful word or the like. As a result, it is possible to make it easy to prevent the substitute character string from changing before and after the machine translation process in the translation engine 5.
- the alternative character string can be set to a specific character string that is not expected to change before and after the machine translation process in the translation engine 5.
- the character type of the character part w10 is set to, for example, a character type that occurs relatively infrequently in the translation source language.
- a character type that occurs relatively infrequently in the translation source language For example, when the translation source is Japanese, by setting the character portion w10 to the alphabet, the frequency of occurrence is reduced as compared with Chinese characters and the like.
- the alternative word dictionary 32 may manage different alternative character strings for each of various languages. For example, a language as a translation source may be associated with an alternative character string of a character type that occurs less frequently in the same language. ..
- FIG. 6 shows an example of replacement information 33.
- the replacement information 33 is generated when the vocabulary replacement / restoration process described later is executed, and is temporarily stored in the storage unit 20 during the process, for example.
- the replacement information 33 includes the term before the replacement and the term after the replacement in association with each other.
- the term before replacement is a registered term to be replaced in the vocabulary replacement / restoration process, and the term after replacement is a substitute term for the registered term to be replaced.
- the translation engine 5 is mounted on the translation server 42.
- the translation device 1 transmits the text data of the utterance sentence to the translation server 42, and acquires the text data of the translation sentence indicating the translation result from the translation server 42.
- FIG. 7 is a flowchart for explaining the translation device 1 in the translation system 100. Each process shown in the flowchart of FIG. 7 is executed by the control unit 22 of the translation device 1.
- control unit 22 of the translation device 1 acquires voice data according to the voice of the utterance by the speaker via the microphone 10 (S1).
- the control unit 22 acquires the utterance sentence by the voice recognition process (S2). Specifically, the control unit 22 first transmits the acquired voice data to the voice recognition server 41 via the communication network 4.
- the voice recognition server 41 voice-recognizes the received voice data and generates text data of the utterance sentence.
- the translation device 1 receives the text data of the utterance sentence from the voice recognition server 41 via the communication network 4.
- control unit 22 searches for the registered term included in the registered word dictionary 31 in the acquired utterance sentence (S3). Then, the control unit 22 determines whether or not there is a registered term in the utterance sentence (S4).
- the control unit 22 performs a normal translation process other than the vocabulary replacement / restoration process (S5 to S6).
- the normal translation process is a process of acquiring a translated sentence for an uttered sentence without using the replacement unit 2a and the restoration unit 2b.
- the control unit 22 of the translation device 1 first transmits the text data of the utterance sentence to the translation server 42 via the communication network 4 (S5).
- the translation server 42 executes machine translation on the uttered sentence in the translation engine 5 and generates text data as a result of the machine translation.
- the translation server 42 transmits the generated text data to the translation device 1 via the communication network 4.
- the translation device 1 receives the text data of the translation result from the translation server 42 via the communication network 4 as a translated sentence (S6).
- the control unit 22 performs the vocabulary replacement / restoration process according to the present embodiment (S7).
- the accuracy of the translated sentence can be improved by using the substitute character string. The details of the vocabulary replacement / restoration process will be described later.
- the control unit 22 controls the display 14 so as to display the translation results of steps S6 and S7, for example (S8).
- the display 14 displays the utterance sentence in the display area 15h on the host side and the translated sentence in the display area 15g on the guest side, as illustrated in FIG.
- the utterance sentence and the translated sentence may be displayed at the same time or in order.
- the control unit 22 may display the utterance sentence first before receiving the text of the translation sentence from the translation server 42.
- the control unit 22 of the translation device 1 ends the operation shown in the flowchart of FIG. 7, for example, by displaying the translation result (S8).
- the translation device 1 accepts the input of the utterance sentence which is an example of the input sentence by the utterance, and the translation result for the utterance sentence using the machine translation by the translation engine 5 Translated text can be presented.
- the translation device 1 may output the translated text by voice in addition to or instead of displaying the translated text (S8).
- the control unit 22 of the translation device 1 transmits the text data of the translated text obtained in steps S6 and S7 to the speech synthesis server 43 via the communication network 4.
- the voice synthesis server 43 performs voice synthesis based on the text data of the translated text received from the translation device 1, generates a voice signal, and transmits the voice signal to the translation device 1 via the communication network 4.
- the control unit 22 outputs a voice indicating the translation result from the speaker 12 based on the voice signal received from the voice synthesis server 43.
- FIG. 8 is a flowchart illustrating the vocabulary replacement / restoration process in the present embodiment.
- FIG. 9 is a diagram for explaining the vocabulary replacement / restoration process in the present embodiment.
- the translation system 100 translates a Japanese utterance uttered by the host into English and transmits the translation result to the guest
- the utterance sentence of an example of the input sentence is the sentence J10 that includes the Japanese term J11 as an unknown word, "There is a vending machine in front of the baggage counter.”
- the control unit 22 of the translation device 1 proceeds to YES in step S4 of FIG. 7 based on the term J11 in the utterance sentence, and executes the process of FIG. 8 in step S7.
- control unit 22 of the translation device 1 functions as the replacement unit 2a, and replaces the registered term in the utterance sentence with a specific character string as a substitute term (S21).
- the control unit 22 as the replacement unit 2a performs the process of step S21 with reference to the registered word dictionary 31 and the alternative word dictionary 32 in the storage unit 20.
- the term J11 which is an unknown word in the example of FIG. 9, is registered in advance in the registered word dictionary 31 so as to belong to the class “place name”.
- the control unit 22 substitutes the character string W1 "+ LDMVA +", which is one of the alternative character strings belonging to the same class, from the alternative word dictionary 32 shown in FIG. 5, for example, based on the class "place name”. Select as a term.
- the control unit 22 replaces the term J11 in the sentence J10 of the input sentence with the selected alternative term, and generates the sentence J20 "There is a vending machine in front of + LDMVA +" as a replacement sentence as shown in FIG. To do.
- the control unit 22 records the terms before and after the replacement as replacement information 33 in association with each other (S22).
- the control unit 22 transmits the replacement sentence of the replacement result for the utterance sentence to the translation server 42 via the communication unit 18 (S23).
- a replacement sentence text data indicating the sentence J20 including the character string W1 of the alternative term is transmitted.
- the translation server 42 executes machine translation processing by the translation engine 5 on the received text data of the replacement sentence, and generates text data indicating the result of the machine translation.
- the sentence E20 "There is a vending machine in front of + LDMVA +.” Is generated as a result of the machine translation of the replacement sentence sentence J20.
- the translation server 42 transmits text data indicating the translation result sentence of the replacement sentence to the translation device 1 via the communication network 4.
- the control unit 22 of the translation device 1 receives the translation result of the replacement sentence from the translation server 42 via the communication unit 18 (S24).
- control unit 22 functions as a restoration unit 2b, detects a character string of an alternative term in the received translation result (S25), and generates a translation sentence in which the translation result of the utterance sentence is restored (S26). ..
- the sentence E1 such as "Baggage counter is here.” Is restored from the above sentence E20 as a translated sentence for the sentence J10.
- the control unit 22 as the restoration unit 2b first identifies the character string W1 of the substitute term after the replacement from the replacement information 33 shown in FIG. 6, and searches for the character string W1 in the sentence E20 of the translation result of the replacement sentence. (S25). Further, the control unit 22 identifies from the replacement information 33 that the registered term before replacement is the term J11. The control unit 22 reads "Baggage counter" corresponding to the term J11 from the registered word dictionary 31 as the translated word E11, and replaces "+ LDMVA +" in the sentence E20 with the translated word E11. As a result, a translated sentence such as the above sentence E20 is generated (S26).
- step S7 in FIG. 7 When the control unit 22 generates the translated text (S26), the process of step S7 in FIG. 7 is completed, and the process proceeds to step S8.
- a special character string W1 such as "+ LDMVA +" is used as an alternative term for an unknown word (S21).
- Such a special character string W1 is not translated by the translation engine 5, that is, it is not changed before and after the machine translation process in the translation server 42. Therefore, the control unit 22 can easily succeed in the processing (S25 to S26) as the restoration unit 2b that restores the unknown word in the translation destination language by replacing the character string W1 which is the same as the alternative term from the result of the machine translation. , Translated text can be obtained with high accuracy.
- the general morphological analysis unit 5b has the same type of kanji and the like in the sentence J22 after replacement with the sentence J10 of the utterance sentence.
- the parts where the characters of are lined up are collectively recognized as a morpheme. Therefore, depending on the content before and after the term J21 in the sentence J22, morphological analysis is performed so as to mistakenly separate the inside and outside of the term J21, and a problem that the translated word of the term J21 does not appear in the machine translation result of the sentence J22 is avoided. It's hard to do.
- the possibility that the alternative term and the outside are separated in the morphological analysis by the symbols "+" at the beginning and the end of the character string W1. Can be enhanced.
- the possibility that the inside of the alternative term is collectively recognized can be increased. This makes it easier to avoid erroneous recognition of morphological analysis.
- the morphological analysis unit 5b of the translation server 42 does not have to register the character string W1 in a dictionary or the like for morphological analysis.
- the character string W1 as an alternative term of the present embodiment is set to a language of the translation source such as Japanese that does not make any particular meaning, so that the character string is set when the translation server 42 processes the machine translation. It is possible to easily avoid the situation where the translation is changed to a character string different from the column W1. This makes it easier for the translation device 1 to detect the processing target of the restoration unit 2b, and makes it easier to successfully restore the unknown word in the translated sentence.
- the class of the character string W1 of the alternative term may be registered in the translation dictionary 5a.
- the translation dictionary 5a can be performed separately from registration in the morphological analysis unit 5b, and the burden of registration in the translation server 42 can be reduced.
- the translation device 1 acquires an input sentence (for example, an utterance sentence) in the first language (for example, Japanese), communicates with the translation server 43, and communicates with the translation server 43, such as the sentence J10. Outputs a translated sentence such as sentence E10 showing the translation result of the input sentence of.
- the translation server 43 is an example of an external device that performs machine translation from a first language to a second language (eg, English).
- the translation device 1 includes a storage unit 20, a control unit 22, and a communication unit 18.
- the storage unit 20 stores a registered word dictionary 31 which is an example of the first dictionary information and an alternative word dictionary 32 which is an example of the second dictionary information.
- the registered word dictionary 31 includes a registered term which is a replacement target term of the first language and a translation of the second language for the registered term in association with each other.
- the alternative word dictionary 32 includes at least one alternative term used in place of the term to be replaced.
- the control unit 22 replaces the term to be replaced included in the input sentence with the substitute term, and generates a replacement sentence indicating the replacement result like the sentence J20 (S21).
- the communication unit 18 outputs the replacement sentence to the translation server 42 (S23), and acquires the translation result of the replacement sentence in the second language as in the sentence E20 from the translation server 42 (S24).
- the alternative term is composed of a specific character string, for example, the character string W1.
- the control unit 22 detects the specific character string in the translation result of the replacement sentence acquired from the communication unit 18 (S25), and uses the detected character string in the registered word dictionary 31 to replace the registered term (for example, the term J11). ) Is replaced with a translated word (for example, translated word E11) to generate a translated sentence (S26).
- the character string is detected in the translation result of the replacement sentence (S25), and the translated sentence is translated.
- the alternative character strings used as alternative terms are arranged between the predetermined symbols m0 and m1 arranged at the beginning and the end of the character string, respectively, and the first symbol m0 and the last symbol m1. Includes the character portion w10 of a plurality of characters of the same type.
- the term to be replaced includes, for example, a proper noun.
- the term to be replaced can be set to, for example, a term that is assumed to be an unknown term that has not been registered in the translation server 4. As a result, even if the input sentence contains an unknown word, the translated sentence can be obtained with high accuracy.
- the alternative word dictionary 32 may classify alternative terms for each class indicating the type of term.
- the control unit 22 generates a replacement statement by using the alternative terms classified in the same class as the terms to be replaced included in the input statement (S21). You can improve the accuracy of the translated text by using alternative terms according to the class.
- the translation device 1 may further include a microphone 10 as an example of a voice input unit for inputting an utterance.
- the communication unit 18 may output the voice data of the utterance to the voice recognition server 41 which is an example of the external voice recognition device, and acquire the input sentence of the recognition result for the voice data from the voice recognition server 41 (S2). According to such a translation device 1, it is easy to obtain an appropriate translated sentence for the user's utterance.
- the translation device 1 and the translation system 100 according to the present embodiment will be described by omitting the description of the same configuration and operation as the translation device 1 and the translation system 100 according to the first embodiment as appropriate.
- the machine translation result of the translation engine 5 is acquired in the vocabulary replacement / restoration process, it is determined whether or not the translation of the alternative term is included, and depending on the determination result, the alternative term is changed and the process is repeated.
- the device 1 will be described.
- FIG. 10 shows an example of the alternative word dictionary 32A in the second embodiment.
- the translation device 1 of the present embodiment uses a term including a word and a phrase, which is expected to be translated accurately by, for example, the translation engine 5.
- the terms used as the alternative terms are described in parallel translations of a plurality of languages (for example, Japanese and English) which are the same as the registered word dictionary 31.
- the term described in the translation source language among the plurality of languages in the alternative word dictionary 32A is used as the "alternative term" in the replacement sentence, and is described in the translation destination language.
- the term is used in the translated text as a "translation of the alternative term".
- the alternative word dictionary 32A includes, for example, a plurality of alternative terms and their translations in each class similar to the first embodiment. Further, the alternative word dictionary 32A of the present embodiment manages the priority order between alternative terms, for example, as shown in FIG.
- the priority order indicates the order of priority when used as an alternative term in the vocabulary replacement / restoration process of the present embodiment. In this example, priorities are set among alternative terms of the same class. The term having the priority "1" is the alternative term with the highest priority.
- FIG. 11 is a flowchart illustrating the vocabulary replacement / restoration process in the second embodiment.
- the translation device 1 of the present embodiment executes the process illustrated in this flowchart in step S7 of FIG. 7 instead of the flowchart of FIG.
- control unit 22 of the translation device 1 selects one alternative term in order from the alternative term having the highest priority in the alternative word dictionary 32A of the present embodiment (S21a).
- the control unit 22 performs the processing as the replacement unit 2a and the restoration unit 2b using the selected alternative terms in the same manner as in the first embodiment (S21b to S25a).
- FIG. 12 shows an example of the replacement information 33A in the present embodiment.
- FIG. 12 illustrates the replacement information 33A in step S22 when the term J23 having the highest priority in the alternative word dictionary 32A of the same class as the term J11 before replacement is selected in step S21a.
- the control unit 22 replaces the term J11 in the utterance sentence with the selected term J23 to generate a replacement sentence (S21b).
- Alternative terms such as the term J23 are translated from, for example, Japanese to English during machine translation processing on the translation server 42.
- control unit 22 When the control unit 22 receives the translation result of the replacement sentence from the translation server 42 (S24), the control unit 22 refers to the replacement information 33A and the alternative word dictionary 32A, and in the sentence of the translation result of the received replacement sentence, translates the alternative term. Detect (S25a). Specifically, the control unit 22 reads the translated word E23 of the term J23 after the replacement in the replacement information 33A from the alternative word dictionary 32A, and searches for the translated word E23 in the sentence resulting from the machine translation.
- the control unit 22 determines whether or not there is a translation of the alternative term in the translation result sentence of the replacement sentence received from the translation server 42 (S25b).
- control unit 22 determines that there is no translation of the alternative term in the translation result of the substitution sentence (NO in S25b)
- the control unit 22 refers to the alternative word dictionary 32A and determines whether or not there is a subordinate candidate for the alternative term (S25c).
- the sub-candidate of the alternative term is an alternative term having a lower priority than the alternative term in the same class as the alternative term used in the substitution sentence in the alternative word dictionary 32A.
- the control unit 22 selects the alternative term having the highest priority among the sub-candidates for the alternative term (S21a), and repeats the processing after step S21b. Do. As a result, replacement sentences are repeatedly generated using alternative terms in descending order of priority and transmitted to the translation server 42 (S23).
- the translation engine 5 sequentially executes machine translation of the received replacement sentence.
- control unit 22 determines that the translation result of the replacement sentence has a translation of the alternative term (YES in S25b)
- the control unit 22 replaces the translation of the alternative term with the translation of the registered term and generates a translation as in the first embodiment. (S26). After that, the control unit 22 ends step S7 in FIG. 7 and proceeds to step S8.
- the replacement sentence including the alternative term when the replacement sentence including the alternative term is generated, if the translation result of the replacement sentence by the translation engine 5 does not include the translation word assumed for the alternative term (S25b). (NO), the generation of the replacement sentence is performed again using another alternative term (S21a to S24). If any of the results of machine translation for a plurality of substitution sentences by such different alternative terms includes the translation of the assumed alternative term (YES in S25b), a translation sentence in which the unknown word is restored is obtained. Can be done (S26). In addition, it is possible to easily avoid a situation in which a sentence in which a translation similar to the translation E23 of the alternative term is included in place of the unknown word due to failure in restoration of the unknown word is visible to the user. In this way, the accuracy of the translated text can be improved.
- control unit 22 may, for example, in step S26. No processing is performed, and step S7 in FIG. 7 ends.
- the control unit 22 may display, for example, the translation result of the last received replacement sentence on the display 14 as a translation sentence.
- a term that is considered not to cause discomfort to a user such as a host is registered even if the translation result is displayed.
- the control unit 22 may display various error displays.
- the translation device 1 acquires the input sentence in the first language and communicates with the translation server 43 or the like that executes machine translation from the first language to the second language. , Outputs a translated sentence showing the translation result of the input sentence.
- the translation device 1 includes a storage unit 20, a control unit 22, and a communication unit 18.
- the storage unit 20 stores the registered word dictionary 31 which is an example of the first dictionary information and the alternative word dictionary 32A which is an example of the second dictionary information.
- the alternative word dictionary 32A of the present embodiment includes a plurality of alternative terms used in place of the terms to be replaced in the first language, and a translation of the second language for each alternative term in association with each other.
- the control unit 22 determines whether or not there is a translation of the alternative term in the translation result of the replacement sentence obtained from the communication unit 18 (S25b). When the control unit 22 determines that there is no translation of the alternative term (NO in S25b), the control unit 22 generates a substitution sentence again using an alternative term different from the alternative term associated with the translation in the alternative word dictionary 32A. Is output to the communication unit 18 (S25c to S23). When the control unit 22 determines that there is a translation of the alternative term (YES in S25b), the control unit 22 replaces the translation with the translation associated with the term to be replaced in the registered term dictionary 31 to generate a translation. (S26).
- the alternative word dictionary 32A may manage the priority in a plurality of alternative terms.
- the control unit 22 is used in the substitution statement in order from the alternative term having the highest priority among the plurality of alternative terms (S21a). For example, by setting a high priority of alternative terms that are likely to include the translated word in the translation result of the replacement sentence, the restoration of the translated sentence can be succeeded efficiently.
- Embodiments 1 and 2 have been described as examples of the techniques disclosed in this application. However, the technique in the present disclosure is not limited to this, and can be applied to embodiments in which changes, substitutions, additions, omissions, etc. are made as appropriate. It is also possible to combine the components described in each of the above embodiments into a new embodiment. Therefore, other embodiments will be illustrated below.
- FIG. 13 illustrates the alternative word dictionary 32B in this modified example.
- the alternative character string of the first embodiment may be registered.
- the character string W1 is included as an alternative term in the alternative word dictionary 32B.
- the same character string W1 is described in each language such as Japanese and English.
- the control unit 22 uses the character string W1 as an alternative term by referring to the description of the translation source language such as Japanese in step S21b of FIG. 11, for example. Further, in step S25a, the same character string W1 is used as a translation of the alternative term with reference to the description of the translation destination language such as English. In this way, the vocabulary replacement / restoration process can be performed by similarly using the special character string W1 and other alternative terms.
- the plurality of alternative terms in the alternative word dictionary 32B may include alternative terms composed of a specific character string.
- the alternative word dictionary 32B may include the same character string as the character string as a translation of the alternative term composed of a specific character string.
- the same vocabulary replacement / restoration process as in the second embodiment may be performed using the alternative word dictionary 32 of the first embodiment.
- the priority between the alternative character strings can be set in ascending order registered for each class.
- the control unit 22 determines the presence or absence of the alternative character string as in step S25 in FIG. Detect. At this time, if it is detected that there is no substitute character string (NO in S25b), the generation of the replacement sentence is repeated using another substitute character string composed of a different character string (S21a to S25c), and the translated sentence is translated. The accuracy of can be improved.
- the alternative word dictionary 32 may include a plurality of alternative terms composed of character strings different from each other.
- the control unit 22 detects that there is no character string used in the replacement sentence in the translation result of the replacement sentence acquired from the communication unit 18 (NO in S25b)
- the control unit 22 uses an alternative term different from the alternative term of the character string.
- the replacement statement may be generated again and output to the communication unit 18 (S25c to S23).
- the translation device 1 of each of the above embodiments translates a translated sentence, which is a translation result obtained by translating the spoken language (for example, Japanese) into another language (for example, English), into the original language (for example, English). It may further have a reverse translation function for translating into Japanese). In this case, the translation device 1 transmits the translated text in the replaced state to the translation server 4, and acquires the reverse translation text from the translation server 4.
- a translated sentence which is a translation result obtained by translating the spoken language (for example, Japanese) into another language (for example, English), into the original language (for example, English). It may further have a reverse translation function for translating into Japanese).
- the translation device 1 transmits the translated text in the replaced state to the translation server 4, and acquires the reverse translation text from the translation server 4.
- speech recognition is performed by the speech recognition server 41
- translation is performed by the translation server 42
- speech synthesis is performed by the speech synthesis server 5, but the present disclosure is not limited to this.
- At least one process of speech recognition, translation and speech synthesis may be performed in the translation device 1.
- the translation device 1 terminal
- the translation device 1 is equipped with all the same functions as the speech recognition server 41, the translation server 42, and the speech synthesis server 43, so that only the translation device 1 performs all processing related to translation. You may.
- the translation device 1 does not have to have a communication unit 18 that connects to the communication network 4.
- the function of the control unit 22 for exchanging information with the translation engine 5, which is a function of the translation server 4 may constitute a communication unit for the translation engine 5.
- the target languages for translation processing are not limited to Japanese and English, and may be other languages, such as Chinese, German, French, Spanish, Korean, Thai, Vietnamese, and Indonesian. It may be a word or the like.
- the translation device 1 translates the utterance sentence input by the microphone 10 as the input sentence, but the input sentence input other than the utterance may be translated.
- the translation device 1 may translate an input sentence input by a keyboard, a mouse, or the like. That is, when the translation device 1 of the present disclosure translates sentences of various input sentences, the term to be replaced in the sentence is replaced with a substitute term for translation. Then, the translated word of the alternative term included in the translated sentence is restored to the translated word for the replacement target term replaced by the alternative term, and the translated sentence is displayed.
- the present disclosure is applicable to a translation device for translating between various languages in various situations.
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
Abstract
第1の言語における入力文を取得し、機械翻訳を実行する外部装置(42)と通信して、入力文の翻訳結果を示す翻訳文を出力する翻訳装置(1)は、置換対象の用語と訳語とを対応づけて含む第1の辞書情報(31)、及び、代替用語を含む第2の辞書情報(32)を記憶する記憶部(20)と、入力文に含まれる置換対象の用語を代替用語に置換して置換文を生成する制御部(22)と、置換文を外部装置に出力し、外部装置から置換文の翻訳結果を取得する通信部(18)とを備える。代替用語は、特定の文字列で構成される。制御部は、通信部から取得した置換文の翻訳結果において当該特定の文字列を検知して(S25)、検知した文字列を、置換対象の用語の訳語に置換して、翻訳文を生成する(S26)。
Description
本開示は、一の言語で入力した文章を他の言語に翻訳する翻訳装置に関する。
特許文献1は、ユーザにより入力された英語のテキストを日本語のテキストに翻訳する電子辞書装置を開示している。この電子辞書装置は、事前に登録しておいた登録単語が、入力された英語のテキスト中に含まれている場合は、翻訳結果である日本語のテキスト内において登録単語に対応する訳語を英語に置き換えて表示している。すなわち、登録単語については英語の状態で表示し、登録単語以外の部分については日本語に翻訳された状態で表示している。例えば、「cheap」が登録単語として登録されていた場合、「This is a cheap bag.」の翻訳結果として、「これは、cheapかばんです。」を出力している。さらに、特許文献1の電子辞書装置は、訳/決定キーの押下に応じて、英語及び日本語のテキスト中の登録単語及びその訳語を下線付きで表示している。これにより、ユーザが、登録単語についての語学学習をできるようにしている。
本開示は、第1の言語から第2の言語への機械翻訳を用いて入力文の翻訳結果を示す翻訳文を得易くすることができる翻訳装置を提供する。
本開示の一態様に係る翻訳装置は、第1の言語における入力文を取得し、第1の言語から第2の言語への機械翻訳を実行する外部装置と通信して、入力文の翻訳結果を示す翻訳文を出力する。翻訳装置は、記憶部と、制御部と、通信部とを備える。記憶部は、第1の言語の置換対象の用語と、置換対象の用語に対する第2の言語の訳語とを対応づけて含む第1の辞書情報、及び、置換対象の用語の代わりに使用される、少なくとも1つの代替用語を含む第2の辞書情報を記憶する。制御部は、入力文に含まれる置換対象の用語を代替用語に置換して、置換結果を示す置換文を生成する。通信部は、置換文を外部装置に出力し、外部装置から第2の言語における置換文の翻訳結果を取得する。代替用語は、特定の文字列で構成される。制御部は、通信部から取得した置換文の翻訳結果において当該特定の文字列を検知して、検知した文字列を、第1の辞書情報において置換対象の用語に対応づけられた訳語に置換して、翻訳文を生成する。
本開示の別の態様に係る翻訳装置は、第1の言語における入力文を取得し、第1の言語から第2の言語への機械翻訳を実行する外部装置と通信して、入力文の翻訳結果を示す翻訳文を出力する。翻訳装置は、記憶部と、制御部と、通信部とを備える。記憶部は、第1の言語の置換対象の用語と、置換対象の用語に対する第2の言語の訳語とを対応づけて含む第1の辞書情報、及び、第1の言語において置換対象の用語の代わりに使用される複数の代替用語と、各代替用語に対する第2の言語の訳語とを対応づけて含む第2の辞書情報を記憶する。制御部は、入力文に含まれる置換対象の用語を代替用語に置換して、置換結果を示す置換文を生成する。通信部は、置換文を外部装置に出力し、外部装置から第2の言語における置換文の翻訳結果を取得する。制御部は、通信部から取得した置換文の翻訳結果において、代替用語の訳語があるか否かを判断する。制御部は、代替用語の訳語がないと判断した場合、第2の辞書情報において当該訳語に対応付けられた代替用語とは異なる代替用語を用いて再度、置換文を生成して通信部に出力させる。制御部は、代替用語の訳語があると判断した場合、当該訳語を、第1の辞書情報において置換対象の用語に対応づけられた訳語に置換して、翻訳文を生成する。
これらの概括的かつ特定の態様は、システム、方法、及びコンピュータプログラム、並びに、それらの組み合わせにより、実現されてもよい。
本開示に係る翻訳装置によると、第1の言語から第2の言語への機械翻訳を用いて入力文の翻訳結果を示す翻訳文を得易くすることができる。
以下、適宜図面を参照しながら、本開示の実施形態を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
なお、発明者は、当業者が本開示を十分に理解するために添付図面および以下の説明を提供するのであって、これらによって請求の範囲に記載の主題を限定することを意図するものではない。
(本開示に到った知見)
本開示の実施形態を説明するにあたり、まずは本願発明者が本開示に到った知見について、図1を用いて説明する。
本開示の実施形態を説明するにあたり、まずは本願発明者が本開示に到った知見について、図1を用いて説明する。
図1は、本開示に係る翻訳エンジン5と語彙置換/復元処理を説明するための図である。翻訳エンジン5は、種々の言語における用語の対訳を管理する翻訳辞書5a、及び文章中の形態素を解析する形態素解析部5b等を備え、各種の第1の言語から第2の言語への機械翻訳を実行する。語彙置換/復元処理は、特定の語彙に関して語彙置換/復元技術を適用し、翻訳文を生成する翻訳処理である。翻訳エンジン5においては、翻訳辞書5a等に登録されていない用語、即ち未知語がある場合が想定される。こうした場合に適用可能な語彙置換/復元処理について、以下では第1の言語が日本語であり、第2の言語が英語である例を用いて説明する。
図1では、翻訳対象とする入力文が、日本語で「手荷物カウンターはこちらです。」という文章J1であり、入力文の文章J1中に含まれた「手荷物カウンター」という用語J11が未知語である場合を例示する。未知語としては、例えば、特定の職種に関わるシーンのみで使用される専門的な用語であって、一般的ではないような用語が想定される。
語彙置換/復元処理は、例えば、翻訳エンジン5による機械翻訳の前処理を行う置換部2aと、後処理を行う復元部2bとにより実現される。置換部2aは、例えば入力文の文章J1中で未知語である用語J11を置換対象として、未知語の代わりに用いられる用語すなわち代替用語への置換を行う。
代替用語としては、例えば、未知語よりは一般的と考えられる一方で、各種の入力文として想定される文章には含まれ難いと考えられる用語を用いることができる。これにより、入力文が含む用語との混同を回避して、誤訳を生じ難くすることが期待される。本例では、日本語で「あさぎりの湯」という用語J21を代替用語に用いる。置換部2aは、置換結果の置換文として、用語J21を含めた「あさぎりの湯はこちらです。」という文章J2を翻訳エンジン5に出力する。
図1の例では、翻訳エンジン5は、上記の文章J2に対する機械翻訳の処理を実行し、処理結果の文章E2として「Spa of Asagiri is here.」を出力している。当該文章E2は、未知語の代わりの用語J21の訳語E21として、「Spa of Asagiri」を含んでいる。復元部2bは、当該文章E2のような置換文の機械翻訳の結果から、入力文の翻訳結果として提示する翻訳文において未知語を復元するための処理を行う。
図1では、復元部2bの処理が成功した場合を例示している。復元部2bは、上記の文章E2を処理し、入力文の文章J1に対する翻訳文として「Baggage counter is here.」という文章E1を出力している。当該文章E1では、上記文章E2中の代替用語の訳語E21が、入力文では未知語のため置換部2aの置換対象とした用語J11の訳語E11である「Baggage counter」に換わっている。
本例のように、復元部2bが、置換文の機械翻訳結果の文章E2中で、代替用語の訳語E21を、訳語E11のような未知語に再置換できれば、適切に未知語が復元された翻訳文を得ることができる。この際、未知語の復元後の訳語E11は、翻訳エンジン5の処理とは独立して予め、置換対象の用語J11に対応づけて、復元部2b及び置換部2a側で設定可能である。
しかしながら、代替用語の訳語E21は、翻訳エンジン5の内部処理に応じて変動し、復元部2b側で予め想定した訳語とは、異なるものになってしまう場合が考えられる。又、翻訳エンジン5における処理時に、形態素解析部5bが代替用語の形態素を適切に認識できないことで、機械翻訳結果に不具合が生じる場合も想定される。こうした種々の観点から、従来の語彙置換/復元技術による翻訳処理においては、未知語の復元が失敗するような事態を回避し難く、入力文の翻訳結果を示すように翻訳文を精度良く得ることが困難であるという問題点が、本願発明者の鋭意研究によって明らかとなった。
そこで、本願発明者は、上記の問題点について鋭意検討を重ね、語彙置換/復元処理及び代替用語の改善により、例えば翻訳エンジン5の未知語を含んだ入力文の翻訳結果を示す翻訳文を得易くすることができる翻訳装置を考案した。以下、本開示に係る翻訳装置の実施形態を説明する。
(実施形態1)
以下、図面を用いて、実施形態1を説明する。実施形態1では、翻訳エンジン5によって翻訳されないような特定の文字列を代替用語として用いる翻訳装置について説明する。
以下、図面を用いて、実施形態1を説明する。実施形態1では、翻訳エンジン5によって翻訳されないような特定の文字列を代替用語として用いる翻訳装置について説明する。
1.構成
図2は、実施形態1にかかる翻訳装置1の外観を示す図である。図2に示す翻訳装置1は、例えばタブレットタイプの翻訳装置であり、言語が異なる2人のユーザの会話を翻訳する。以下、本実施形態においては、日本語を話すホスト(例えば、案内者)と英語を話すゲスト(例えば、旅行者)とが対面で行う会話を、翻訳装置1が翻訳することを想定して説明する。
図2は、実施形態1にかかる翻訳装置1の外観を示す図である。図2に示す翻訳装置1は、例えばタブレットタイプの翻訳装置であり、言語が異なる2人のユーザの会話を翻訳する。以下、本実施形態においては、日本語を話すホスト(例えば、案内者)と英語を話すゲスト(例えば、旅行者)とが対面で行う会話を、翻訳装置1が翻訳することを想定して説明する。
翻訳装置1は、マイク10と、スピーカ12と、ディスプレイ14と、タッチパネル16とを備える。マイク10及びスピーカ12は、例えば、翻訳装置1の側面の開口近傍に配置されている。ディスプレイ14及びタッチパネル16は、翻訳装置1の主面に配置されている。ディスプレイ14の長手方向の一方側(例えば、ホスト側)の領域には、発話アイコン14h及び表示領域15hが配置される。ディスプレイ14の長手方向の他方側(例えば、ゲスト側)の領域には、発話アイコン14g及び表示領域15gが表示される。各発話アイコン14h、14gに対して、ユーザによるタッチ操作がなされる。
発話アイコン14hは、ホストが発話を行うときに、すなわち、翻訳元として日本語の発話を翻訳装置1に入力するときに、ホスト本人がホストの発話の開始時点及び終了時点を指定するための操作アイコンである。発話アイコン14gは、ゲストが発話を行うときに、すなわち、翻訳元として英語の発話を入力するときに、ゲスト本人がゲストの発話の開始時点及び終了時点を指定するための操作アイコンである。表示領域15h,15gは、音声認識結果および翻訳結果等を文字列として表示するための領域である。
図3は、実施形態1にかかる翻訳システム100の構成を示すブロック図である。翻訳システム100は、図2に示す翻訳装置1、音声認識サーバ41、翻訳サーバ42、及び音声合成サーバ43を有する。翻訳装置1は、インターネットのような通信ネットワーク4を介して、音声認識サーバ41、翻訳サーバ42、及び音声合成サーバ43のそれぞれとデータ通信を行う。
音声認識サーバ41は、翻訳装置1から通信ネットワーク4を介して音声データを受信し、受信した音声データを音声認識して、認識結果の文字列で構成される音声認識データ、すなわち発話文のテキストデータを生成するサーバである。なお、音声認識サーバ41は、本実施形態における翻訳装置1の外部の音声認識装置の一例である。
翻訳サーバ42は、翻訳エンジン5が搭載されたサーバである。翻訳サーバ42は、翻訳装置1から通信ネットワーク4を介して音声認識データを受信し、受信した音声認識データに対して翻訳エンジン5による機械翻訳を実行して、機械翻訳の結果を示すテキストデータである翻訳データを生成する。翻訳サーバ42は、第1の言語から第2の言語への翻訳機能を有する外部装置の一例である。
音声合成サーバ43は、翻訳装置1から通信ネットワーク4を介して翻訳データを受信し、受信した翻訳データを音声合成して音声信号を生成するサーバである。
翻訳装置1は、マイク10と、スピーカ12と、ディスプレイ14と、タッチパネル16とに加えて、通信部18と、記憶部20と、制御部22とを備える。
マイク10は、物理的な音声を音声データに変換する装置である。具体的には、マイク10は、外部から入力される音声を、アナログ電気信号の音声信号に変換し、さらに、AD変換器により音声信号をデジタルの音声データに変換する。マイク10は、発話等の音声を入力する音声入力部の一例である。
通信部18は、Bluetooth(登録商標)、Wi-Fi(登録商標)、3G、LTE(登録商標)、IEEE802.11等の通信方式に従って、通信ネットワーク4を介して音声認識サーバ41、翻訳サーバ42、及び音声合成サーバ43とデータ通信を行う通信モジュールである。
記憶部20は、フラッシュメモリ、強誘電体メモリ、HDD、SSD、RAM、及びこれらの組み合わせなどで構成される記録媒体である。記憶部20は、マイク10の音声データ、音声認識データ、及び翻訳データを格納する。また、記憶部20は、制御部22のための各種プログラムを格納している。
本実施形態において、記憶部20は、登録語辞書31、代替語辞書32、及び置換情報33を格納する。登録語辞書31は、語彙置換/復元処理において置換対象とする特定の用語を登録する辞書情報の一例である。代替語辞書32は、翻訳時に置換対象の代わりに使用される代替用語を含む辞書情報の一例である。置換情報33は、置換前の用語と置換後の用語との対応付けを示す情報である。登録語辞書31、代替語辞書32、及び置換情報33のデータ構造については後述する。
制御部22は、CPU、MPU等で構成され、記憶部20に格納された各種プログラムを実行することにより、翻訳装置1の全体の動作を制御する。制御部22は、例えば機能的構成として置換部2a及び復元部2bを含む。本実施形態では、制御部22の機能は、ハードウェアとソフトウェアの協働により実現するが、所定の機能を実現するように専用に設計されたハードウェア回路のみで実現してもよい。すなわち、制御部22は、CPU、MPUのみならず、DSP、FPGA、ASIC等で構成することができる。
スピーカ12は、電気信号を音声に変換する装置である。スピーカ12は、制御部22からの音声信号(電気信号)に基づいた音声を出力する。スピーカ12は、翻訳結果等の音声を外部に出力する出力部の一例である。
ディスプレイ14は、画像を表示する装置であり、液晶表示デバイスまたは有機EL表示デバイスで構成される。ディスプレイ14は、表示領域15h、15gにおいて、制御部22からの音声認識データ、翻訳データ、及び、逆翻訳データが示す画像を表示する。ディスプレイ14は、音声認識データ、及び翻訳データ等をホスト及びゲストに対して表示出力する出力部の一例である。また、ディスプレイ14は上述した発話アイコン14h、14gを表示する。
タッチパネル16は、ユーザが操作する操作部であり、ユーザからの指示を受け付ける。タッチパネル16はディスプレイ14に重畳して配置されている。
1-1.データ構造について
本実施形態の翻訳装置1に格納される、登録語辞書31、代替語辞書32、及び置換情報33のデータ構造について、図4~図6を参照して説明する。
本実施形態の翻訳装置1に格納される、登録語辞書31、代替語辞書32、及び置換情報33のデータ構造について、図4~図6を参照して説明する。
図4は、登録語辞書31の一例を示す。登録語辞書31には、語彙置換/復元処理において置換対象とする特定の用語が登録されている。本実施形態では、翻訳装置1の登録語辞書31に登録される用語が、翻訳エンジン5にとって未知語であることを想定している。こうした置換対象の用語は、例えば各種の固有名詞を含む。
登録語辞書31に含まれる用語は、単語及び語句を含む。登録語辞書31は、複数の言語による対訳で記載された用語を含む。図4では、当該複数の言語が日本語および英語である例を示しているが、特にこれに限らず、種々の自然言語を採用可能である。以下では、登録語辞書31内の複数の言語による対訳で記載された用語のうち、翻訳元の言語で記載された用語を「登録用語」と呼び、翻訳先の言語で記載された用語を「登録用語の訳語」と呼ぶ。
登録語辞書31は、例えば登録用語の種別を示すクラス毎に設けられる。クラスは、用語を分類するものであって、用語が示す対象のカテゴリである。クラスは、例えば、地名、および食べ物を含む。登録語辞書31は、登録用語と関連付けて付加情報を含んでもよい。付加情報は、例えば、クラスが「地名」であれば、登録用語が示す場所の写真やアクセス手段を示す情報である。
登録語辞書31に登録される用語は、必ずしも未知語に限らず、例えば翻訳エンジン5による機械翻訳では所望のとおりに翻訳され難いと想定される用語であってもよい。又、特に翻訳エンジン5における登録の有無を勘案することなく、特定の分野のみで使用される専門用語や、一部の場所又は地域のみで使用される用語が、登録語辞書31に登録されてもよい。これにより、語彙置換/復元処理を介して、登録語辞書31中の対訳に従った登録用語の訳語を翻訳文にて訳出させるようなことができる。
図5は、本実施形態における代替語辞書32の一例を示す。代替語辞書32は、翻訳時に登録用語の代わりに使用される代替用語を含む。本実施形態の代替語辞書32は、図5に示すように、特殊な文字列で構成される代替用語である代替文字列を、例えばクラス別に管理する。
本実施形態において、代替文字列は、例えば図5に示す文字列W1のように、先頭の記号m0と、末尾の記号m1と、先頭及び末尾の記号m0,m1の間に並んだ文字部分w10とを含む。
代替文字列における先頭及び末尾の記号m0,m1は、例えば「+」などの予め規定された記号に設定される。例えば「+」の記号m0,m1によると、代替文字列を含めた文章の形態素解析等において、代替文字列の内外が区別され易くすることができる。各記号m0,m1は、例えば互いに同一の記号に設定されるが、同一の記号でなくてもよい。各記号m0,m1は、例えば各種の括弧記号に設定されてもよい。
代替文字列における文字部分w10は、例えば文字列W1に示すように、互いに同種の文字を複数、並べて構成される。文字部分w10の複数文字は、例えば意味を成さないように、すなわち当該文字の並びが意味を有する単語等にならないように設定される。これにより、翻訳エンジン5における機械翻訳の処理前後で、代替文字列が変わらないようにし易くすることができる。代替文字列としては、翻訳エンジン5における機械翻訳の処理前後で変化しないことが想定される特定の文字列に設定可能である。
又、文字部分w10の文字種は、例えば翻訳元の言語において発生頻度が比較的低い文字種に設定される。例えば、翻訳元が日本語の場合に、文字部分w10をアルファベットに設定することにより、漢字等よりも発生頻度が低減される。代替語辞書32は、各種言語毎に、別々の代替文字列を管理してもよく、例えば翻訳元とする言語と、同言語において発生頻度が低い文字種の代替文字列とを対応付けてもよい。
図6は、置換情報33の一例を示す。置換情報33は、後述する語彙置換/復元処理の実行時に生成され、例えば当該処理中に一時的に記憶部20に記憶される。置換情報33は、置換前の用語と置換後の用語とを対応付けて含む。置換前の用語は、語彙置換/復元処理において置換対象の登録用語であり、置換後の用語は、置換対象の登録用語に対する代替用語である。
2.動作
以上のように構成される翻訳システム100及び翻訳装置1の動作を以下説明する。
以上のように構成される翻訳システム100及び翻訳装置1の動作を以下説明する。
2-1.全体動作
翻訳システム100及び翻訳装置1の全体的な動作について、図7を参照して説明する。本実施形態において、翻訳エンジン5は翻訳サーバ42に搭載されている。翻訳装置1は翻訳サーバ42に発話文のテキストデータを送信し、翻訳サーバ42から翻訳結果を示す翻訳文のテキストデータを取得する。
翻訳システム100及び翻訳装置1の全体的な動作について、図7を参照して説明する。本実施形態において、翻訳エンジン5は翻訳サーバ42に搭載されている。翻訳装置1は翻訳サーバ42に発話文のテキストデータを送信し、翻訳サーバ42から翻訳結果を示す翻訳文のテキストデータを取得する。
図7は、翻訳システム100における翻訳装置1を説明するためのフローチャートである。図7のフローチャートに示す各処理は、翻訳装置1の制御部22によって実行される。
まず、翻訳装置1の制御部22は、マイク10を介して、発話者による発話の音声に応じた音声データを取得する(S1)。
制御部22は、音声認識処理により、発話文を取得する(S2)。具体的に、制御部22は、まず取得した音声データを、通信ネットワーク4を介して音声認識サーバ41に送信する。音声認識サーバ41は、受信した音声データを音声認識して、発話文のテキストデータを生成する。翻訳装置1は、音声認識サーバ41から通信ネットワーク4を介して、発話文のテキストデータを受信する。
次に、制御部22は、取得した発話文内において、登録語辞書31に含まれる登録用語を検索する(S3)。そして、制御部22は、発話文内に登録用語があるか否かを判断する(S4)。
発話文内に登録用語がなければ(S4でNO)、制御部22は、語彙置換/復元処理ではない通常の翻訳処理を行う(S5~S6)。通常の翻訳処理は、特に置換部2a及び復元部2bを用いずに、発話文に対する翻訳文を取得する処理である。
具体的に、翻訳装置1の制御部22は、まず発話文のテキストデータを、通信ネットワーク4を介して翻訳サーバ42に送信する(S5)。翻訳サーバ42は、翻訳エンジン5において発話文に対する機械翻訳を実行して、機械翻訳の結果のテキストデータを生成する。翻訳サーバ42は、生成したテキストデータを、通信ネットワーク4を介して翻訳装置1に送信する。翻訳装置1は、翻訳サーバ42から通信ネットワーク4を介して、翻訳結果のテキストデータを、翻訳文として受信する(S6)。
一方、発話文内に登録用語があれば(S4でYES)、制御部22は、本実施形態に係る語彙置換/復元処理を行う(S7)。本実施形態に係る語彙置換/復元処理によると、代替文字列を用いることにより、翻訳文の精度を良くすることができる。語彙置換/復元処理の詳細については後述する。
制御部22は、例えば、ステップS6、S7の翻訳結果を表示するようにディスプレイ14を制御する(S8)。例えば、ディスプレイ14は、図2に例示するように、発話文をホスト側の表示領域15hに表示すると共に、翻訳文をゲスト側の表示領域15gに表示する。なお、発話文の表示と翻訳文の表示は、同時に行ってもよいし、順番に行ってもよい。例えば、制御部22は、翻訳サーバ42から翻訳文のテキストを受信する前に発話文を先に表示させてもよい。
翻訳装置1の制御部22は、例えば翻訳結果の表示(S8)により、図7のフローチャートに示す動作を終了する。
以上の翻訳システム100及び翻訳装置1の動作によると、翻訳装置1において、発話によって入力文の一例である発話文の入力を受け付けると共に、翻訳エンジン5による機械翻訳を用いた発話文に対する翻訳結果の翻訳文を提示することができる。
翻訳装置1は、翻訳文の表示(S8)に加えて、又は代えて、翻訳文を音声で出力してもよい。この場合、翻訳装置1の制御部22は、ステップS6、S7で得られた翻訳文のテキストデータを、通信ネットワーク4を介して、音声合成サーバ43に送信する。音声合成サーバ43は、翻訳装置1から受信した翻訳文のテキストデータに基づき、音声合成を行って音声信号を生成し、通信ネットワーク4を介して翻訳装置1に音声信号を送信する。制御部22は、音声合成サーバ43から受信した音声信号に基づき、スピーカ12から翻訳結果を示す音声を出力する。
2-2.語彙置換/復元処理
本実施形態における語彙置換/復元処理(S7)の詳細について、図8~図9を用いて説明する。
本実施形態における語彙置換/復元処理(S7)の詳細について、図8~図9を用いて説明する。
図8は、本実施形態における語彙置換/復元処理を例示するフローチャートである。図9は、本実施形態における語彙置換/復元処理を説明するための図である。
以下の説明では、ホストが発した日本語の発話を翻訳システム100が英語に翻訳し、その翻訳結果をゲストに伝達する場面の一例を想定して説明する。具体的には図9に示すように、入力文の一例の発話文が、未知語として日本語の用語J11を含んだ「手荷物カウンター前に自販機があります。」という文章J10である例を用いて説明する。本例において、翻訳装置1の制御部22は、発話文中の用語J11に基づき図7のステップS4でYESに進み、ステップS7において図8の処理を実行する。
まず、翻訳装置1の制御部22は、置換部2aとして機能し、発話文の中の登録用語を、代替用語とする特定の文字列に置換する(S21)。置換部2aとしての制御部22は、記憶部20における登録語辞書31及び代替語辞書32を参照して、ステップS21の処理を行う。
例えば、図4に示すように、登録語辞書31には、図9の例の未知語である用語J11が、予めクラス「地名」に属するように登録されている。ステップS21において、制御部22は、クラス「地名」に基づいて、例えば図5に示す代替語辞書32から、同クラスに属する代替文字列の一つである「+LDMVA+」という文字列W1を代替用語として選択する。そして、制御部22は、入力文の文章J10中の用語J11を、選択した代替用語に置換し、置換文として図9に示すように「+LDMVA+前に自販機があります。」という文章J20を生成する。
制御部22は、置換前後の用語を対応付けて置換情報33として記録する(S22)。図9の例の置換情報33としては、例えば図6に示すように、置換対象とした用語J11が置換前の用語として記録され、代替用語として選択した文字列W1が置換後の用語として記録される。
制御部22は、通信部18を介して、発話文に対する置換結果の置換文を翻訳サーバ42に送信する(S23)。本例では、置換文として、代替用語の文字列W1を含んだ文章J20を示すテキストデータが送信される。
翻訳サーバ42は、受信した置換文のテキストデータに対して、翻訳エンジン5による機械翻訳の処理を実行して、機械翻訳の結果を示すテキストデータを生成する。図9の例では、置換文の文章J20に対する機械翻訳の結果として、「There is a vending machine in front of +LDMVA+.」という文章E20が生成されている。翻訳サーバ42は、置換文の翻訳結果の文章を示すテキストデータを、通信ネットワーク4を介して翻訳装置1に送信する。翻訳装置1の制御部22は、翻訳サーバ42から通信部18を介して、置換文の翻訳結果を受信する(S24)。
次に、制御部22は、復元部2bとして機能し、受信した翻訳結果において代替用語の文字列を検知して(S25)、発話文の翻訳結果が復元された翻訳文を生成する(S26)。図9の例では、文章J10に対する翻訳文として「Baggage counter is here.」といった文章E1が、上記の文章E20から復元される。
具体的に、復元部2bとしての制御部22は、まず図6に示す置換情報33から置換後の代替用語の文字列W1を特定し、置換文の翻訳結果の文章E20において文字列W1を検索する(S25)。さらに、制御部22は、置換情報33から、置換前の登録用語が用語J11であることを特定する。制御部22は、登録語辞書31から用語J11に対応する「Baggage counter」を訳語E11として読み出して、文章E20中の「+LDMVA+」を訳語E11に置換する。これにより、上記の文章E20のような翻訳文が生成される(S26)。
制御部22は、翻訳文を生成する(S26)と、図7のステップS7の処理を終了し、ステップS8に進む。
以上の処理によると、語彙置換/復元処理において、未知語に対する代替用語として、例えば「+LDMVA+」といった特殊な文字列W1が用いられる(S21)。こうした特殊な文字列W1は、翻訳エンジン5に翻訳されない、即ち翻訳サーバ42における機械翻訳の処理前後で変更されないこととなる。このため、制御部22は、機械翻訳の結果から代替用語と同じ文字列W1の再置換により、翻訳先の言語で未知語を復元する復元部2bとしての処理(S25~S26)を成功し易く、翻訳文を精度良く得ることができる。
上記のような特定の文字列W1を代替用語として用いることで、例えば翻訳サーバ42における機械翻訳の処理時(S23~S24)において、形態素解析の誤認識を回避し易くすることができる。
例えば図1の例の用語J21を代替用語として用いた場合、一般的な形態素解析部5bは、図9に示すように、発話文の文章J10に対する置換後の文章J22中で、漢字等の同種の文字が並んだ部分を纏めて一形態素と認識する可能性が高い。このため、文章J22における用語J21前後の内容によっては、用語J21の内外を誤って区切るような形態素解析が行われ、文章J22の機械翻訳結果に、用語J21の訳語が現れないような不具合を回避し難い。
これに対して、本実施形態の代替用語として用いる特定の文字列W1によると、文字列W1の先頭及び末尾の記号「+」により、形態素解析において、代替用語と外部とが区切られる可能性を高めることができる。又、先頭及び末尾の記号間に同種の文字を並べることにより、代替用語内部を纏めて認識される可能性を高められる。これにより、形態素解析の誤認識を回避し易くすることができる。この際、翻訳サーバ42の形態素解析部5bには、特に形態素解析のための辞書等に文字列W1を登録しなくてもよい。
さらに、本実施形態の代替用語としての文字列W1が、日本語などの翻訳元の言語で、特に意味を成さないものに設定されることにより、翻訳サーバ42における機械翻訳の処理時に、文字列W1とは別の文字列の訳語に変更される事態を回避し易くすることができる。これにより、翻訳装置1において復元部2bの処理対象を検知し易くして、翻訳文における未知語の復元を成功し易くすることができる。
なお、翻訳サーバ42においては、例えば翻訳辞書5aに、代替用語の文字列W1のクラスが登録されていてもよい。例えば文字列W1が「地名」の意味合いであることを前提として、当該文字列W1を含んだ文章J20全体の翻訳精度を良くすることができる。こうした翻訳辞書5aへの登録は、形態素解析部5bに対する登録とは別に行え、翻訳サーバ42への登録負担を低減することができる。
3.まとめ
以上のように、本実施形態において、翻訳装置1は、第1の言語(例えば、日本語)における入力文(例えば、発話文)を取得し、翻訳サーバ43と通信して、文章J10等の入力文の翻訳結果を示す文章E10等の翻訳文を出力する。翻訳サーバ43は、第1の言語から第2の言語(例えば、英語)への機械翻訳を実行する外部装置の一例である。翻訳装置1は、記憶部20と、制御部22と、通信部18とを備える。記憶部20は、第1の辞書情報の一例である登録語辞書31、及び第2の辞書情報の一例である代替語辞書32を記憶する。登録語辞書31は、第1の言語の置換対象の用語である登録用語と、登録用語に対する第2の言語の訳語とを対応づけて含む。代替語辞書32は、置換対象の用語の代わりに使用される、少なくとも1つの代替用語を含む。制御部22は、入力文に含まれる置換対象の用語を代替用語に置換して、文章J20のように置換結果を示す置換文を生成する(S21)。通信部18は、置換文を翻訳サーバ42に出力し(S23)、翻訳サーバ42から、文章E20のように第2の言語における置換文の翻訳結果を取得する(S24)。代替用語は、例えば文字列W1のように、特定の文字列で構成される。制御部22は、通信部18から取得した置換文の翻訳結果において当該特定の文字列を検知して(S25)、検知した文字列を、登録語辞書31において置換対象の登録用語(例えば用語J11)に対応づけられた訳語(例えば訳語E11)に置換して、翻訳文を生成する(S26)。
以上のように、本実施形態において、翻訳装置1は、第1の言語(例えば、日本語)における入力文(例えば、発話文)を取得し、翻訳サーバ43と通信して、文章J10等の入力文の翻訳結果を示す文章E10等の翻訳文を出力する。翻訳サーバ43は、第1の言語から第2の言語(例えば、英語)への機械翻訳を実行する外部装置の一例である。翻訳装置1は、記憶部20と、制御部22と、通信部18とを備える。記憶部20は、第1の辞書情報の一例である登録語辞書31、及び第2の辞書情報の一例である代替語辞書32を記憶する。登録語辞書31は、第1の言語の置換対象の用語である登録用語と、登録用語に対する第2の言語の訳語とを対応づけて含む。代替語辞書32は、置換対象の用語の代わりに使用される、少なくとも1つの代替用語を含む。制御部22は、入力文に含まれる置換対象の用語を代替用語に置換して、文章J20のように置換結果を示す置換文を生成する(S21)。通信部18は、置換文を翻訳サーバ42に出力し(S23)、翻訳サーバ42から、文章E20のように第2の言語における置換文の翻訳結果を取得する(S24)。代替用語は、例えば文字列W1のように、特定の文字列で構成される。制御部22は、通信部18から取得した置換文の翻訳結果において当該特定の文字列を検知して(S25)、検知した文字列を、登録語辞書31において置換対象の登録用語(例えば用語J11)に対応づけられた訳語(例えば訳語E11)に置換して、翻訳文を生成する(S26)。
以上の翻訳装置1によると、代替用語として用いる特定の文字列が、翻訳サーバ4に翻訳されないことを利用して、置換文の翻訳結果において当該文字列を検知して(S25)、翻訳文を復元する(S26)。これにより、翻訳サーバ4の翻訳エンジン5に翻訳される代替用語を用いた場合のような復元の失敗を回避し易くして、適切に入力文の翻訳結果を示す翻訳文を得易くすることができる。
本実施形態において、代替用語として用いる代替文字列は、当該文字列における先頭と末尾にそれぞれ配置される所定の記号m0,m1と、先頭の記号m0と末尾の記号m1との間に並んだ互いに同種の複数文字の文字部分w10とを含む。
こうした代替文字列によると、翻訳エンジン5に翻訳されない可能性が比較的高く、翻訳エンジン5の処理後に、処理前と同じ文字列を維持し易い。代替文字列として、例えば第1の言語において発生頻度が低い文字種を用いることで、当該文字列が翻訳されない可能性をより高めて、適切な翻訳文をより得易くすることができる。
本実施形態において、置換対象の用語は、例えば固有名詞を含む。置換対象の用語は、例えば翻訳サーバ4に未登録である未知語と想定される用語に設定可能である。これにより、入力文に未知語が含まれていても、翻訳文を精度良く得ることができる。
本実施形態において、代替語辞書32は、用語の種別を示すクラス毎に代替用語を分類してもよい。この場合、制御部22は、入力文に含まれる置換対象の用語と同じクラスに分類された代替用語を用いて、置換文を生成する(S21)。クラスに応じた代替用語により、翻訳文の精度向上を図れる。
本実施形態において、翻訳装置1は、発話を入力する音声入力部の一例のマイク10をさらに備えてもよい。通信部18は、発話の音声データを外部の音声認識装置の一例である音声認識サーバ41に出力し、音声認識サーバ41から音声データに対する認識結果の入力文を取得してもよい(S2)。こうした翻訳装置1によると、ユーザの発話に対する適切な翻訳文を得易い。
(実施形態2)
以下、図10~図12を用いて実施形態2を説明する。実施形態2では、図1を用いて説明した問題点について、実施形態1とは別の解決策を提供する。
以下、図10~図12を用いて実施形態2を説明する。実施形態2では、図1を用いて説明した問題点について、実施形態1とは別の解決策を提供する。
以下、実施形態1に係る翻訳装置1及び翻訳システム100と同様の構成、動作の説明は適宜、省略して、本実施形態に係る翻訳装置1及び翻訳システム100を説明する。
本実施形態では、語彙置換/復元処理において翻訳エンジン5の機械翻訳結果を取得すると代替用語の訳語が含まれているか否かを判断し、判断結果によっては代替用語を替えて同処理を繰り返す翻訳装置1について説明する。
図10は、実施形態2における代替語辞書32Aの一例を示す。本実施形態の翻訳装置1は、代替用語として、単語及び語句を含む用語であって、例えば翻訳エンジン5において精度良く翻訳されることが想定される用語を用いる。
本実施形態の代替語辞書32Aにおいては、代替用語として用いる用語が、登録語辞書31と同じ複数の言語(例えば日本語及び英語)の対訳で記載される。本実施形態の語彙置換/復元処理では、代替語辞書32Aにおいて複数の言語のうちの翻訳元の言語で記載された用語が「代替用語」として置換文に用いられ、翻訳先の言語で記載された用語が「代替用語の訳語」として翻訳文に用いられる。
代替語辞書32Aは、例えば実施形態1と同様の各クラスにおいて、複数の代替用語とその訳語とを含む。又、本実施形態の代替語辞書32Aは、例えば図10に示すように、代替用語間の優先順位を管理する。優先順位は、本実施形態の語彙置換/復元処理において代替用語として用いる際に優先される順番を示す。本例では、同じクラスの代替用語の間で、優先順位が設定されている。優先順位「1」を有する用語が、最も高い優先順位の代替用語となる。
図11は、実施形態2における語彙置換/復元処理を例示するフローチャートである。本実施形態の翻訳装置1は、実施形態1と同様の動作の実行時に、図7のステップS7において図8のフローチャートの代わりに本フローチャートに例示するような処理を実行する。
まず、翻訳装置1の制御部22は、本実施形態の代替語辞書32Aにおいて、優先順位が高い代替用語から順番に、1つの代替用語を選択する(S21a)。制御部22は、選択した代替用語を用いて置換部2a及び復元部2bとしての処理を実施形態1と同様に行う(S21b~S25a)。図12に、本実施形態における置換情報33Aの一例を示す。
図12は、置換前の用語J11と同じクラスの代替語辞書32Aにおいて優先順位が最も高い用語J23が、ステップS21aで選択された場合におけるステップS22の置換情報33Aを例示している。この場合、制御部22は、発話文中の用語J11を、選択した用語J23に置換して、置換文を生成する(S21b)。用語J23のような代替用語は、翻訳サーバ42における機械翻訳の処理時に、例えば日本語から英語に翻訳される。
制御部22は、翻訳サーバ42から置換文の翻訳結果を受信すると(S24)、置換情報33Aおよび代替語辞書32Aを参照して、受信した置換文の翻訳結果の文章において、代替用語の訳語を検知する(S25a)。具体的に、制御部22は、置換情報33Aにおける置換後の用語J23の訳語E23を、代替語辞書32Aから読み出し、機械翻訳の結果の文章において、訳語E23を検索する。
上記のような場合、翻訳サーバ42における置換文の翻訳結果の文章に、あらかじめ想定した代替用語の訳語E23が含まれていない場合が考えられる。制御部22は、ステップS25aの検知結果に基づいて、翻訳サーバ42から受信した置換文の翻訳結果の文章中に、代替用語の訳語があるか否かを判断する(S25b)。
制御部22は、置換文の翻訳結果に代替用語の訳語がないと判断すると(S25bでNO)、代替語辞書32Aを参照して、代替用語の下位候補があるか否かを判断する(S25c)。代替用語の下位候補は、代替語辞書32Aにおいて、置換文に用いた代替用語と同じクラスの中で、当該代替用語よりも下位の優先順位を有する代替用語である。
代替用語の下位候補がある場合(S25cでYES)、制御部22は、代替用語の下位候補の中で最も高い優先順位を有する代替用語を選択し(S21a)、ステップS21b以降の処理を再度、行う。これにより、優先順位が高い順に代替用語を用いて置換文が繰り返し生成され、翻訳サーバ42に送信される(S23)。翻訳エンジン5は順次、受信した置換文の機械翻訳を実行する。
制御部22は、置換文の翻訳結果に代替用語の訳語があると判断すると(S25bでYES)、代替用語の訳語を登録用語の訳語に置換して、実施形態1と同様に翻訳文を生成する(S26)。その後、制御部22は、図7のステップS7を終了し、ステップS8に進む。
以上の処理によると、代替用語を含めて置換文を生成した際に、翻訳エンジン5による置換文の翻訳結果に、当該代替用語に対して想定した訳語が含まれていなかった場合には(S25bでNO)、別の代替用語を用いて置換文の生成などが再び行われる(S21a~S24)。このような別々の代替用語による複数の置換文に対する機械翻訳の結果のいずれかに、想定した代替用語の訳語が含まれていれば(S25bでYES)、未知語を復元した翻訳文を得ることができる(S26)。又、未知語の復元を失敗して代替用語の訳語E23に類似した訳語が未知語の代わりに含まれた文章が、ユーザに見えてしまう事態を回避し易くすることができる。このように、翻訳文の精度を良くすることができる。
なお、置換文の翻訳結果に代替用語の訳語がないとの判断(S25bでNO)が繰り返され、代替用語の下位候補がなくなった場合(S25cでNO)、制御部22は、例えばステップS26の処理を行わず、図7のステップS7を終了する。
上記の場合、続くステップS8において、制御部22は、例えば最後に受信した置換文の翻訳結果を翻訳文としてディスプレイ14に表示させてもよい。例えば、代替語辞書32Aにおいて優先順位が最下位の代替用語として、翻訳結果が表示されたとしても、ホスト等のユーザの不快感を招かないと考えられる用語を登録しておく。これにより、最終的に未知語の復元を失敗した文章が表示されたとしてもユーザの不快感を生じにくくすることができる。また、上記翻訳文の表示に代えて、又はこれに加えて、制御部22は、各種のエラー表示を表示させてもよい。
以上のように、本実施形態において、翻訳装置1は、第1の言語における入力文を取得し、第1の言語から第2の言語への機械翻訳を実行する翻訳サーバ43等と通信して、入力文の翻訳結果を示す翻訳文を出力する。翻訳装置1は、記憶部20と、制御部22と、通信部18とを備える。記憶部20は、第1の辞書情報の一例である登録語辞書31、及び第2の辞書情報の一例である代替語辞書32Aを記憶する。本実施形態の代替語辞書32Aは、第1の言語において置換対象の用語の代わりに使用される複数の代替用語と、各代替用語に対する第2の言語の訳語とを対応づけて含む。制御部22は、通信部18から取得した置換文の翻訳結果において、代替用語の訳語があるか否かを判断する(S25b)。制御部22は、代替用語の訳語がないと判断した場合(S25bでNO)、代替語辞書32Aにおいて当該訳語に対応付けられた代替用語とは異なる代替用語を用いて再度、置換文を生成して通信部18に出力させる(S25c~S23)。制御部22は、代替用語の訳語があると判断した場合(S25bでYES)、当該訳語を、登録語辞書31において置換対象の用語に対応づけられた訳語に置換して、翻訳文を生成する(S26)。
以上の翻訳装置1によると、代替用語を含めた置換文の翻訳結果に、代替語辞書32Aにおいて対応する代替用語の訳語がなかった場合(S25bでNO)、別の代替用語を用いて再度、置換文の機械翻訳が行われる。このように、複数回の置換文を用いることで、1回の置換文のみの場合よりも、翻訳文の復元が最終的に失敗する可能性を低減し、適切に入力文の翻訳結果を示す翻訳文を得易くすることができる。又、未知語の復元を失敗した文章が、ユーザに見えてしまう事態を回避し易くすることができる。
本実施形態において、代替語辞書32Aは、複数の代替用語における優先順位を管理してもよい。制御部22は、複数の代替用語において優先順位が高い代替用語から順番に、置換文に用いる(S21a)。例えば、置換文の翻訳結果に訳語が含まれる可能性が高い代替用語の優先順位を高く設定することにより、翻訳文の復元を効率良く成功させることができる。
(他の実施形態)
以上のように、本出願において開示する技術の例示として、実施形態1~2を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置換、付加、省略などを行った実施の形態にも適用可能である。また、上記各実施形態で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。そこで、以下、他の実施形態を例示する。
以上のように、本出願において開示する技術の例示として、実施形態1~2を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置換、付加、省略などを行った実施の形態にも適用可能である。また、上記各実施形態で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。そこで、以下、他の実施形態を例示する。
上記の実施形態2における語彙置換/復元処理(図11)では、実施形態1における特定の文字列が用いられてもよい。このような変形例について、図13を用いて説明する。
図13は、本変形例における代替語辞書32Bを例示する。例えば実施形態2と同様の代替語辞書32Bにおいて、実施形態1の代替文字列が登録されてもよい。図13の例では、代替語辞書32Bに、文字列W1が代替用語として含まれている。本例の代替語辞書32Bでは、日本語及び英語といった各言語において、同じ文字列W1が記載されている。
上記の代替語辞書32Bによると、制御部22は、例えば図11のステップS21bにおいて日本語等の翻訳元の言語の記載を参照して、文字列W1を代替用語として用いる。又、ステップS25aでは、英語等の翻訳先の言語の記載を参照して、同じ文字列W1が代替用語の訳語として用いられる。このように、特殊な文字列W1と他の代替用語とを同様に用いて、語彙置換/復元処理を行うことができる。
以上のように、本変形例において、代替語辞書32Bにおける複数の代替用語は、特定の文字列で構成された代替用語を含んでもよい。代替語辞書32Bは、特定の文字列で構成された代替用語の訳語として、当該文字列と同じ文字列を含んでもよい。
また、実施形態1の代替語辞書32を用いて、実施形態2と同様の語彙置換/復元処理が行われてもよい。例えば図5の代替語辞書32において、代替文字列間の優先順位は、クラス毎に登録された昇順に設定可能である。
上記の代替語辞書32によると、図11と同様の処理時に、制御部22は、ステップS25a,S25bにおいて、代替用語の訳語の代わりに、図8のステップS25と同様に代替文字列の有無を検知する。この際、代替文字列がないことが検知されれば(S25bでNO)、異なる文字列で構成される別の代替文字列を用いて置換文の生成が繰り返され(S21a~S25c)、翻訳文の精度を向上できる。
以上のように、本変形例において、代替語辞書32は、互いに異なる文字列で構成された複数の代替用語を含んでもよい。制御部22は、通信部18から取得した置換文の翻訳結果において、置換文に用いた文字列がないことを検知すると(S25bでNO)、当該文字列の代替用語とは異なる代替用語を用いて再度、置換文を生成して通信部18に出力さてもよい(S25c~S23)。
上記の各実施形態の翻訳装置1は、発話の言語(例えば、日本語)を他の言語(例えば、英語)に翻訳して得られた翻訳結果である翻訳文を、元の言語(例えば、日本語)に翻訳する逆翻訳機能をさらに有してもよい。この場合、翻訳装置1は、置換された状態の翻訳文を翻訳サーバ4に送信し、翻訳サーバ4から逆翻訳文を取得する。
上記の各実施形態では、音声認識を音声認識サーバ41で行い、翻訳を翻訳サーバ42で行い、音声合成を音声合成サーバ5で行ったが、本開示はこれに限定されない。音声認識、翻訳及び音声合成の少なくとも一つの処理を翻訳装置1内で行ってもよい。例えば、翻訳装置1(端末)に、音声認識サーバ41、翻訳サーバ42、及び音声合成サーバ43と同一の機能を全て搭載して、翻訳装置1のみで翻訳に関連する全ての処理を行うようにしてもよい。この場合、翻訳装置1は、通信ネットワーク4に接続するような通信部18を有さなくてもよい。例えば制御部22において翻訳サーバ4の機能である翻訳エンジン5と情報の受け渡しを行う機能が、翻訳エンジン5に対する通信部を構成してもよい。
上記の各実施形態では、日本語と英語の間の翻訳の例を示した。しかし、翻訳処理の対象とする言語は、日本語と英語に限定されず、他の言語であってもよく、例えば中国語、独語、仏語、スペイン語、韓国語、タイ語、ベトナム語、インドネシア語等であってもよい。
上記の各実施形態において、翻訳装置1は、マイク10で入力した発話文を入力文として翻訳したが、発話以外で入力した入力文を翻訳してもよい。例えば、翻訳装置1は、キーボードやマウスなどで入力した入力文を翻訳してもよい。つまり、本開示の翻訳装置1は、種々の入力文の文章を翻訳するときに、文章中の置換対象の用語を代替用語に置換して翻訳する。そして、翻訳文に含まれる代替用語の訳語を、代替用語により置換された置換対象の用語に対する訳語に復元し、翻訳文を表示する。
以上のように、本開示における技術の例示として、実施の形態を説明した。そのために、添付図面および詳細な説明を提供した。
したがって、添付図面および詳細な説明に記載された構成要素の中には、課題解決のために必須な構成要素だけでなく、上記技術を例示するために、課題解決のためには必須でない構成要素も含まれ得る。そのため、それらの必須ではない構成要素が添付図面や詳細な説明に記載されていることをもって、直ちに、それらの必須ではない構成要素が必須であるとの認定をするべきではない。
また、上述の実施の形態は、本開示における技術を例示するためのものであるから、特許請求の範囲またはその均等の範囲において、種々の変更、置換、付加、省略などを行うことができる。
本開示は、種々の場面で各種の言語間における翻訳を行うための翻訳装置に適用可能である。
Claims (9)
- 第1の言語における入力文を取得し、前記第1の言語から第2の言語への機械翻訳を実行する外部装置と通信して、前記入力文の翻訳結果を示す翻訳文を出力する翻訳装置であって、
前記第1の言語の置換対象の用語と、前記置換対象の用語に対する前記第2の言語の訳語とを対応づけて含む第1の辞書情報、及び、前記置換対象の用語の代わりに使用される、少なくとも1つの代替用語を含む第2の辞書情報を記憶する記憶部と、
前記入力文に含まれる前記置換対象の用語を前記代替用語に置換して、置換結果を示す置換文を生成する制御部と、
前記置換文を前記外部装置に出力し、前記外部装置から前記第2の言語における前記置換文の翻訳結果を取得する通信部とを備え、
前記代替用語は、特定の文字列で構成され、
前記制御部は、
前記通信部から取得した置換文の翻訳結果において当該特定の文字列を検知して、
検知した文字列を、前記第1の辞書情報において前記置換対象の用語に対応づけられた訳語に置換して、前記翻訳文を生成する
翻訳装置。 - 前記特定の文字列は、当該文字列における先頭と末尾にそれぞれ配置される所定の記号と、前記先頭の記号と前記末尾の記号との間に並んだ互いに同種の複数文字とを含む
請求項1に記載の翻訳装置。 - 前記第2の辞書情報は、互いに異なる文字列で構成された複数の代替用語を含み、
前記制御部は、前記通信部から取得した置換文の翻訳結果において、前記置換文に用いた文字列がないことを検知すると、当該文字列の代替用語とは異なる代替用語を用いて再度、前記置換文を生成して前記通信部に出力させる
請求項1又は2に記載の翻訳装置。 - 第1の言語における入力文を取得し、前記第1の言語から第2の言語への機械翻訳を実行する外部装置と通信して、前記入力文の翻訳結果を示す翻訳文を出力する翻訳装置であって、
前記第1の言語の置換対象の用語と、前記置換対象の用語に対する前記第2の言語の訳語とを対応づけて含む第1の辞書情報、及び、前記第1の言語において前記置換対象の用語の代わりに使用される複数の代替用語と、各代替用語に対する前記第2の言語の訳語とを対応づけて含む第2の辞書情報を記憶する記憶部と、
前記入力文に含まれる前記置換対象の用語を前記代替用語に置換して、置換結果を示す置換文を生成する制御部と、
前記置換文を前記外部装置に出力し、前記外部装置から前記第2の言語における前記置換文の翻訳結果を取得する通信部とを備え、
前記制御部は、
前記通信部から取得した置換文の翻訳結果において、前記代替用語の訳語があるか否かを判断し、
前記代替用語の訳語がないと判断した場合、前記第2の辞書情報において当該訳語に対応付けられた代替用語とは異なる代替用語を用いて再度、前記置換文を生成して前記通信部に出力させ、
前記代替用語の訳語があると判断した場合、当該訳語を、前記第1の辞書情報において前記置換対象の用語に対応づけられた訳語に置換して、前記翻訳文を生成する
翻訳装置。 - 前記複数の代替用語は、特定の文字列で構成された代替用語を含み、
前記第2の辞書情報は、前記特定の文字列で構成された代替用語の訳語として、当該文字列と同じ文字列を含む
請求項4に記載の翻訳装置。 - 前記第2の辞書情報は、前記複数の代替用語における優先順位を管理し、
前記制御部は、前記複数の代替用語において前記優先順位が高い代替用語から順番に、前記置換文に用いる
請求項3~5のいずれか1項に記載の翻訳装置。 - 前記置換対象の用語は、固有名詞を含む
請求項1~6のいずれか1項に記載の翻訳装置。 - 前記第2の辞書情報は、用語の種別を示すクラス毎に前記代替用語を分類しており、
前記制御部は、前記入力文に含まれる置換対象の用語と同じクラスに分類された代替用語を用いて、前記置換文を生成する
請求項1~7のいずれか1項に記載の翻訳装置。 - 発話を入力する音声入力部をさらに備え、
前記通信部は、前記発話の音声データを外部の音声認識装置に出力し、前記音声認識装置から前記音声データに対する前記入力文を取得する
請求項1~8のいずれか1項に記載の翻訳装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202080041464.0A CN113924573A (zh) | 2019-06-04 | 2020-04-24 | 翻译装置 |
JP2021524710A JP7526942B2 (ja) | 2019-06-04 | 2020-04-24 | 翻訳装置 |
US17/540,581 US11995416B2 (en) | 2019-06-04 | 2021-12-02 | Translation device |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019104680 | 2019-06-04 | ||
JP2019-104680 | 2019-06-04 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
US17/540,581 Continuation US11995416B2 (en) | 2019-06-04 | 2021-12-02 | Translation device |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2020246175A1 true WO2020246175A1 (ja) | 2020-12-10 |
Family
ID=73652202
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/JP2020/017824 WO2020246175A1 (ja) | 2019-06-04 | 2020-04-24 | 翻訳装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11995416B2 (ja) |
JP (1) | JP7526942B2 (ja) |
CN (1) | CN113924573A (ja) |
WO (1) | WO2020246175A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113505159B (zh) * | 2021-07-16 | 2023-04-25 | 马上消费金融股份有限公司 | 数据检测方法、装置及设备 |
US12056457B2 (en) * | 2022-03-22 | 2024-08-06 | Charles University, Faculty Of Mathematics And Physics | Computer-implemented method of real time speech translation and a computer system for carrying out the method |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015121992A (ja) * | 2013-12-24 | 2015-07-02 | 日本電信電話株式会社 | 翻訳装置、翻訳モデル学習装置、方法、及びプログラム |
WO2018198806A1 (ja) * | 2017-04-27 | 2018-11-01 | パナソニックIpマネジメント株式会社 | 翻訳装置 |
WO2019016985A1 (ja) * | 2017-07-20 | 2019-01-24 | パナソニックIpマネジメント株式会社 | 翻訳装置、翻訳方法及びプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS4929632B1 (ja) | 1970-12-30 | 1974-08-06 | ||
JP4929632B2 (ja) | 2005-07-08 | 2012-05-09 | カシオ計算機株式会社 | 表示制御装置及びプログラム |
JP2014078132A (ja) * | 2012-10-10 | 2014-05-01 | Toshiba Corp | 機械翻訳装置、方法およびプログラム |
JP2017151553A (ja) | 2016-02-22 | 2017-08-31 | 富士通株式会社 | 機械翻訳装置、機械翻訳方法、及びプログラム |
CN107870901B (zh) * | 2016-09-27 | 2023-05-12 | 松下知识产权经营株式会社 | 从翻译源原文生成相似文的方法、记录介质、装置以及系统 |
KR102516364B1 (ko) * | 2018-02-12 | 2023-03-31 | 삼성전자주식회사 | 기계 번역 방법 및 장치 |
-
2020
- 2020-04-24 WO PCT/JP2020/017824 patent/WO2020246175A1/ja active Application Filing
- 2020-04-24 JP JP2021524710A patent/JP7526942B2/ja active Active
- 2020-04-24 CN CN202080041464.0A patent/CN113924573A/zh active Pending
-
2021
- 2021-12-02 US US17/540,581 patent/US11995416B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015121992A (ja) * | 2013-12-24 | 2015-07-02 | 日本電信電話株式会社 | 翻訳装置、翻訳モデル学習装置、方法、及びプログラム |
WO2018198806A1 (ja) * | 2017-04-27 | 2018-11-01 | パナソニックIpマネジメント株式会社 | 翻訳装置 |
WO2019016985A1 (ja) * | 2017-07-20 | 2019-01-24 | パナソニックIpマネジメント株式会社 | 翻訳装置、翻訳方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN113924573A (zh) | 2022-01-11 |
JP7526942B2 (ja) | 2024-08-02 |
US11995416B2 (en) | 2024-05-28 |
US20220092277A1 (en) | 2022-03-24 |
JPWO2020246175A1 (ja) | 2020-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6251958B2 (ja) | 発話解析装置、音声対話制御装置、方法、及びプログラム | |
JP4791984B2 (ja) | 入力された音声を処理する装置、方法およびプログラム | |
KR101532447B1 (ko) | 아시아어 문자를 생성하는 인식 아키텍처 | |
US9484034B2 (en) | Voice conversation support apparatus, voice conversation support method, and computer readable medium | |
US20070124131A1 (en) | Input apparatus, input method and input program | |
US11227116B2 (en) | Translation device, translation method, and program | |
JPWO2007097390A1 (ja) | 音声認識システム、音声認識結果出力方法、及び音声認識結果出力プログラム | |
US11995416B2 (en) | Translation device | |
JP2008083994A (ja) | 辞書登録装置、辞書登録方法及び辞書登録プログラム | |
JP7199061B2 (ja) | 翻訳装置 | |
JPWO2011033834A1 (ja) | 音声翻訳システム、音声翻訳方法および記録媒体 | |
JP7117629B2 (ja) | 翻訳装置 | |
Choe et al. | Language-specific effects on automatic speech recognition errors for world Englishes | |
US10410624B2 (en) | Training apparatus, training method, and computer program product | |
Jamro | Sindhi language processing: A survey | |
JP5208795B2 (ja) | 通訳装置、方法、及びプログラム | |
JP2013235117A (ja) | 単語分割装置、及び単語分割方法 | |
Kabra et al. | Auto spell suggestion for high quality speech synthesis in hindi | |
JP2018195248A (ja) | 翻訳表示装置、コンピュータ端末及び翻訳表示方法 | |
KR101777141B1 (ko) | 한글 입력 키보드를 이용한 훈민정음 기반 중국어 및 외국어 입력 장치 및 방법 | |
Rajendran et al. | Text processing for developing unrestricted Tamil text to speech synthesis system | |
WO2023166651A1 (ja) | 情報処理装置及び情報処理プログラム | |
JP2020030379A (ja) | 認識結果補正装置、認識結果補正方法、およびプログラム | |
JP6203083B2 (ja) | 未知語抽出装置及び未知語抽出方法 | |
JP7479249B2 (ja) | 未知語検出方法及び未知語検出装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 20817738 Country of ref document: EP Kind code of ref document: A1 |
|
ENP | Entry into the national phase |
Ref document number: 2021524710 Country of ref document: JP Kind code of ref document: A |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 20817738 Country of ref document: EP Kind code of ref document: A1 |