WO2011021479A1 - 情報処理装置、表示制御方法、およびプログラム - Google Patents

情報処理装置、表示制御方法、およびプログラム Download PDF

Info

Publication number
WO2011021479A1
WO2011021479A1 PCT/JP2010/062600 JP2010062600W WO2011021479A1 WO 2011021479 A1 WO2011021479 A1 WO 2011021479A1 JP 2010062600 W JP2010062600 W JP 2010062600W WO 2011021479 A1 WO2011021479 A1 WO 2011021479A1
Authority
WO
WIPO (PCT)
Prior art keywords
template
phrase
data
sentence
unit
Prior art date
Application number
PCT/JP2010/062600
Other languages
English (en)
French (fr)
Inventor
将人 飯田
いち子 佐田
Original Assignee
シャープ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シャープ株式会社 filed Critical シャープ株式会社
Priority to US13/391,528 priority Critical patent/US20120150530A1/en
Priority to CN2010800473170A priority patent/CN102625935A/zh
Publication of WO2011021479A1 publication Critical patent/WO2011021479A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Definitions

  • JP-A-1-207873 includes a word segmentation processing unit, a changed word input processing unit, a translated word determination processing unit, and a translated sentence rewriting processing unit, which have functions to be described later, as the translation support device.
  • the structure provided with this is disclosed.
  • the word cutout processing unit cuts out a word in the original sentence and cuts out a word in the corresponding translation sentence based on the position specified in the original sentence in the parallel translation sentence.
  • the changed word input processing unit inputs a new word to be changed according to the language of the original text.
  • the translated word determination processing unit determines a translated word corresponding to the input word using the parallel translation dictionary.
  • the translated sentence rewrite processing unit sets the determined translated word at the word position of the translated sentence cut out by the word cutout processing unit.
  • the electronic dictionary of Patent Document 1 is not a translation device that translates sentences (original texts). For this reason, the electronic dictionary of Patent Document 1 is a translated sentence corresponding to a word or phrase included in a source sentence in a parallel translation including a sentence (original sentence) in a first language and a translated sentence in a second language that is a translation of the original sentence. Cannot be specified.
  • the present invention has been made in view of the above-described problems, and its purpose is to provide an information processing apparatus, a display control method, and a display control method in which a user can confirm a range of a translation that has a corresponding relationship with a range of an original sentence selected by the user. And to provide a program.
  • FIG. 6 is a diagram showing co-occurrence information stored in a temporary first co-occurrence buffer 81.
  • FIG. 10 is a diagram showing a configuration of other co-occurrence information stored in a temporary first co-occurrence buffer 81. It is the figure which showed the structure of the slot information memorize
  • FIGS. 1 to 89 An embodiment of a translation apparatus according to the present invention will be described with reference to FIGS. 1 to 89 as follows.
  • the translation apparatus 1 includes an input unit 10, an output unit 11, a control unit 12, a storage device 13, and a memory 14, as shown in FIG.
  • the output unit 11 is a device for displaying data input via the input unit 10 and results of various processes in the control unit 12 based on instructions from the control unit 12.
  • control unit 12 and each unit in the control unit 12 are functional blocks, and processing in these blocks is realized by software executed by a CPU (Central Processing Unit) described later.
  • CPU Central Processing Unit
  • a phrase means a word or phrase, and in a phrase, a word (generally defined as a minimum unit that constitutes a sentence and having a specific meaning or grammatical function) or a compound word (Generally defined as one having two or more words connected to represent one meaning).
  • FIG. 2 is a diagram showing data stored in the storage device 13. As shown in the figure, the storage device 13 stores a template database 60, a dictionary database 61, a Japanese inflection table 62, a category database 63, a thesaurus data 64, and a co-occurrence relation database 65. .
  • FIG. 3 is a diagram showing a configuration of one template data included in the template database 60.
  • template data includes a template ID, a template in Japanese (hereinafter referred to as Japanese template), a template in English (hereinafter referred to as English template), a template in Chinese (hereinafter referred to as Chinese template), Is included.
  • the above Japanese template includes a fixed part composed of a predetermined word and a variable part that can be replaced with any one of a plurality of predetermined words.
  • the word W15 postpositional word functioning as an auxiliary to a main word
  • sentence W16 correspond to the fixed part
  • ⁇ 1: & HUMAN-SUBJ ⁇ and ⁇ 2: & VB_EAT + v.ren1 ⁇ Corresponds to the variable part.
  • the above English template includes a fixed part and a variable part, similar to the Japanese template.
  • “What” and “?” Correspond to the fixed part, and ⁇ -i: be_AUX + pres ⁇ , ⁇ -i: # DET_MY-NULL ⁇ , ⁇ 1-i: & HUMAN-SUBJ ⁇ ⁇ 2: & VB_EAT + ing ⁇ corresponds to the variable part.
  • the Japanese template and the English template are either a fixed portion made up of a predetermined word or phrase and a plurality of predetermined words or phrases at corresponding positions. And a variable part that can be substituted for the phrase.
  • the dictionary ID column an identifier (ID) for distinguishing the dictionary data from other dictionary data is described.
  • ID an identifier for distinguishing the dictionary data from other dictionary data.
  • a Japanese word / phrase W14 verb
  • an English word “drink” corresponding to the word
  • a Chinese word / phrase W17 verb
  • the part of speech of the heading is described in the above part of speech column.
  • utilization column information on the utilization form of the word / phrase is described for each language.
  • the meaning of the phrase W18 indicates that the phrase W14 is the utilization (five-tire conjugation in the “ma” column of the kana syllabary) indicated by the phrase W19 (see FIG. 77). The meaning code will be described later.
  • the recording medium is not limited to CD-ROM, FD (Flexible Disk), and hard disk, but magnetic tape, cassette tape, optical disk (MO (Magnetic Optical Disc) / MD (Mini Disc) / DVD (Digital Versatile Disc)). , IC (Integrated Circuit) card (including memory card), optical card, mask ROM, EPROM (Electronically Programmable Read-Only Memory), EEPROM (Electronically Erasable Programmable Read-Only Memory), fixation of semiconductor memory such as flash ROM Alternatively, it may be a medium carrying a program.
  • the above configuration is merely one aspect of a specific configuration, and may be a configuration in which the mouse is not provided and a keyboard, a monitor, and a hard disk are provided in the translation apparatus 1.
  • the translation apparatus 1 can also be configured as a portable portable information terminal such as an electronic dictionary or a mobile phone.
  • the template data includes a Japanese template, an English template, and a Chinese template, and a configuration is shown in which a sentence example in each language is created using a template in each language.
  • the present invention is not limited to this. It is not a thing.
  • step S2 details of the template search in step S2 will be described based on FIG. 13 and FIG.
  • the determination unit 22 includes the read word / phrase (WX) or the word / phrase (WX ′) indicating the utilization form of the word / phrase (WX) in the fixed part of the Japanese template in the read template data. It is determined whether or not to perform (S204). When determining whether or not the word (WX ′) exists, the information in the column for utilizing dictionary data and the Japanese language utilization table are used.
  • step S205 If it is determined in step S205 that it exists, the control unit 12 advances the process to step S206. On the other hand, when it determines with not existing in step S205, the control part 12 advances a process to step S208.
  • step S206 the control unit 12 determines whether or not a word / phrase that has not yet been read exists in the extracted word / phrase buffer 70. If it is determined in step S206 that it exists, the control unit 12 returns the process to step S203. On the other hand, if it is determined in S206 that it does not exist, the selection unit 23 stores the template data in the search result template buffer 71 (S207). As described above, the selection unit 23 selects template data that satisfies a certain condition from a plurality of template data, and stores the selected template data in the search result template buffer 71. Note that after step S207, the control unit 12 advances the processing to step S208.
  • step S208 the control unit 12 determines whether there is template data that has not yet been read in the template database 60. If it is determined in step S208 that it exists, the control unit 12 returns the process to step S202. On the other hand, if it is determined in step S208 that it does not exist, the control unit 12 advances the processing to step S13 in FIG.
  • control unit 12 extracts information related to the slot portion from the processed sentence storage buffer 75 for each of the above-described categories (that is, a label beginning with “&”), and the extracted data is a table in a predetermined format. (S403).
  • control unit 12 writes the character string after the “+” in the slot part for each language in the utilization information column of FIG. For example, the control unit 12 writes “v.ren1” of ⁇ 2: & VB_EAT + v.ren1 ⁇ in the utilization information column in the Japanese template, and ⁇ 2: & VB_EAT + in the utilization information column in the English template. ing ⁇ “ing” is written.
  • step S407 the control unit 12 determines whether data is written in the co-occurrence unit buffer 73 or not. If it is determined in step S407 that data has been written, the first replacement unit 24 executes the process of the co-occurrence unit (S408). And after step S408, the control part 12 advances a process to step S409. Details of step S408 will be described later.
  • step S409 the output sentence shaping unit 26 performs post-processing on the sentence example created by processing the slot part and the co-occurrence part. Details of the process will be described later. Examples of the sentence include sentence examples in Japanese, sentence examples in English, and sentence examples in Chinese. That is, the first replacement unit 24 and the output sentence shaping unit 26 create sentence examples corresponding to templates in each language.
  • Steps S604 and S605 will be described below with specific examples.
  • the dictionary search unit 40 writes the dictionary data including the phrase W14 (WX) in the temporary dictionary buffer 78 as shown in FIG.
  • FIG. 22 is a diagram showing dictionary data stored in the temporary dictionary buffer 78.
  • the English data written in the heading column is “drink”, and the Chinese data is the phrase W17. Therefore, in step S605, the slot replacing unit 41 writes “drink” and the word / phrase W17 in the English word / phrase column and the Chinese word / phrase column of the temporary word / phrase buffer 79, respectively, as shown in FIG.
  • FIG. 23 shows data stored in temporary word / phrase buffer 79.
  • step S606 the variation search unit 43 determines whether data is written in the utilization information column in the slot information (SX) written in the temporary slot buffer 80. If it is determined in step S606 that data has been written, the slot replacing unit 41 uses the utilization information and the data in the utilization column of the temporary dictionary buffer 78 and the Japanese utilization form table shown in FIG. 62 is used to change the word form of the word (WX) in the temporary word buffer 79 (S607). Further, in step S607, the slot replacing unit 41 changes the form of the English phrase and the Chinese phrase corresponding to the phrase (WX) in the temporary phrase buffer 79 using the utilization information. After step S607, the process proceeds to step S608.
  • FIG. 24 is a diagram showing the data after the word form change stored in the temporary word / phrase buffer 79.
  • the slot replacing unit 41 replaces ⁇ 2: & VB_EAT + v.ren1 ⁇ of the Japanese template shown in FIG. 17 with the word / phrase W33. Further, the slot replacing unit 41 replaces ⁇ 2: & VB_EAT + ing ⁇ of the English template shown in FIG. Further, the slot replacing unit 41 replaces ⁇ 2: & VB_EAT ⁇ of the Chinese template shown in FIG.
  • FIG. 25 is a diagram showing template data in the middle of the replacement process in the slot portion, which is stored in the processed sentence storage buffer 75.
  • step S612 the slot replacement unit 41 erases the flag indicating that all the slot information has been extracted. After step S612, the slot replacement unit 41 again extracts one piece of slot information from the slot portion buffer 72, and writes the extracted slot information in the temporary slot buffer 80 again (S613).
  • the slot replacement unit 41 determines whether or not a flag indicating that replacement processing has been performed is set in the extracted slot information (S614). If it is determined in step S614 that the flag is set, the control unit 12 advances the process to step S616. On the other hand, if it is determined in step S614 that the flag is not raised, the non-input location replacement unit 44 replaces the slot portion of the template of each language corresponding to the slot information with a predetermined word (S615). . Further, the control unit 12 writes the same word / phrase as the replaced word / phrase in the replacement word / phrase field of the slot information. Further, after step S615, the control unit 12 advances the process to step S616.
  • FIG. 29A is a flowchart showing the first half of the process flow of the co-occurrence unit.
  • FIG. 29B is a flowchart showing the latter half of the process flow of the co-occurrence unit.
  • the co-occurrence replacing unit 42 extracts one piece of the above-described co-occurrence information from the co-occurrence part buffer 73 and writes it to the temporary first co-occurrence buffer 81 (S801).
  • the co-occurrence replacing unit 42 first extracts the co-occurrence information related to “be_AUX” from the data in the co-occurrence unit buffer 73 shown in FIG. 19, and the co-occurrence information is temporarily stored as shown in FIG. Write to the first co-occurrence buffer 81.
  • the control unit 12 sets a flag (not shown) indicating that the co-occurrence replacing unit 42 has been extracted for the extracted co-occurrence information.
  • FIG. 30 is a diagram showing the co-occurrence information stored in the temporary first co-occurrence buffer 81. In the following, for convenience of explanation, the information written in the temporary first co-occurrence buffer 81 as described above is represented as co-occurrence information (CX).
  • CX co-occurrence information
  • step S801 the control unit 12 determines whether or not a priority processing flag is set in the co-occurrence information written in the temporary first co-occurrence buffer 81 (S802). If it is determined in step S802 that the priority process flag is set, the control unit 12 advances the process to step S803. On the other hand, if it is determined in step S802 that the priority process flag is not set, the control unit 12 advances the process to step S807. For example, for the co-occurrence information related to “be_AUX”, since the priority processing flag is not set as shown in FIG. 30, in this case, the control unit 12 advances the processing to step S808.
  • control unit 12 determines in step S802 that there is a priority processing flag, and as a result, the process is stepped. The process proceeds to S803.
  • step S804 the co-occurrence replacing unit 42 reads the co-occurrence relation data shown in FIG. 9B.
  • step S805 the co-occurrence replacing unit 42 writes the phrase in the temporary phrase buffer 79 based on the slot information shown in FIG. 32 and the read co-occurrence relation data.
  • the category (a type of label) to which the word / phrase W12 (see FIG. 7) to be replaced with slot information belongs is “& HUMAN-PRON_SUBJ (& HUMAN-SUBJ)”
  • the co-occurrence replacing unit 42 Write the character used when a label is specified as a condition.
  • step S809 the co-occurrence replacing unit 42 erases the flag indicating that all the co-occurrence information has been extracted.
  • the co-occurrence replacing unit 42 extracts one piece of co-occurrence information from the co-occurrence part buffer 73, and writes the extracted co-occurrence information in the temporary first co-occurrence buffer 81 (S810). .
  • step S817 will be explained before explanation of steps S812 to S816.
  • step S817 the co-occurrence replacing unit 42 determines whether there is co-occurrence information that has not yet been extracted. If it is determined in step S817 that co-occurrence information exists, the control unit 12 advances the process to step S810. On the other hand, when it is determined in step S817 that the co-occurrence information does not exist, the control unit 12 advances the processing to step S409.
  • the co-occurrence replacing unit 42 is based on the co-occurrence information (CX) written in the temporary first co-occurrence buffer 81 and the co-occurrence information (CHX) written in the temporary second co-occurrence buffer 82.
  • the co-occurrence relation correspondence data is read from the co-occurrence relation correspondence database (S814).
  • the co-occurrence replacing unit 42 writes the phrase to the temporary phrase buffer 79 based on the read co-occurrence relation correspondence data and the slot information (SX) written to the temporary slot buffer 80. (S815). Further, after step S815, the control unit 12 advances the process to step S816.
  • step S816 the co-occurrence replacing unit 42 replaces the co-occurrence part related to the co-occurrence information in the template stored in the processed sentence storage buffer 75 with the phrase stored in the temporary phrase buffer 79. Specifically, the co-occurrence replacing unit 42 replaces ⁇ -i: be_AUX + pres ⁇ of the English template shown in FIG. 34 with the above “is”. As a result, template data as shown in FIG. 39 is stored in the processed sentence storage buffer 75.
  • FIG. 39 is a diagram showing template data stored in the processed sentence storage buffer 75 in a state in which the co-occurrence portion replacement process has been completed.
  • step S409 the output sentence shaping unit 26 converts the phrase W35 (syllable) of the Japanese template in the template data shown in FIG. 39 stored in the processed sentence storage buffer 75 into the phrase W36 as shown in FIG. Change to (Syllable (Muddy sound of word W35)).
  • FIG. 40 is a diagram showing example sentence data stored in the processed sentence storage buffer 75.
  • the translation device 1 stores rules for formatting a sentence in this way. For example, after all variable parts are replaced, the sentence is formatted according to the rules.
  • this rule when the utilization form of the utilization verb shown by the phrase W19 (see FIG. 77) is the utilization form (that is, ren1) indicated by the phrase W26, the phrase W35 is immediately after the verb. Is changed to the word / phrase W36, and when the word immediately after the verb is the word / phrase W38 (syllable) shown in FIG. 77, it is changed to the word / phrase W39 (syllable (a muffled sound of the word / phrase W38)) shown in FIG.
  • a first replacement unit that replaces a variable part corresponding to a variable part that can be replaced with the matched word / phrase with a word / phrase in the second language corresponding to the matched word / phrase with respect to the template in the second language that has a corresponding relationship with the template 24.
  • the conventional apparatus that does not have a variable part and the translation apparatus 1 according to the present embodiment have the same number of templates, the number of sentence examples that can be created is clearly The number of translation apparatuses 1 according to the embodiment increases. For this reason, the translation apparatus 1 according to the present embodiment can select more accurate sentence examples than the conventional apparatus.
  • the translation device 1 is also configured to include at least the display control unit 25 that causes the output unit 11 to display an image based on the template in the second language after the replacement by the first replacement unit 24. Therefore, with this configuration, the user of the translation apparatus 1 can check the sentence example in the second language.
  • FIG. 43 is a diagram showing dictionary data stored in the dictionary database 61.
  • the dictionary data stores Japanese words and English words corresponding to the words in association with each other. Further, in the dictionary data, information related to the classifier is stored in association with each English phrase.
  • FIG. 44 is a flowchart showing a flow for creating an English sentence example using such template data and dictionary data.
  • the co-occurrence replacing unit 42 replaces the co-occurrence part “ ⁇ -i: DET_A ⁇ ” with “a” based on the reading of the determined phrase, It is determined whether to replace with “an” (S904). For example, in the case of the input example A, the co-occurrence replacing unit 42 determines to replace the co-occurrence part “ ⁇ -i: DET_A ⁇ ” with “a”. In the case of the input example B, the co-occurrence replacing unit 42 determines to replace the co-occurrence part “ ⁇ -i: DET_A ⁇ ” with “an”.
  • step S906 the co-occurrence replacing unit 42 uses the phrase determined as the replacement word in the co-occurrence part “ ⁇ -i # CLASSIFIER ⁇ ” and the replacement word in the co-occurrence part “ ⁇ -i: DET_A ⁇ ”. Replace each co-occurrence with the determined phrase. However, since “(NULL)” is a symbol that means nothing is written as described above, the co-occurrence replacing unit 42 deletes “ ⁇ i # CLASSIFIER”.
  • the word / phrase to be replaced in the slot portion has been described by taking as an example a configuration that can be determined independently between the slot portions. That is, for example, in FIG. 3, a configuration has been described in which any one of “ ⁇ 1: & HUMAN-SUBJ ⁇ ” and “ ⁇ 2: & VB_EAT + v.ren1 ⁇ ” can be determined first.
  • FIGS. 46 to 55 two examples of forming a co-occurrence relationship between the slot portions will be described with reference to FIGS. 46 to 55.
  • FIG. 46 shows the configuration of template data stored in the template database 60.
  • a Japanese template and an English template are shown.
  • the Japanese template includes two slot portions such as “ ⁇ 1: THIS-THAT ⁇ ” and “ ⁇ 2: GOODS ⁇ ”.
  • the English template includes two slot portions such as “ ⁇ 1-i: THIS-THAT ⁇ ” and “ ⁇ 2-i: GOODS ⁇ ”. Both slots of this English template are labeled with “-i”. That is, both slot portions have a co-occurrence relationship with each other.
  • FIG. 47 is a diagram showing an example of words / phrases replaced in the slot portion of the Japanese template in the template data shown in FIG. 47.
  • the input example A, the input example B, the input example C, and the input example D are replaced in slot portions such as “ ⁇ 1: THIS-THAT ⁇ ” and “ ⁇ 2: GOODS ⁇ ”, respectively.
  • This is an example of the phrase.
  • the slot portion “ ⁇ 1-i: THIS-THAT ⁇ ” is replaced with the phrase W40 (indicative pronoun), and the slot portion “ ⁇ 2-i: GOODS ⁇ ” is the phrase W41 (noun). The case where it is replaced is shown.
  • FIG. 48 is a diagram showing dictionary data stored in the dictionary database 61.
  • the dictionary data stores Japanese words and English words corresponding to the words in association with each other.
  • information related to plural forms of each word is stored in association with each word in English.
  • the slot replacing unit 41 determines whether or not the word / phrase to be replaced in the slot portion “ ⁇ 1-i: THIS-THAT ⁇ ” of the English template is plural (S1001).
  • the determination of whether or not the word is plural is made by referring to the dictionary database 61 by the slot replacing unit 41.
  • the dictionary database 61 stores information indicating that a phrase is singular or plural.
  • step S1004 the slot replacing unit 41 again determines whether or not the word / phrase to be replaced in the slot portion “ ⁇ 2-i: GOODS ⁇ ” of the English template has a plural form. If it is determined in step S1004 that there are plural forms, the slot replacing unit 41 determines whether the word / phrase to be replaced in the slot portion “ ⁇ 2-i: GOODS ⁇ ” of the English template is plural. (S1005). On the other hand, if it is determined in step S1004 that there is no plural form, the slot replacement unit 41 refers to the dictionary data, so that the slot portion “ ⁇ 1-i: THIS-THAT ⁇ ” of the English template. The words used in the above are converted into a singular form (S1006). After step S1006, the process proceeds to step S1008.
  • the slot replacement unit 41 is replaced in the slot portion “ ⁇ 2-i: GOODS ⁇ ” of the English template. Is determined to have plural forms.
  • the slot replacing unit 41 converts the slot part “ ⁇ 2-i: GOODS ⁇ ” into a singular form. Specifically, in the case of the input example C, there is no substantial change, but the slot replacing unit 41 converts “this” to “this”. In the case of the input example F, the slot replacing unit 41 converts “these” into “this”.
  • step S1005 the slot replacement unit 41 determines whether the input example B, the input example D, and the input example E out of the input example A, the input example B, the input example D, and the input example E. It is determined that the phrase to be replaced in ⁇ 2-i: GOODS ⁇ is plural. On the other hand, in the same step, for the input example A, the slot replacing unit 41 determines that the word / phrase replaced in the slot portion “ ⁇ 2-i: GOODS ⁇ ” is not plural.
  • step S1005 If it is determined in step S1005 that it is plural, the slot replacing unit 41 converts the word / phrase used in the slot portion “ ⁇ 1-i: THIS-THAT ⁇ ” of the English template into plural (S1007). . Then, after step S1007, the control unit 12 advances the process to step S1008. On the other hand, if it is determined in step S1005 that it is not a plural form, the control unit 12 advances the process to step S1008 without converting the word into a plural form.
  • FIG. 51 shows the configuration of template data stored in the template database 60.
  • a Japanese template and an English template are shown.
  • the Japanese template includes three slot portions such as “ ⁇ 1-i: NOUN ⁇ ”, “ ⁇ 2: NUM ⁇ ”, and “ ⁇ 3-i: CLASSIFIER ⁇ ”.
  • the English template includes three slot portions such as “ ⁇ 2-j: NUM ⁇ ”, “ ⁇ 3-j: CLASSIFIER ⁇ ”, and “ ⁇ 1-j: NOUN ⁇ ”.
  • a symbol such as “-j” indicating a co-occurrence relationship is added. That is, the three slot portions have a co-occurrence relationship with each other.
  • FIG. 52 is a diagram showing an example of words / phrases that are replaced in the slot portion of the Japanese template in the template data shown in FIG.
  • input example A and input example B are in slot portions such as “ ⁇ 1-i: NOUN ⁇ ”, “ ⁇ 2: NUM ⁇ ”, and “ ⁇ 3-i: CLASSIFIER ⁇ ”, respectively.
  • W42 noun
  • a slot portion such as “ ⁇ 2: NUM ⁇ ” is replaced with “2”
  • FIG. 53 is a diagram showing dictionary data stored in the dictionary database 61. As shown in the drawing, the dictionary data stores Japanese words and English words corresponding to the words in association with each other.
  • FIG. 54 is a flowchart showing a flow for creating an English sentence example using such template data and dictionary data.
  • the slot replacing unit 41 refers to the dictionary data, and according to the word / phrase replaced in the slot portion “ ⁇ 1-i: NOUN ⁇ ” of the Japanese template, the slot portion “ ⁇ 3-i: “CLASSIFIER ⁇ ” is selected as a replaceable word / phrase candidate (S1101). For example, in the case of the input example A shown in FIG. 52, the slot replacing unit 41 selects the word / phrase W43 and the word / phrase W41 (see FIG. 53) as the candidates. Further, in the case of the input example B shown in the figure, the slot replacing unit 41 selects the word / phrase W44 (noun) as the candidate.
  • step S1104 If it is determined in step S1104 that there is a translation, the slot replacing unit 41 converts the word / phrase of the slot portion “ ⁇ 3-j: CLASSIFIER ⁇ ” of the English template into a plural form (S1105). Then, after step S1105, the control unit 12 advances the process to step S1107. On the other hand, if it is determined in step S1104 that there is no translation, the slot replacement unit 41 converts the word / phrase of the slot portion “ ⁇ 2-j: NOUN ⁇ ” of the English template into a plural form (S1106). Then, after step S1106, the control unit 12 advances the process to step S1107.
  • the translation apparatus 1 generates an English sentence example in which each slot is replaced with a phrase for each of the input example A and the input example B.
  • FIG. 56 is a diagram showing a schematic configuration of translation apparatus 1A.
  • translation apparatus 1A includes an input unit 10, an output unit 11, a control unit 12A, a storage device 13A, and a memory 14A.
  • the translation device 1A is different from the translation device 1 having the control unit 12 and the storage device 13 in that the translation device 1A has the control unit 12A and the storage device 13A.
  • the storage device 13A stores a template database 60A, a dictionary database 61, a Japanese language utilization type table 62, a category database 63, a thesaurus data 64, and a co-occurrence relation database 65.
  • the memory 14A includes an extracted word buffer 70, a search result template buffer 71, a slot part buffer 72, a co-occurrence part buffer 73, a priority co-occurrence buffer 74, a processed sentence storage buffer 75, and a translation result buffer 76.
  • a decompressed data storage buffer (not shown), a process waiting buffer (not shown), and an element buffer (not shown) are provided.
  • step S2 The outline of the processing in the translation apparatus 1A is the same as the flowchart shown in FIG. However, the template search (step S2) processing in the translation apparatus 1A is different from the flowchart shown in FIG.
  • step S2115 translation apparatus 1A determines whether a label exists in the element. If it is determined that a label exists (YES in step S2115), in step S2117, translation apparatus 1A determines whether or not “()” is present in the read element. If it is determined that “()” exists (YES in step S2117), in step S2119, translation apparatus 1A first changes “(” to “ ⁇ ” and “)” in the element buffer. ⁇ ". Furthermore, in step S2119, translation apparatus 1A adds a slot number after “ ⁇ ”. On the other hand, when it is determined that “()” does not exist (NO in step S2117), translation apparatus 1A wraps the entire element with “()” in the element buffer and adds a slot number after “ ⁇ ”. To do.
  • FIG. 64 is a view showing another template data (hereinafter referred to as “template data (1971-1_2)”) after being stored in the processing waiting buffer.
  • the template data (1971-1_2) is data obtained by the translation apparatus 1 by rewriting the character string W47 of the template data (ID1971-1) using the word / phrase W49 (element).
  • FIG. 66 is a diagram showing the state of the element buffer after the element is written in the process of step S2113 for the second time.
  • translation apparatus 1A converts “(& VB_EXPLAIN + v.kanou)”, “(& VB_PRONOUNCE + v.kanou)”, and “(& VB_INTERPRET + v.kanou)” into the element buffer in Japanese. Write in the column. Also, the translation apparatus 1A writes “(& VB_EXPLAIN + inf) it in”, “(& VB_PRONOUNCE + inf) it in”, and “(& VB_INTERPRET + inf) it in” in the English column of the element buffer. The translation apparatus 1A performs the same processing for the Chinese column of the element buffer as for the Japanese column and the English column.
  • FIG. 67 is a diagram showing the state of the element buffer after the first processing in step S2117.
  • the translation apparatus 1A can generate a plurality of Japanese templates from the template TJ. Furthermore, the translation apparatus 1A can generate a plurality of English templates corresponding to the Japanese template from the template TE.
  • FIG. 80 shows a bilingual sentence generated using the template data (parallel translation template) shown in FIG. That is, FIG. 80 is a diagram in which the sentence indicated by the Japanese template in FIG. 79 is associated with the sentence indicated by the English template.
  • “translated sentence” means a sentence written in Japanese and a sentence written in English.
  • the “translation” is to indicate a translation corresponding to the original sentence.
  • translation apparatus 1 displays an original sentence W101 (first sentence) and a translated sentence W201 (second sentence) for the original sentence W101 on output unit 11.
  • FIG. 81 (b) is a diagram for explaining a case where the user selects the element W121 of the original text W101.
  • “element” refers to a part of a sentence.
  • the element is a concept including a phrase.
  • An element may be a single phrase.
  • the element W121 of the original sentence W101 includes a plurality of continuous words.
  • translation apparatus 1 changes the display mode of element W221 of translated sentence W201 corresponding to element W121 of original sentence W101.
  • the element W221 of the translated sentence W201 includes a plurality of continuous words.
  • the translation apparatus 1 displays the comment sentence W321 of the element W221 on the output unit 11.
  • FIG. 81 (c) is a diagram for explaining a case where the user selects the element W131 of the original text W101.
  • the element W131 of the original sentence W101 includes a plurality of consecutive words / phrases W131a and W131b.
  • translation apparatus 1 changes the display mode of element W231, phrase W232, and phrase W233 of translated sentence W201 corresponding to element W131 of original sentence W101.
  • the element W231 of the translated sentence W201 includes a plurality of continuous words.
  • the translation apparatus 1 displays commentary sentences W331, W332, and W333 on the output unit 11 for the element W231 and the words and phrases W232 and W233, respectively.
  • FIG. 82 (a) is a diagram showing the upper category data CD1 whose category ID is “01001”.
  • the upper category data CD1 includes information of a label name, expanded data, upper data, and an explanation sentence.
  • the expanded data includes a Japanese template (third template) and an English template (fourth template). That is, in the high-order category data, a Japanese template of expanded data (hereinafter also referred to as “first expanded template”) and an English template corresponding to the template (hereinafter also referred to as “second expanded template”). Associated with each other.
  • the label name of the upper category data CD1 is “TEMPL_NP-AND2”.
  • the label name is used as data (replacement data) for replacing the expanded data.
  • the Japanese template of the development data includes two variable parts and one fixed part.
  • the English template of the development data includes two variable parts and three fixed parts.
  • the variable parts “ ⁇ 1: & NOUN ⁇ ” and “ ⁇ 2: & NOUN ⁇ ” can be replaced by placing the words included in the category “& NOUN” in the thesaurus data (see FIG. 7) in the variable part. It is a good candidate.
  • “ ⁇ 1: & NOUN ⁇ ” and “ ⁇ 2: & NOUN ⁇ ” indicate that the part is replaced with a noun.
  • the upper data indicates the group to which the label name belongs.
  • the explanation text is a text explaining the expansion data associated with the label name. More specifically, the explanatory text indicates what grammatical meaning each replaced template has when the variable part of the Japanese template and the variable part of the English template in the development data are replaced. It is a sentence. For example, information such as “parallel expression of nouns” is included in the upper category data as an explanatory sentence.
  • the label name of the upper category data CD2 is “TEMPL_NP-COMPLETE”.
  • the Japanese template (third template) of the development data includes two variable parts and a plurality of fixed parts.
  • the expanded data English template (fourth template) includes two variable parts and two fixed parts.
  • the variable part “ ⁇ 1: & TEMPL_NP ⁇ ” indicates that a phrase included in a category such as “& TEMPL_NP” in the thesaurus data is a candidate that can be replaced in the variable part.
  • the variable part “ ⁇ 2: & NOUN ⁇ ” indicates that the part is replaced with a noun.
  • FIG. 82 (c) is a diagram showing the upper category data CD3 whose category ID is “02001”.
  • the upper category data CD3 includes information on the label name, the expanded data, the upper data, and the commentary, similarly to the upper category data CD1 and CD2.
  • the label name of the upper category data CD3 is “TEMPL_PLACE-VCL”.
  • the Japanese template (third template) of the expanded data includes one variable part and one fixed part.
  • the expanded data English template (fourth template) includes three variable portions.
  • the variable part “ ⁇ 1: & VIHECLE ⁇ ” indicates that a phrase included in a category such as “& VIHECLE” in the thesaurus data is a candidate that can be replaced in the variable part.
  • ⁇ i: LOC-PREP ⁇ ” and “ ⁇ i: DEF-DET ⁇ ” are co-occurrence portions that are one type of variable portion.
  • FIG. 83 is a diagram showing an example of words included in a category such as “& NOUN” in the thesaurus data.
  • the category includes, for example, a phrase included in a category such as “& WALLET”, a phrase included in a category such as “& TICKET”, and a phrase included in a category such as “& MONEY”.
  • FIG. 84 is a diagram showing co-occurrence relation data.
  • FIG. 84A shows the co-occurrence relation data KD1 with the label name “my_DET”.
  • the phrase for example, “I”
  • the co-occurrence relation data KD1 includes commentary information.
  • the commentary sentence is a sentence explaining the grammatical meaning of the characters used in the co-occurrence part. Specifically, contents such as “owned pronoun corresponding to the replacement word” are described as the commentary.
  • FIG. 85 is a diagram showing details of the change instruction unit 30 in the translation apparatus 1.
  • change instruction unit 30 includes a data generation unit 31, a detection unit 32, and a specification unit 33.
  • the specifying unit 33 includes a second replacement unit 331, a second extraction unit 332, a setting unit 333, a first determination unit 334, a third replacement unit 335, a second determination unit 336, and a third determination unit 337.
  • the detection unit 32 Based on the input via the input unit 10, the detection unit 32 detects that at least one phrase (for example, two or more consecutive phrases) included in a Japanese sentence (first sentence) has been selected. .
  • the detection unit 32 detects that the element W121 in FIG. 81B is selected by a pointing device such as the mouse 120.
  • the display control unit 25 changes the display mode of the corresponding phrase based on the identification of the corresponding phrase.
  • the second extraction unit 332 extracts the variable part phrase as a keyword from the selected phrase (element).
  • the setting unit 333 sets the extracted keyword combination and the extracted keyword alone as search candidates.
  • the first determination unit 334 determines, for each search candidate, for each first expansion template, whether or not the search candidate satisfies the condition indicated by the first expansion template.
  • the third replacement unit 335 replaces the variable part of the first development template with the search candidate keyword based on the first determination unit 334 determining that the above condition is satisfied. Also, the third replacement unit 335 replaces the variable part of the second development template with a word (English) corresponding to the search candidate based on the first determination unit 334 determining that the above condition is satisfied. .
  • the second determination unit 336 determines whether or not the first expansion template after replacement with the search candidate keyword matches at least a part of the selected word / phrase.
  • the second replacement unit 331 selects a portion corresponding to the second expansion template that has a corresponding relationship with the first expansion template corresponding to at least a part of the selected phrase from the data based on the English template in the processing data.
  • the label name associated with the first development template and the second development template (that is, the label name of the upper category data) is replaced.
  • the second replacement unit 331 selects a location corresponding to the first development template corresponding to at least a part of the selected word from the data based on the Japanese template in the processing data. Is replaced with the label name associated with (that is, the label name of the upper category data).
  • the second replacement unit 33 after the replacement by the third replacement unit 335, among the data based on the English template in the processing data based on the determination that the second determination unit 336 matches.
  • the location of the second development template corresponding to the first development template is replaced with the label name (replacement data).
  • the third determination unit 337 determines that the number of keywords used to set each search candidate is determined based on the determination that the search condition is not satisfied for each search candidate. It is determined whether or not there are a plurality.
  • setting unit 333 sets a combination of words in three words / phrases W401, W402, and W403 and words W401, W402, and W403 alone as search candidates.
  • the setting unit 333 sets a total of seven search candidates.
  • search candidate-1 a combination of the phrase W401, the phrase W402, and the phrase W403 is referred to as “search candidate-1”.
  • a combination of the phrase W401 and the phrase W402 is “search candidate-2”.
  • a combination of the word / phrase W401 and the word / phrase W403 is defined as “search candidate-3”.
  • a combination of the word / phrase W402 and the word / phrase W403 is “search candidate-4”.
  • the single word / phrase W401 is set as “search candidate-5”.
  • the single word W402 is set as “search candidate-6”.
  • the single word W403 is set as “search candidate-7”.
  • the combination of the three words shown as search candidate-1 does not match the type of the first expansion template (that is, the Japanese template of the expansion data) of the upper category data CD1. Further, the combination of the three words does not match the type of the first development template of the upper category data CD2 and CD3. Accordingly, the first determination unit 334 determines that the search candidate-1 does not satisfy the condition indicated by the first development template in each of the upper category data CD1, CD2, and CD3.
  • the third replacing unit 335 replaces each variable part of the first development template with each of the words W401 and W402 of the search candidate-2. Also, the third replacement unit 335 replaces each variable part of the second expansion template associated with the first expansion template with each word / phrase (that is, “ticket”, “money”) corresponding to the search candidate-2. To do.
  • the second replacement unit 331 Based on the determination that the second determination unit 336 matches, the second replacement unit 331 performs the following processing. Referring to FIG. 86 (d), the second replacement unit 331 corresponds to at least part of the element W121 (location shown in FIG. 86 (c)) among the data based on the English template in the processing data.
  • the location corresponding to the second development template (a ⁇ 3: ticket ⁇ and ⁇ 4: money ⁇ ) corresponding to the first development template (see FIG. 82 (a)) includes the label name of the upper category data CD1. Replace with ⁇ & TEMPL_NP-AND2 ⁇ ".
  • the second replacement unit 331 performs the same processing as the English template for the Japanese template in the processing data.
  • the first determination unit 334 determines that the search candidate-1 does not satisfy the condition indicated by the first development template in the upper category data CD2 and CD3.
  • search candidate-3, search candidate-4, search candidate-5, search candidate-6, and search candidate-7 are the same as search candidate-1. There is no need for processing. Therefore, the specifying unit 33 proceeds with the next processing based on the processing data shown in FIG.
  • the setting unit 333 resets search candidates based on the keyword extraction process performed again by the second extraction unit 332.
  • setting unit 333 sets a search candidate such as “TEMPL_NP-AND2” and word / phrase W403, a search candidate such as “TEMPL_NP-AND2”, and a search candidate such as word / phrase W403.
  • search candidate-11 a combination of “TEMPL_NP-AND2” and the word / phrase W403 is referred to as “search candidate-11”.
  • the single “TEMPL_NP-AND2” is set as “search candidate-12”.
  • the single word W403 is set as “search candidate-13”.
  • the first determination unit 334 first determines whether or not the search candidate 11 satisfies the condition indicated by the first development template in each of the upper category data CD1, CD2, and CD3 for the search candidate-11.
  • the combination of “TEMPL_NP-AND2” and the word / phrase W403 shown as the search candidate 11 does not match the type of the first expansion template of the upper category data CD1 and CD3.
  • the combination matches the type of the first expansion template of the upper category data CD2.
  • the second determination unit 336 determines that the first expansion template after replacement with “TEMPL_NP-AND2” of the search candidate-12 and the word / phrase W403 is at least a part of the processing data after replacement (see FIG. 86D). To determine whether or not. In this case, the second determination unit 336 determines that they match.
  • the second replacement unit 331 Based on the determination that the second determination unit 336 matches, the second replacement unit 331 performs the following processing. Referring to FIG. 86 (h), second replacement unit 331 selects “ ⁇ wallet ⁇ complete with ⁇ & TEMPL_NP-AND2 ⁇ ” as the label of upper category data CD2 among the data based on the English template in the processing data. Replace with " ⁇ & TEMPL_NP-COMPLETE ⁇ " containing the name. The second replacement unit 331 performs the same processing as the English template for the Japanese template in the processing data.
  • the specifying unit 33 proceeds with the next processing based on the processing data shown in FIG.
  • the second extraction unit 332 extracts “TEMPL_NP-COMPLETE” as a new keyword from the processing data (see FIG. 86 (h)). However, there is only one extracted keyword. For this reason, the specifying unit 33 performs the following processing without performing the above-described processing by the setting unit 333, the above-described processing by the first determination unit 334, and the like.
  • the identifying unit 33 identifies a location corresponding to “ ⁇ & TEMPL_NP-COMPLETE ⁇ ” in the English template (see FIG. 79) of the display data as the corresponding phrase.
  • “ ⁇ & TEMPL_NP-COMPLETE ⁇ ” corresponds to “ ⁇ wallet ⁇ complete with ⁇ & TEMPL_NP-AND2 ⁇ ” and “ ⁇ & TEMPL_NP-AND2 ⁇ ” to “a ⁇ 3: ticket ⁇ and ⁇ 4: money ⁇ ”
  • the identifying unit 33 identifies “ ⁇ 5: wallet ⁇ complete with a ⁇ 3: ticket ⁇ and ⁇ 4: money ⁇ ” as the corresponding phrase.
  • the display control unit 25 changes the display mode of the corresponding phrase. At this time, it is preferable from the viewpoint of visual effect that the display mode of the element W121 (FIG. 81 (b)) selected by the user is the same as the display mode of the corresponding phrase.
  • the display control unit 25 displays on the output unit 11 the explanatory text of the upper category data CD2 whose label name is “& TEMPL_NP-COMPLETE ⁇ ” shown in FIG.
  • the translation apparatus 1 can display the parallel translation shown in FIG. 81 (b) on the output unit 11. Therefore, the user can easily determine the phrase of the translation corresponding to the phrase (original phrase) selected by the user in the original sentence. Furthermore, since the translation apparatus 1 displays the explanatory text in association with the corresponding phrase, the user can confirm the explanatory text of the corresponding phrase.
  • the user can compose a sentence based on the parallel translation. That is, when there is a difference between the original sentence in the bilingual sentence (example sentence) and the original sentence of the content to be written, the user uses the translation device 1 to place the translated sentence corresponding to the difference (that is, the place to be replaced). Can be easily identified. For this reason, the user can create a desired sentence by replacing the portion with the translated word of the difference.
  • FIG. 87 is a diagram for explaining the operation of the translation apparatus 1 when the element W131 is selected from the original text W101 shown in FIG. 81 (c).
  • the second extraction unit 332 specifies the variable part in the selected element W131 in the processing data (see FIG. 79), and Extract words as keywords. That is, the second extraction unit 332 extracts the word / phrase W501 and the word / phrase W502 as keywords from the processing data.
  • setting unit 333 sets a combination of words in two words W501 and W502, and words W501 and W502 alone as search candidates. That is, the setting unit 333 sets a total of three search candidates.
  • search candidate-21 the combination of the phrase W501 and the phrase W502 is referred to as “search candidate-21”.
  • the single word W501 is set as “search candidate-22”.
  • the word W502 alone is set as “search candidate-23”.
  • the first determination unit 334 first determines whether or not the search candidate -21 satisfies the condition indicated by the first development template in each of the upper category data CD1, CD2, and CD3 for the search candidate -21.
  • the combination of the two words shown as the search candidate-21 does not match the type of the first expansion template (that is, the Japanese template of the expansion data) of the upper category data CD1. Further, the combination of the two words does not match the type of the first development template of the upper category data CD2 and CD3. Accordingly, the first determination unit 334 determines that the search candidate-1 does not satisfy the condition indicated by the first development template in each of the upper category data CD1, CD2, and CD3.
  • the first determination unit 334 performs the same processing for the search candidate -22 as for the search candidate -21.
  • the word / phrase W501 alone shown as the search candidate-22 does not match the type of the first expansion template of the upper category data CD1. Further, the phrase W501 alone does not match the type of the first expansion template of the upper category data CD2. Accordingly, the first determination unit 334 determines that the search candidate -22 does not satisfy the condition indicated by the first development template in the upper category data CD1 and CD2.
  • the first determination unit 334 determines that the search candidate-1 satisfies the condition indicated by the first development template in the upper category data CD3.
  • third replacing unit 335 replaces the variable part of the first expanded template with each word / phrase W501 of search candidate-22. Further, the third replacement unit 335 replaces the variable part (slot part) of the second development template associated with the first development template with each word / phrase (that is, “train”) corresponding to the search candidate ⁇ 22. .
  • the third replacement unit 335 replaces the other variable part (that is, the co-occurrence part) of the second development template using the co-occurrence relation data shown in FIGS. 84 (b) and 84 (c). . Specifically, the third replacement unit 335 replaces the slot part “1: & VIHECLE” with “train”, and therefore, based on the co-occurrence condition of FIG. 86 (c), the co-occurrence part “ ⁇ -i: LOC -PREP ⁇ "is replaced with” on ". Further, the third replacement unit replaces the co-occurrence portion “-i: DEF-DET” with “the” based on the co-occurrence condition of FIG. 86 (b).
  • the second determination unit 336 determines whether or not the first development template after replacement with the word / phrase W501 of the search candidate-22 matches at least a part of the selected element W131 (see FIG. 81C). to decide. In this case, the second determination unit 336 determines that they match.
  • the second replacement unit 331 Based on the determination that the second determination unit 336 matches, the second replacement unit 331 performs the following processing. Referring to FIG. 87 (d), the second replacement unit 331 corresponds to at least a part of the element W131 (location shown in FIG. 87 (c)) among the data based on the English template in the processing data.
  • the location corresponding to the second expansion template ( ⁇ -i: On ⁇ ⁇ -i: the ⁇ ⁇ 1-i: train ⁇ ) corresponding to the first expansion template (see FIG. 82 (c)) is the upper category data.
  • Replace with “ ⁇ & TEMPL_PLACE-VCL ⁇ ” containing the label name of CD1.
  • the second replacement unit 331 performs the same processing as the English template for the Japanese template in the processing data.
  • the second extraction unit 332 extracts “TEMPL_PLACE-VCL” (word / phrase) and word / phrase W502 as new keywords from the processing data (see FIG. 87 (d)). To do.
  • the setting unit 333 resets search candidates based on the keyword extraction process performed again by the second extraction unit 332.
  • setting unit 333 sets a search candidate such as “TEMPL_PLACE-VCL” and word / phrase W 502, a search candidate such as “TEMPL_PLACE-VCL”, and a search candidate such as word / phrase W 502.
  • search candidate-31 the combination of “TEMPL_PLACE-VCL” and the word / phrase W502 is referred to as “search candidate-31”.
  • a single “TEMPL_PLACE-VCL” is set as “search candidate-32”.
  • the single word / phrase W502 is set as “search candidate-33”.
  • the first determination unit 334 first determines whether or not the search candidate-31 satisfies the condition indicated by the first development template in each of the upper category data CD1, CD2, and CD3 for the search candidate-31. In this case, the combination of “TEMPL_PLACE-VCL” and the word / phrase W502 shown as the search candidate ⁇ 31 does not match the type of the first expansion template of the upper category data CD1, CD2, CD3.
  • the first determination unit 334 determines whether or not the search candidate -32 satisfies the condition indicated by the first development template in each of the upper category data CD1, CD2, and CD3 for the search candidate -32. Also in this case, “TEMPL_PLACE-VCL” shown as the search candidate ⁇ 32 does not match the type of the first expansion template of the upper category data CD1, CD2, CD3.
  • the first determination unit 334 determines whether or not the search candidate -33 satisfies the condition indicated by the first development template in each of the upper category data CD1, CD2, and CD3 for the search candidate -33. Also in this case, the word / phrase W502 indicated as the search candidate ⁇ 33 does not match the type of the first development template of the upper category data CD1, CD2, CD3.
  • the specifying unit 33 does not perform the replacement process by the third replacement unit 335 as shown in FIG. 87 (c).
  • the third determination unit 337 of the specifying unit 33 determines that each of the search candidate-31, the search candidate-32, and the search candidate-33 does not match the type of the first development template of the upper category data CD1, CD2, and CD3. Perform the following process. That is, the third determination unit 337 determines whether or not the number of keywords used to set each search candidate is plural. In the example of FIG. 87, since the number of keywords is two as shown in FIG. 87 (e), the third determination unit 337 determines that the number of keywords is plural.
  • the identifying unit 33 identifies the portion of the translation corresponding to each keyword as the corresponding phrase. Specifically, the specifying unit 33 specifies a location corresponding to “ ⁇ & TEMPL_PLACEP-VCL ⁇ ” and the word / phrase W502 in the English template (see FIG. 79) of the display data as the corresponding word / phrase.
  • ⁇ & TEMPL_PLACE-VCL ⁇ corresponds to “ ⁇ -i: LOC-PREP ⁇ ⁇ -i: DEF-DET ⁇ ⁇ 1: & VIHECLE ⁇ ”
  • the word / phrase W502 is “ ⁇ 2-j: I ⁇ ”
  • the specifying unit 33 performs “ ⁇ -i: On ⁇ ⁇ -i: the ⁇ ⁇ 1-i: train ⁇ ”, “ ⁇ 2-j: I ⁇ ”, And “ ⁇ -j: my ⁇ ” is identified as the corresponding phrase.
  • the display control unit 25 changes the display mode of the corresponding phrase.
  • the display control unit 25 performs display control based on the determination of the third determination unit 337. That is, based on the determination that there are a plurality of keywords, the display control unit 25 displays the translated parts corresponding to the keywords in different display modes for each keyword (see FIG. 81C). Specifically, the display control unit 25 displays “On the train” related to the keyword “TEMPL_PLACE-VCL” and “I” and “my” related to the keyword word W502 as different display modes in the output unit 11. Display. Further, the display control unit 25 performs the display mode changing process for the original sentence (Japanese) in the same manner as the translated sentence.
  • step S3001 translation apparatus 1 extracts keywords from the selected range.
  • step S3002 translation apparatus 1 generates a search candidate using the extracted keyword.
  • step S3003 the translation apparatus 1 selects one search candidate from the generated search candidates.
  • step S3004 the translation apparatus 1 searches the upper category data using the selected search candidate. That is, the translation apparatus 1 determines whether or not each selected search candidate satisfies the condition indicated by the first development template included in the upper category data for each upper category data. Extract upper category data.
  • step S3005 translation apparatus 1 selects one upper category data from the retrieved upper category data. For example, when translation apparatus 1 extracts a plurality of upper category data in step S3004, translation apparatus 1 selects one upper category data from the plurality of upper category data.
  • step S3008 translation apparatus 1 generates at least a part of the generated sentence (first expanded template after replacement) and the selected word or phrase, or processing data after replacement (for example, FIG. 86 (d)). Whether or not matches is determined.
  • step S3008 If translation apparatus 1 determines that they match in step S3008 (YES in step S3008), it translates the bilingual example sentence in the processing data in step S3011. That is, translation apparatus 1 performs the above-described replacement process by second replacement unit 331.
  • step S3012 translation apparatus 1 updates selection data to be processed. For example, the translation apparatus 1 updates the selection data to be processed from the selection data shown in FIG. 86 (a) to the selection data shown in FIG. 86 (e).
  • step S3008 If translation apparatus 1 determines that there is no match in step S3008 (NO in step S3008), translation apparatus 1 determines in step S3009 whether there is unselected upper category data.
  • step S3010 determines that it exists in step S3010 (YES in step S3010), it selects one search candidate from unselected search candidates in step S3014. If translation apparatus 1 determines that it does not exist in step S3010 (NO in step S3010), it advances the process to step S303 in FIG.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

 ユーザが選択した原文の範囲と対応関係にある翻訳文の範囲を、ユーザが確認可能な翻訳装置(1)を提供する。翻訳装置(1)は、対訳テンプレートを用いて第1言語による第1文を第2言語による第2文に翻訳する。翻訳装置(1)は、第1文と第2文とを出力部(11)に表示させる表示制御部(25)と、第1文に含まれる1つまたは複数の語句が選択されたことを検知する検知部(32)と、少なくとも対訳テンプレートに基づいて、第2文に含まれる、選択された語句に対応する複数の対応語句を特定する特定部(33)とを備える。表示制御部(25)は、対応語句が特定されたことに基づき、当該対応語句の表示態様を変更する。

Description

情報処理装置、表示制御方法、およびプログラム
 本発明は、対訳文を表示可能な情報処理装置、表示制御方法、およびプログラムに関する。
 従来、第1言語の単語を入力すると、第2言語での対応する単語、複合語ないしは例文などを表示する電子式辞書が知られている。
 特開昭64-15867号公報(特許文献1)には、当該電子式辞書として、後述する機能を有する、入力手段、記憶手段、検索手段、表示手段、および制御手段を備える構成が開示されている。入力手段は、第1言語を入力する。記憶手段は、第2言語の情報を格納する。検索手段は、入力された第1言語の単語に対応する第2言語の単語を含む句または分なる情報を読み出す。表示手段は、検索された情報を表示する。制御手段は、表示手段による第2言語による句または文の表示中の第1言語対応の第2言語による単語を強調表示させる。
 より具体的には、特許文献1の電子式辞書では、入力した第1言語による単語(入力単語)の英訳単語を含む英語の例文等を表示するとともに、入力単語に対応する英訳単語部分を強調表示する。
 また、従来、既知の翻訳文とその原文との組からなる対訳文と、対訳辞書とに基づいて、計算機により、他の翻訳文を生成する翻訳支援装置が知られている。
 特開平1-207873号公報(特許文献2)には、当該翻訳支援装置として、後述する機能を有する、単語切り出し処理部、変更単語入力処理部、訳語決定処理部、および翻訳文書き換え処理部とを備えた構成が開示されている。単語切り出し処理部は、対訳文における原文中において指定された位置に基づき、原文中の単語を切り出すとともに、それに対応する翻訳文における単語を切り出す。変更単語入力処理部は、原文の言語により、変更する新しい単語を入力する。訳語決定処理部は、入力された単語に対応する訳語を、対訳辞書を用いて決定する。翻訳文書き換え処理部は、決定された訳語を、単語切り出し処理部により切り出した翻訳文の単語の位置に設定する。
特開昭64-15867号公報 特開平1-207873号公報
 特許文献1の電子式辞書は、文(原文)を翻訳する翻訳装置ではない。このため、特許文献1の電子式辞書は、第1言語による文(原文)と当該原文の訳文である第2言語による翻訳文とを含む対訳文において、原文に含まれる語句に対応する翻訳文の語句を特定することはできない。
 また、特許文献2の翻訳支援装置では、第1言語による文(原文)と当該原文の訳文である第2言語による翻訳文とを含む対訳文において、原文に含まれる1つの単語に対応する翻訳文の単語を特定することができる。しかしながら、当該翻訳支援装置は、原文における連続する2つ以上の単語(語句)を切り出すことはできない。
 本願発明は上記問題点に鑑みなされたものであって、その目的は、ユーザが選択した原文の範囲と対応関係にある翻訳文の範囲を、ユーザが確認可能な情報処理装置、表示制御方法、およびプログラムを提供することにある。
 本発明のある局面に従うと、情報処理装置は、対訳テンプレートを用いて第1言語による第1文を第2言語による第2文に翻訳する情報処理装置であって、第1文と第2文とを表示装置に表示させる表示制御部と、第1文に含まれる1つまたは複数の語句が選択されたことを検知する検知部と、少なくとも対訳テンプレートに基づいて、第2文に含まれる、選択された語句に対応する複数の対応語句を特定する特定部とを備える。表示制御部は、対応語句が特定されたことに基づき、当該対応語句の表示態様を変更する。
 好ましくは、対訳テンプレートは、第1言語による第1テンプレートと当該第1テンプレートと対応関係にある第2言語による第2テンプレートとを含み、第1テンプレートと第2テンプレートとは、所定の語句で構成された固定部と予め定められた複数の語句のうちの何れかの語句に置換可能な可変部とをそれぞれ対応する位置に含む。情報処理装置は、第1言語による第3テンプレートと、当該第3テンプレートと対応関係にある第2言語による第4テンプレートとを互いに関連付けた関連付けデータを複数格納した記憶装置をさらに備える。各第3テンプレートは、2つ以上の可変部、あるいは少なくとも1つの可変部と少なくとも1つの固定部とを含む。特定部は、対訳テンプレートと関連付けデータとに基づいて、対応語句を特定する。
 好ましくは、関連付けデータは、各々、第3テンプレートおよび第4テンプレートに関連付けて置換用データをさらに格納している。特定部は、複数の第3テンプレートのうち選択された語句の少なくとも一部と対応関係にある第3テンプレートと、当該第3テンプレートと対応関係にある第4テンプレートと、当該第3テンプレートおよび当該第4テンプレートと関連付けられた置換用データとに基づいて、対応語句を特定する。
 好ましくは、情報処理装置は、第1テンプレートの可変部と第2テンプレートの可変部とを予め定められた複数の語句のうちの何れかの語句で置換する第1置換部と、置換に基づき、第1文と第2文とを表示装置に表示させるための表示用データとは異なる、対応語句の表示態様を変更するための処理用データとを生成する生成部をさらに備える。特定部は、処理用データにおける第2テンプレートに基づくデータのうち、選択された語句の少なくとも連続する一部に対応する第3テンプレートと対応関係にある第4テンプレートに対応する箇所を、当該第3テンプレートおよび当該第4テンプレートと関連付けられた置換用データに置換する第2置換部をさらに含む。少なくとも、処理用データにおいて置換用データに置換された箇所に対応する第2文の箇所を、対応語句として特定する。表示制御部は、特定された第2文の箇所の表示態様を変更する。
 好ましくは、特定部は、選択された語句から、可変部の語句をキーワードとして抽出する抽出部と、抽出したキーワードの組み合わせ、および抽出したキーワード単体を検索候補に設定する設定部と、各検索候補について、第3テンプレートが示す条件を当該検索候補が満たしているか否かを、第3テンプレート毎に判断する第1判断部と、条件を満たしていると判断されたことに基づき、第3テンプレートの可変部を検索候補のキーワードで置換する第3置換部と、検索候補のキーワードで置換した後の第3テンプレートが、選択された語句の少なくとも一部と一致するか否かを判断する第2判断部とをさらに備える。第2置換部は、第2判断部により一致していると判断されたことに基づき、処理用データにおける第2テンプレートに基づくデータのうち、置換後の第3テンプレートと対応関係にある第4テンプレートの箇所を、置換用データに置換する。
 好ましくは、第2置換部が第4テンプレートの箇所を置換用データに置換した後に、抽出部は、当該置換用データと、キーワードのうち置換後の第3テンプレートに含まれていないキーワードとを、新たにキーワードとして抽出する。情報処理装置は、新たに抽出したキーワードに基づき、設定部による設定と、第1判断部による判断と、第3置換部による置換とを再度行なう。第2判断部は、第3置換部による再度の置換に基づき、当該置換後の第3テンプレートが、置換用データで置換された後の処理用データにおける第2テンプレートの少なくとも一部と一致するか否かを判断する。第2置換部は、第2判断部により一致していると判断されたことに基づき、再度、処理用データにおける第2テンプレートに基づくデータのうち、置換後の第3テンプレートと対応関係にある第4テンプレートの箇所を、置換用データに置換する。
 好ましくは、特定部は、第1判断部による判断の結果、各検索候補について条件を満たしていないと判断されたことに基づき、当該各検索候補を設定するために用いたキーワードの個数が複数であるか否かを判断する第3判断部をさらに含み、少なくとも、当該各キーワードに対応する第2文の箇所を、対応語句として特定する。表示制御部は、キーワードが複数であると判断されたことに基づき、キーワードに応じた第2文の箇所を、キーワード毎に互いに異なる表示態様で表示させる。
 好ましくは、関連付けデータは、各々、第3テンプレートの内容を解説する解説文をさらに格納している。表示制御部は、解説文を対応語句に対応付けて表示させる。
 本発明の他の局面に従うと、表示制御方法は、対訳テンプレートを用いて第1言語による第1文を第2言語による第2文に翻訳する情報処理装置における表示制御方法であって、情報処理装置のプロセッサが、第1文と第2文とを表示装置に表示させるステップと、プロセッサが、第1文に含まれる1つまたは複数の語句が選択されたことを検知するステップと、プロセッサが、少なくとも対訳テンプレートに基づいて、第2文に含まれる、選択された語句に対応する複数の対応語句を特定するステップと、プロセッサが、対応語句が特定されたことに基づき、当該対応語句の表示態様を変更するステップとを備える。
 本発明のさらに他の局面に従うと、プログラムは、対訳テンプレートを用いて第1言語による第1文を第2言語による第2文に翻訳する情報処理装置において実行されるプログラムであって、プログラムは、第1文と第2文とを表示装置に表示させるステップと、第1文に含まれる1つまたは複数の語句が選択されたことを検知するステップと、少なくとも対訳テンプレートに基づいて、第2文に含まれる、選択された語句に対応する複数の対応語句を特定するステップと、対応語句が特定されたことに基づき、当該対応語句の表示態様を変更するステップとを情報処理装置に実行させる。
 ユーザが選択した原文の範囲と対応関係にある翻訳文の範囲を、ユーザが確認可能となるといった効果を奏する。
本発明の実施の形態に係る翻訳装置の概略構成を示した図である。 上記翻訳装置の記憶装置に記憶されているデータを示した図である。 上記記憶装置に記憶されたテンプレートデータベースに含まれるテンプレートデータの構成を示した図である。 上記記憶装置に記憶された辞書データベースに含まれる辞書データの構成を示した図である。 上記記憶装置に記憶された日本語活用形テーブルを示した図である。 上記記憶装置に記憶されたカテゴリデータベースに含まれるカテゴリデータの構成を示した図である。 上記記憶装置に記憶されたシソーラスデータの階層構造の一部を示した図である。 上記カテゴリデータベースに含まれる他のカテゴリデータの構成を示した図である。 上記記憶装置に記憶された共起関係データベースに含まれる共起関係データの構成を示した図である。 上記記憶装置に記憶された共起関係データベースに含まれる他の共起関係データの構成を示した図である。 翻訳装置のメモリ内の各バッファを示した図である。 上記翻訳装置の具体的構成の一態様を示した図である。 上記翻訳装置における処理の概略を示したフローチャートである。 テンプレート検索における処理の流れを示したフローチャートである。 抽出語句バッファに記憶されるデータの構成を示した図である。 文例作成処理における処理の流れを示したフローチャートである。 テンポラリテンプレートバッファに記憶されたテンポラリテンプレートデータの構成を示した図である。 処理文格納バッファに記憶されたテンプレートデータを示した図である。 スロット部用バッファに記憶されたデータを示した図である。 共起部用バッファに記憶されたデータを示した図である。 テンプレートデータのスロット部の処理フローにおける前半の処理フローを示したフローチャートである。 テンプレートデータのスロット部の処理フローにおける後半の処理フローを示したフローチャートである。 テンポラリスロットバッファに記憶されたスロット情報の構成を示した図である。 テンポラリ辞書バッファに記憶された辞書データを示した図である。 テンポラリ語句バッファに記憶されたデータを示した図である。 上記テンポラリ語句バッファに記憶された、語形変化を行った後のデータを示した図である。 上記処理文格納バッファに記憶された、スロット部における置換処理の途中状態のテンプレートデータを示した図である。 上記スロット部用バッファに記憶された、スロット部における置換処理の途中状態のスロット情報を示した図である。 上記処理文格納バッファに記憶された、スロット部の置換処理が完了した状態におけるテンプレートデータを示した図である。 上記スロット部用バッファに記憶された、スロット部の置換処理が完了した状態におけるスロット情報を示した図である。 テンプレートデータの共起部の処理フローにおける前半の処理フローを示したフローチャートである。 テンプレートデータの共起部の処理フローにおける後半の処理フローを示したフローチャートである。 テンポラリ第1共起バッファ81に記憶された共起情報を示した図である。 テンポラリ第1共起バッファ81に記憶された他の共起情報の構成を示した図である。 上記テンポラリスロットバッファに記憶されたスロット情報の構成を示した図である。 上記テンポラリ語句バッファに記憶されたデータを示した図である。 上記処理文格納バッファに記憶された、共起部における置換処理の途中状態のテンプレートデータを示した図である。 優先共起バッファに記憶された共起情報を示した図である。 上記テンポラリスロットバッファに記憶されたスロット情報を示した図である。 テンポラリ第2共起バッファに記憶された共起情報を示した図である。 上記テンポラリ語句バッファに記憶された語句を示した図である。 上記処理文格納バッファに記憶された、共起部の置換処理が完了した状態におけるテンプレートデータを示した図である。 上記処理文格納バッファに記憶された文例データを示した図である。 テンプレートデータベースに記憶されているテンプレートデータの構成を示した図である。 図41のテンプレートデータにおける日本語テンプレートのスロット部において置換される語句の例を示した図である。 辞書データベースに記憶されておる辞書データを示した図である。 英語の文例を作成する際のフローを示したフローチャートである。 生成された英語テンプレートの構成を示した図である。 テンプレートデータベースに記憶されているテンプレートデータの構成を示した図である。 図46に示したテンプレートデータにおける日本語テンプレートのスロット部において置換された語句の例を示した図である。 辞書データベースに記憶されておる辞書データを示した図である。 英語の文例を作成する際のフローを示したフローチャートである。 生成された英語テンプレートの構成を示した図である。 テンプレートデータベース60に記憶されているテンプレートデータの構成を示した図である。 図51に示したテンプレートデータにおける日本語テンプレートのスロット部において置換される語句の例を示した図である。 辞書データベースに記憶されておる辞書データを示した図である。 英語の文例を作成する際のフローを示したフローチャートである。 生成された英語テンプレートの構成を示した図である。 他の翻訳装置の概略構成を示した図である。 他のテンプレートデータベースに含まれる一つのテンプレートデータの構成を示した図である。 テンプレート検索における前半の処理の流れを示したフローチャートである。 テンプレート検索における後半の処理の流れを示したフローチャートである。 図58におけるステップS2001の詳細の一部を示したフローチャートである。 図58におけるステップS2001の詳細の残りの部分を示したフローチャートである。 1度目のステップS2113の処理において、要素が書き込まれた後の要素バッファの状態を示した図である。 処理待ちバッファに格納した後の1つのテンプレートデータを示した図である。 処理待ちバッファに格納した後の他のテンプレートデータを示した図である。 処理待ちバッファに格納した後のさらに他のテンプレートデータを示した図である。 2度目のステップS2113の処理において、要素が書き込まれた後の要素バッファの状態を示した図である。 1度目のステップS2117の処理を行なった後の、要素バッファの状態を示した図である。 図63のテンプレートデータを、図67に示す要素1を用いて書き換えたテンプレートデータを示した図である。 図63のテンプレートデータを、図67に示す要素2を用いて書き換えたテンプレートデータを示した図である。 図63のテンプレートデータを、図67に示す要素3を用いて書き換えたテンプレートデータを示した図である。 図64のテンプレートデータを、図67に示す要素1を用いて書き換えたテンプレートデータを示した図である。 図64のテンプレートデータを、図67に示す要素2を用いて書き換えたテンプレートデータを示した図である。 図64のテンプレートデータを、図67に示す要素3を用いて書き換えたテンプレートデータを示した図である。 図65のテンプレートデータを、図67に示す要素1を用いて書き換えたテンプレートデータを示した図である。 図65のテンプレートデータを、図67に示す要素2を用いて書き換えたテンプレートデータを示した図である。 図65のテンプレートデータを、図67に示す要素3を用いて書き換えたテンプレートデータを示した図である。 日本語の文、日本語の語句、または中国語の語句を示した図である。 テンプレートデータベースに含まれる一つのテンプレートデータの構成を示した図である。 図78のテンプレートデータの可変部を置換した後における、処理文格納バッファに記憶された文例データを示した図である。 図78に示したテンプレートデータを用いて生成された対訳文である。 ユーザが、マウスなどのポインティングデバイスを用いて、原文における少なくとも1つの語句を選択した場合に、翻訳装置が行なう処理を説明するための図である。 記憶装置に格納された複数の上位カテゴリデータのうち、3つの上位カテゴリデータを示した図である。 シソーラスデータにおける「&NOUN」といった区分に含まれる語句の一例を示した図である。 共起関係データを示した図である。 翻訳装置における変更指示部の詳細を示した図である。 図81(b)に示す文から要素を選択した場合における翻訳装置の動作を説明するための図である。 図81(c)に示す文から要素を選択した場合における翻訳装置の動作を説明するための図である。 翻訳装置で行なわれる処理を示したフローチャートである。 図88のステップS302の詳細を示したフローチャートである。
 本実施の形態では、日本語で入力された文を、英語および中国語に翻訳する場合を例に挙げて説明する。なお、本発明は、これに限定されず、ある言語で入力された文を他の言語に翻訳する構成であれば、適用可能である。
 日本語には「活用」といった概念がある。「活用」とは、単語が文中でその語の文法的機能や他の語への続き方に応じて、語形を変化させることをいう。また、活用する語の変化形を、「活用形」という。また、用語が活用する際に変化する語末の部分(つまり語幹以外の部分)を、「活用語尾」(inflected suffix)という。
 以下では、「<<1.翻訳装置の一般的機能>>」と、「<<2.翻訳装置の具体的機能>>」とに分けて説明する。なお、「一般的機能」とは、「具体的機能」を説明するための前提となる機能をいう。具体的機能を実現するために、必ずしも、後述する一般的機能を全て具備する必要はない。
 本発明に係る翻訳装置の一実施の形態について、図1から図89に基づいて説明すると、以下のとおりである。
 <<1.翻訳装置の一般的機能>>
 図1は、本発明の実施の形態に係る翻訳装置1の概略構成を示した図である。
 翻訳装置1は、同図に示すとおり、入力部10と、出力部11と、制御部12と、記憶装置13と、メモリ14とを備えている。
 入力部10は、ユーザからの入力を受け付けるための入力デバイスである。入力部10を介してユーザが文の入力を行なうことにより、メモリ14に当該入力された文が記憶される。
 出力部11は、制御部12からの指示に基づき、入力部10を介して入力されたデータ、および制御部12における各種の処理の結果を表示するためのデバイスである。
 制御部12は、同図に示すとおり、第1抽出部20と、データ読出部21と、判定部22と、選択部23と、第1置換部24と、表示制御部25と、出力文整形部26と、変更指示部30とを備えている。また、第1置換部24は、辞書検索部40と、スロット置換部41と、共起置換部42と、変化形探索部43と、未入力箇所置換部44とを備えている。
 なお、制御部12および制御部12内の各部は機能ブロックであり、これらのブロックにおける処理は、後述するCPU(Central Processing Unit)により実行されるソフトウェアによって実現される。
 第1抽出部20は、入力部10を介して日本語(第1言語)で入力された文から、所定の規則にしたがって語句を抽出する。例えば、日本語による文W11(図77参照)が入力部10を介して入力された場合、第1抽出部20は、例えば形態素解析を行なうことにより、語句W12(名詞)、語句W13(名詞)、および語句W14(動詞)といった3つの語句(形態素)を抽出する。なお、図77は、日本語の文、日本語の語句、または中国語の語句を示した図である。
 ここで、語句とは語や句を意味し、語句の中には単語(一般に文を構成する最小単位で、特定の意味や文法上の職能を有するものと定義されているもの)や複合語(一般に2個以上の語が結び付いて1つの意味を表すものと定義されているもの)等も含まれる。
 データ読出部21は、所定の指示を受けた場合、記憶装置13に記憶された各種のデータを読み出す。例えば、データ読出部21は、後述するテンプレートデータを記憶装置13から読み出す。
 判定部22は、入力部10を介して日本語で入力された文に含まれる語句が、後述する語句と一致するかを判定する。なお、判定部22における判定方法の詳細については後述する。
 選択部23は、判定部22の判定結果に基づいて、記憶装置13に記憶された日本語による複数のテンプレートの中から、少なくとも一つのテンプレートを選択する。
 第1置換部24は、後述する置換処理を行なうことにより、上記選択されたテンプレートを用いて日本語による文例を作成する。さらに、第1置換部24は、記憶装置13に記憶された、上記選択されたテンプレートと対応関係にある英語(第2言語)および中国語(第2言語)によるテンプレートを用いて、英語および中国語による文例を作成する。なお、第1置換部24が行なう処理の詳細と、第1置換部24に含まれる各部(40~43)が行なう処理とについては後述する。なお、文例とは、後述するテンプレートデータの可変部を語句に置換し終えることにより、得られる文をいう。
 表示制御部25は、出力部11に対して、入力部10を介して入力されたデータ、および翻訳装置1における各種の処理の結果を表示させる。なお、出力文整形部26については、後述する。
 図2は、記憶装置13に記憶されているデータを示した図である。
 記憶装置13は、同図に示すとおり、テンプレートデータベース60と、辞書データベース61と、日本語活用形テーブル62と、カテゴリデータベース63と、シソーラスデータ64と、共起関係データベース65とを記憶している。
 テンプレートデータベース60は、後述するテンプレートデータを一つ以上含んでいる。また、辞書データベース61は、後述する辞書データを含んでいる。また、カテゴリデータベース63は、後述するカテゴリデータを一つ以上含んでいる。共起関係データベース65は、後述する共起関係データを一つ以上含んでいる。
 図3は、上記テンプレートデータベース60に含まれる一つのテンプレートデータの構成を示した図である。同図に示すとおり、テンプレートデータは、テンプレートIDと、日本語によるテンプレート(以下、日本語テンプレート)と、英語によるテンプレート(以下、英語テンプレート)と、中国語によるテンプレート(以下、中国語テンプレート)とを含んでいる。
 上記テンプレートIDは、テンプレートデータを他のテンプレートデータと識別する識別子である。なお、テンプレートIDは、テンプレートデータ毎に固有の番号が与えられている。
 上記日本語テンプレートは、所定の語句で構成された固定部と、予め定められた複数の語句のうちの何れかの語句に置換可能な可変部とを含んでいる。同図においては、語句W15(postpositional word functioning as an auxiliary to a main word)と、文W16とが固定部に該当し、{1:&HUMAN-SUBJ}と{2:&VB_EAT+v.ren1}とが可変部に該当する。
 上記英語テンプレートは、日本語テンプレートと同様に、固定部と可変部とを含んでいる。同図においては、「What」と「?」とのが固定部に該当し、{-i:be_AUX+pres}と{-i:#DET_MY-NULL}と{1-i:&HUMAN-SUBJ}と{2:&VB_EAT+ing}とが可変部に該当する。
 また、可変部の種類として、第1可変部と第2可変部とがある。同図においては、英語テンプレート中の「1」や「2」といった数字で始まる{1-i:&HUMAN-SUBJ}と{2:&VB_EAT+ing}とが第1可変部に該当し、「-i」で始まる{-i:be_AUX+pres}と{-i:#DET_MY-NULL}とが第2可変部に該当する。なお、以下では、説明の便宜上、第1可変部をスロット部と、第2可変部を共起部と称する。
 なお、各言語のテンプレートにおいて、「-i」が含まれている可変部は、当該可変部同士の間において共起関係があることを示している。ここで、共起関係とは、一方が決定すると他方が決定するといった関係、あるいは、一方を仮に決定しても他方との関係で当該決定内容を変更せざるを得ないような、言わば両方を共に決定していくような関係をいう。
 上記中国語テンプレートについても、同図に示すとおり、日本語テンプレートと英語テンプレートと同様に、固定部と可変部とを含んでいる。
 以上のように、日本語テンプレートと英語テンプレート(あるいは中国語テンプレート)とは、対応する位置に、それぞれ、所定の語句で構成された固定部と、予め定められた複数の語句のうちの何れかの語句に置換可能な可変部とを含んだ構成である。
 また、以下では、可変部の「1」や「2」といった先頭の数字をスロット番号と称する。また、各可変部において、「:」よりも前の文字と「+」よりも後ろの文字とを除いた部分(同図の場合には、「be_AUX」と「#DET_MY-NULL」と「&HUMAN-SUBJ」と「&VB_EAT」)をラベル(所定の識別標識)と称する。また、上記ラベルのうちスロット部に関する各ラベル(「&」で始まるラベル)を、それぞれ1つのカテゴリとする。
 なお、上記スロット部と共起部との詳細については、後述する。
 図4は、辞書データベース61に含まれる一つの辞書データの構成を示した図である。同図に示すとおり、辞書データにおいては、辞書IDと、見出しと、品詞と、活用と、助数詞コードと、意味コードとが対応付けられている。
 上記辞書IDの欄には、辞書データを他の辞書データと区別するための識別子(ID)が記載されている。また、上記見出しの欄には、日本語の語句である語句W14(動詞)と、当該語句に対応する英語の語句「drink」と中国語の語句である語句W17(動詞)とが記されている。さらに、上記品詞の欄には、見出しの品詞が記載されている。また、上記活用の欄には、上記各言語について上記語句の活用形に関する情報が記載されている。語句W18の意味は、語句W14が、語句W19(図77参照)が示す活用(five-tire conjugation in the ”ma” column of the kana syllabary)であることを示している。意味コードについては、後述する。
 また、同図に示すとおり、日本語の語句に対して、英語の語句と中国語の語句とがそれぞれ一つだけ対応付けられている。
 図5は、上記日本語活用形テーブル62を示した図である。日本語活用形テーブル62には、活用の種類(例えば、語句W20(図77参照)が示す活用(five-tire conjugation of a Japanese consonant-stem verb)、語句W21が示す活用(conjugation of a vowel-stem verb ending in ”-eru”))と、当該活用における各活用形(例えば、語句W22として示した活用形(form of a verb preceding ”nai”)、語句W23として示した活用形(attributive form of a verb))で用いられる語句(例えば、語句W24(inflected suffix)、語句W25(inflected suffix))とが記載されている。なお、同図には、一例として、語句W19が示す活用(つまり語句W18(図4参照))における各活用の語句を記している。また、例えば語句W26として示した活用形(continuative form of a verb)の語句には、「ren1」といった省略形の記号を対応付けている。
 図6は、上記カテゴリデータベースに含まれる一つのカテゴリデータの構成を示した図である。同図に示すとおり、カテゴリデータにおいては、カテゴリIDとラベル名と意味コードと代表値とが対応付けてられている。
 上記カテゴリIDの欄には、カテゴリデータを他のカテゴリデータと区別するための識別子が記載されている。ラベル名の欄には、テンプレートデータ(例えば、図3のテンプレートデータ)の可変部に含まれるラベルが記されている。なお、代表値については後述する。
 図7は、シソーラスデータの階層構造の一部を示した図である。ここで、シソーラスとは、単語の上位/下位関係、部分/全体関係、同義関係、類義関係などによって単語を分類し、体系付けた辞書(語彙集)をいう。
 まず、上記意味コードは上記ラベルに対応付けられている。例えば、同図においては、「120201」といった意味コードは、「&HUMAN-PRON_SUBJ」といったラベルに対応付けられている。
 ここで、ラベル名として「&HUMAN-PRON_SUBJ」が与えられ、かつ意味コードとして「120201」が与えられたカテゴリデータに関しては、同図における「&HUMAN-PRON_SUBJ (120201)」といった区分(所定の区分)に含まれるの語句が、当該カテゴリデータに含まれる語句として特定される。例えば、日本語の語句については、語句W27(名詞)、語句W28(名詞)、および語句W12が特定される。
 ここで、図6に戻り、代表値について説明する。同図に示したように、ラベル「&VB_EAT」と意味コード「52500」とが与えられたカテゴリデータには、日本語と英語と中国語との組が複数組含まれている。そして、これらの複数組のうち所定の組の各語句が、代表値として設定されている。例えば、同図では、語句W29(動詞)、「eat」、語句W14、「drink」、語句W17等の語句が代表値として記されている。
 ところで、図3に示したテンプレートデータには、可変部として、例えば{2:&VB_EAT+v.ren1}や{2:&VB_EAT+ing}が含まれている。この場合、{2:&VB_EAT+v.ren1}および{2:&VB_EAT+ing}については、上記シソーラスデータにおいて「&VB_EAT (52500)」といった区分に含まれる語句が、置換可能な語句として特定される。また、他の可変部についても同様である。
 図8は、上記カテゴリデータベースに含まれる他のカテゴリデータの構成を示した図である。この場合、翻訳装置1は、図7に示したシソーラスデータにおいて、「&HUMAN-SUBJ」といった区分に含まれる語句を、置換可能な語句として特定する。同図に示す場合には、翻訳装置1は、例えば、日本語に関しては、語句W27、語句W28、語句W12、語句W30(名詞)等を置換可能な語句として特定する。
 以上のように、可変部は、予め定められた複数の語句のうちの何れかの語句に置換可能な構成となっている。なお、以下では、置換可能な語句の集合を、候補とも称する。
 図9Aは、上記共起関係データベースに含まれる共起関係データの構成を示した図である。図9Bは、上記共起関係データベースに含まれる他の共起関係データの構成を示した図である。図9Aおよび図9Bに示すとおり、共起関係データにおいては、言語とラベル名と共起条件とが対応付けられている。言語の欄には、日本語、英語、または中国語といった種別が記される。また、ラベル名の欄には、上述した共起部に記されるラベルが記される。
 さらに、図9Aの共起条件の欄には、上述したスロット部に用いられる語句(例えば、「I」)と、当該語句が用いられた場合における共起部に用いる文字(例えば、「am」)との対応関係が記されている。一方、図9Bの共起条件の欄には、上述したスロット部のラベル(例えば、「&HUMAN-MY」)と、当該ラベルが条件として指定された場合における共起部に用いる文字(例えば、「my」)との対応関係が記されている。
 図10は、上記メモリ14内の各バッファを示した図である。
 メモリ14は、同図に示すとおり、抽出語句バッファ70と、検索結果テンプレートバッファ71と、スロット部用バッファ72と、共起部用バッファ73と、優先共起バッファ74と、処理文格納バッファ75と、翻訳結果バッファ76と、テンポラリテンプレートバッファ77と、テンポラリ辞書バッファ78と、テンポラリ語句バッファ79と、テンポラリスロットバッファ80と、テンポラリ第1共起バッファ81と、テンポラリ第2共起バッファ82と、入力文バッファ83と、を備えている。これらの各バッファが記憶するデータについては、後述する。
 なお、メモリ14内には、上記の各バッファ専用の領域が常に用意されている必要はなく、処理に必要となるバッファの領域がメモリ14内で順次確保される構成であればよい。
 ここで、図11を参照して、本実施の形態に係る翻訳装置1の具体的構成の一態様について説明する。同図は、翻訳装置1として機能するコンピュータシステム100のハードウェア構成を表わすブロック図である。
 コンピュータシステム100は、主たる構成要素として、プログラムを実行するCPU110と、コンピュータシステム100の使用者による指示の入力を受けるマウス120およびキーボード130と、CPU110によるプログラムの実行により生成されたデータ、又はマウス120若しくはキーボード130を介して入力されたデータを揮発的に格納するRAM140と、データを不揮発的に格納するハードディスク150と、CD-ROM(Compact Disk-Read Only Memory)駆動装置160と、モニタ170と、通信IF(Interface)180とを含む。各構成要素は、相互にデータバスによって接続されている。CD-ROM駆動装置160には、CD-ROM161が装着される。
 なお、翻訳装置1における入力部10がキーボード130およびマウス120に該当し、出力部11がモニタ170に該当し、記憶装置13がハードディスク150に該当し、メモリ14がRAM140に該当する。
 コンピュータシステム100における処理は、各ハードウェアおよびCPU110により実行されるソフトウェアによって実現される。このようなソフトウェアは、ハードディスク150に予め記憶されている場合がある。また、ソフトウェアは、CD-ROM161その他の記憶媒体に格納されて、プログラムプロダクトとして流通している場合もある。あるいは、ソフトウェアは、いわゆるインターネットに接続されている情報提供事業者によってダウンロード可能なプログラムプロダクトとして提供される場合もある。このようなソフトウェアは、CD-ROM駆動装置160その他の読取装置によりその記憶媒体から読み取られて、あるいは、通信IF180を介してダウンロードされた後、ハードディスク150に一旦格納される。そのソフトウェアは、CPU110によってハードディスク150から読み出され、RAM140に実行可能なプログラムの形式で格納される。CPU110は、そのプログラムを実行する。
 同図に示されるコンピュータシステム100を構成する各構成要素は、一般的なものである。したがって、翻訳装置1の本質的な部分は、RAM140、ハードディスク150、CD-ROM161その他の記憶媒体に格納されたソフトウェア、あるいはネットワークを介してダウンロード可能なソフトウェアであるともいえる。なお、コンピュータシステム100の各ハードウェアの動作は周知であるので、詳細な説明は繰り返さない。
 なお、記録媒体としては、CD-ROM、FD(Flexible Disk)、ハードディスクに限られず、磁気テープ、カセットテープ、光ディスク(MO(Magnetic Optical Disc)/MD(Mini Disc)/DVD(Digital Versatile Disc))、IC(Integrated Circuit)カード(メモリカードを含む)、光カード、マスクROM、EPROM(Electronically Programmable Read-Only Memory)、EEPROM(Electronically Erasable Programmable Read-Only Memory)、フラッシュROMなどの半導体メモリ等の固定的にプログラムを担持する媒体でもよい。
 ここでいうプログラムとは、CPUにより直接実行可能なプログラムだけでなく、ソースプログラム形式のプログラム、圧縮処理されたプログラム、暗号化されたプログラム等を含む。
 ところで、上記構成は、あくまでも具体的構成の一態様にすぎず、上記マウスを備えず、かつ、キーボードとモニタとハードディスクとが翻訳装置1内に備えられている構成であってもよい。上記翻訳装置1は、電子辞書や携帯電話等のポータブル型の携帯情報端末としても構成できる。
 このような携帯情報端末として翻訳装置1を構成する場合には、ハードディスク150の代わりに例えばフラッシュメモリを用いることができる。また、入力部として、タッチペン式の入力装置を備える構成としてもよい。さらに、小型化の観点から、モニタ170としては、液晶モニタや有機ELモニタ等の薄型のモニタを使用することが好適である。また、小型化の観点から、CD-ROM駆動装置の代わりにメモリカードを読み取る装置を設けておき、記録媒体としてCD-ROMの代わりに当該メモリカードを用いることが好適である。
 ここで、翻訳装置1における処理の具体的な流れについて、図12から図40に基づいて説明する。また、以下では、処理フローの各ステップにおいて行われる処理の結果、どのようなデータが作成されるかを、適宜具体例を挙げて説明する。
 図12は、翻訳装置1における処理の概略を示したフローチャートである。
 まず、入力部10を介して日本語による文が翻訳装置1に入力される(S1)。なお、当該入力された文はメモリ14の入力文バッファ83に一時的に記憶される。ステップS1の後は、制御部12が、テンプレートデータベース60において、所定の条件を満たすテンプレートデータデータを検索する(S2)。
 ステップS2の後は、上記所定の条件を満たすテンプレートデータが存在したか否かを制御部12が判断する(S3)。ステップS3において上記テンプレートデータが存在したと判断された場合には、制御部12は、処理をステップS4の文例作成処理に進める。一方、ステップS3において上記テンプレートデータが存在しないと判断された場合、制御部12は処理を終了する。
 ステップS4においては、第1置換部24は、上記テンプレートデータを用いて、日本語の文例と、当該文例に対応する英語の文例および中国語の文例とを作成する。ステップS4の後は、表示制御部25は、各言語による文例を出力部11に表示させる(S5)。
 なお、上記においては、テンプレートデータが日本語テンプレートと英語テンプレートと中国語テンプレートとを含んでおり、各言語によるテンプレートを用いて各言語による文例を作成する構成を示したが、これに限定されるものではない。
 例えば、ユーザが日本語の文を英語に翻訳した結果を知りたい場合には、ユーザが入力部10を介して翻訳装置1に所定の指示を送ることにより、中国語の文例を表示することなく、日本語の文例と英語の文例とを翻訳装置1が表示する構成としてもよい。つまり、翻訳装置1は、ユーザが翻訳が不要と考える言語については、出力部11で出力させる必要はない。また、この際、不要な言語については、文例を作成する処理を翻訳装置1が行なわない構成としてもよい。
 次に、上記ステップS2におけるテンプレートの検索の詳細について、図13および図14に基づいて説明する。
 図13は、テンプレート検索における処理の流れを示したフローチャートである。また、図14は、抽出語句バッファ70に記憶されるデータの構成を示した図である。
 まず、抽出部20が、入力された日本語の文から上記所定の規則にしたがって語句を抽出し、当該抽出した語句を抽出語句バッファ70に記憶させる(S201)。例えば、文W11(図77参照)を入力した場合、抽出語句バッファ70には、図14に示すとおり、抽出された各語句(語句W14、語句W12、語句W13)が、語句(日本語)の欄に語句番号と対応付けられた形で記憶される。なお、語句番号は、抽出した語句を互いに識別するための番号である。なお、以下では、説明の便宜上、抽出した語句を、語句(WX)として表記する。
 ステップS201の後は、データ読出部21が、テンプレートデータベース60からテンプレートデータを一つ読み出す(S202)。そして、ステップS202の後は、制御部12が、抽出語句バッファ70から語句(WX)を一つ読み出す(S203)。
 ステップS203の後は、判定部22が、読み出したテンプレートデータにおける日本語テンプレートの固定部に、上記読み出した語句(WX)または当該語句(WX)の活用形を示した語句(WX′)が存在するか否かを判断する(S204)。なお、語句(WX′)が存在するか否かの判断に際しては、上述した、辞書データの活用の欄における情報と日本語活用形テーブルとを用いる。
 ステップS204において、存在すると判断された場合には、制御部12は、処理をステップS206に進める。一方、ステップS204において、存在しないと判断された場合には、判定部22が、上記日本語テンプレートの可変部に置換可能な語句(つまり、上記候補)に、上記読み出した語句(WX)または上記語句(WX′)が含まれているか否かを判断する(S205)。
 ステップS205において、存在すると判定された場合には、制御部12は、処理をステップS206に進める。一方、ステップS205において、存在しないと判定された場合には、制御部12は、処理をステップS208に進める。
 ステップS206においては、制御部12が、未だ読み出していない語句が抽出語句バッファ70に存在するか否かを判定する。ステップS206において存在すると判断された場合には、制御部12は、処理をステップS203に戻す。一方、S206において存在しないと判断された場合には、選択部23が、上記テンプレートデータを検索結果テンプレートバッファ71に記憶させる(S207)。このように、選択部23により、複数のテンプレートデータの中から一定の条件を満たしたテンプレートデータが選択されて、検索結果テンプレートバッファ71に記憶されることになる。なお、ステップS207の後は、制御部12は、処理をステップS208に進める。
 ステップS208においては、制御部12が、テンプレートデータベース60内に、未だ読み出していないテンプレートデータが存在するか否かを判断する。ステップS208において存在すると判断された場合には、制御部12は、処理をステップS202に戻す。一方、ステップS208において存在しないと判断された場合には、制御部12は、処理を図12のステップS13に進める。
 次に、上記ステップS4における文例作成処理の詳細について、図15から図19に基づいて説明する。
 図15は、文例作成処理における処理の流れを示したフローチャートである。
 まず、制御部12が、検索結果テンプレートバッファ71からテンプレートデータを一つ読み出し、当該読み出したテンプレートデータをテンポラリテンプレートバッファ77に記憶させる(S401)。例えば、図3に示すようようなテンプレートデータが検索結果テンプレートバッファ71に記憶されている場合、制御部12は、図16に示すとおり、結果番号が付与された形でテンポラリテンプレートバッファ77に当該テンプレートデータを記憶させる。なお、結果番号とは、複数のテンプレートデータからテンプレートデータを識別するための番号であり、検索結果テンプレートバッファ71にテンプレートデータが記憶される際に付される番号である。
 ステップS401の後は、制御部12が、上記読み出したテンプレートデータを処理文格納バッファ75に格納する(S402)。当該ステップS402によって、例えば、制御部12は、図17に示すとおり、図16で示したテンプレートデータのうち上記結果番号とテンプレートIDとを除いたデータが処理文格納バッファ75に記憶させる。なお、図16は、テンポラリテンプレートバッファ77に記憶されたテンポラリテンプレートデータの構成を示した図である。また、図17は、処理文格納バッファ75に記憶されたテンプレートデータを示した図である。
 ステップS402の後は、制御部12が、処理文格納バッファ75からスロット部に関する情報を上述したカテゴリ(つまり、「&」で始まるラベル)毎に抽出し、当該抽出した各データを所定形式のテーブルの所定箇所に代入する(S403)。
 このステップS403の処理により、図17に示すデータの例では、スロット部用バッファ72に、図18に示すとおり、スロット番号と、当該スロット番号に対応するカテゴリと、各言語の情報(活用情報および共起フラグの情報)とが対応付けされて記憶される。なお、活用情報の欄と、共起フラグの欄と、置換語句の欄とにおいては、言語別に欄(以下、小欄という)が設けられている。なお、図18は、スロット部用バッファ72に記憶されたデータを示した図である。
 ここで、制御部12は、同図の活用情報の欄に、言語毎に、スロット部の「+」より後ろの文字列を書き込む。例えば、制御部12は、日本語テンプレートでは、活用情報の欄に{2:&VB_EAT+v.ren1}の「v.ren1」を書き込み、英語のテンプレートでは、活用情報の欄に{2:&VB_EAT+ing}の「ing」を書き込む。
 また、スロット部に「-i」という符号が付されている場合、制御部12は、同図の共起フラグの欄には、当該スロット部に関連する小欄(同図では、英語の小欄)の箇所に、「i」を書き込む。ここで、上記符号は、他の可変部との関連性を示す符号である。なお、同図における置換語句の欄と、処理済フラグの欄とについては、後述する。
 また、以下では、説明の便宜上、一つのカテゴリと、当該カテゴリに関する、上記活用情報と上記共起フラグの情報と置換語句との言語毎の情報とからなる情報を、スロット情報と称する。例えば、図18においては、「&HUMAN-SUBJ」に関するスロット情報と、「&VB_EAT」とに関するスロット情報とが存在していることになる。
 ステップS403の後は、制御部12が、処理文格納バッファ75から共起部に関する情報をラベル(つまり、「&」で始まるラベル)毎に抽出し、当該抽出した各データを所定形式のテーブルの所定箇所に書き込む(S404)。
 このステップS404の処理により、図17に示すデータの例では、共起部用バッファ73に、図19に示すとおり、共起番号と、ラベルと、言語と、優先処理フラグと、置換語句と、共起フラグとが対応付けて記憶される。なお、図19は、共起部用バッファ73に記憶されたデータを示した図である。
 ここで、上記共起番号とは、共起部をラベル毎に区別するために付された番号である。また、上記言語は、ラベル名で特定される共起部を含むテンプレートが、何れの言語のテンプレートであるかを示している。言い換えれば、上記言語は、ラベル名で特定される共起部に何れの言語が用いられるのかを示した情報といえる。
 また、上記優先処理フラグは、後述する共起部の作成の際に用いられるフラグである。図17の英語テンプレートに示すように、共起部の「:」の後ろに「#」が付されている場合、当該共起部のラベルに関する図19の優先処理フラグの欄に、フラグ「1」を立てる。
 なお、以下では、説明の便宜上、一つのラベルと、当該ラベルに関する、上記言語と上記優先処理フラグと上記置換語句と上記共起フラグとの情報とからなる情報を、共起情報と称する。例えば、図19においては、「be_AUX」に関する共起情報と、「DET_MY-NULL」とに関する共起情報とが存在していることになる。
 ステップS404の後は、制御部12が、スロット部用バッファ72にデータが書き込まれているか否かを判断する(S405)。ステップS405においてデータが書き込まれていると判断された場合には、第1置換部24が、スロット部の処理を実行する(S406)。そして、ステップS406の後は、制御部12は、処理をステップS407に進める。なお、当該ステップS406の詳細については、後述する。
 一方、ステップS405においてデータが書き込まれていないと判断された場合には、制御部12は、処理をステップS407に進める。なお、テンプレートデータによっては、スロット部が存在しないものもあるため、制御部12は、ステップS405においてデータが書き込まれているか否かを判断している。
 ステップS407においては、制御部12が、共起部用バッファ73にデータが書き込まれているか否かを判断する。ステップS407においてデータが書き込まれていると判断された場合には、第1置換部24が、共起部の処理を実行する(S408)。そして、ステップS408の後は、制御部12は、処理をステップS409に進める。なお、当該ステップS408の詳細については、後述する。
 一方、ステップS407においてデータが書き込まれていないと判断された場合には、制御部12は、処理をステップS409に進める。なお、テンプレートデータによっては、共起部が存在しないものもあるため、制御部12は、ステップS407においてデータが書き込まれているか否かを判断している。
 ステップS409においては、出力文整形部26が、スロット部と共起部とが処理されることにより作成された文例に対して、後処理を行なう。なお、当該処理の詳細については後述する。上記文例としては、日本語による文例と、英語による文例と、中国語による文例が含まれる。つまり、第1置換部24と出力文整形部26とにより、各言語のテンプレートに対応した文例が作成される。
 ステップS409の後は、制御部12が、上記後処理した文例を翻訳結果バッファ76に書き込む(S410)。ステップS410の後は、制御部12が、未だ読み出されていないテンプレートデータが検索結果テンプレートバッファ71に存在しているか否かを判断する(S411)。
 ステップS411において存在すると判断された場合には、制御部12は、処理をステップS401に戻す。一方、ステップS411において存在しないと判断された場合には、制御部12は、処理を図12のステップS5に進める。
 次に、上記ステップS406におけるスロット部の処理の詳細について、図20A、図20B、および図21から図28に基づいて説明する。
 図20Aは、スロット部の処理フローにおける前半の処理フローを示したフローチャートである。図20Bは、スロット部の処理フローにおける後半の処理フローを示したフローチャートである。
 まず、スロット置換部41が、抽出語句バッファ70から語句(WX)を一つ読み出し、当該読み出した語句(WX)をテンポラリ語句バッファ79に書き込む(S601)。例えば、図14に示すとおり、抽出語句バッファ70に語句W14と語句W12と語句W13とが記憶されている場合、スロット置換部41は、同図に示す語句番号の順に語句を読み出す。ここでは、スロット置換部41は、最初に語句W14を読み出す。なお、テンポラリ語句バッファの構成については後述する。
 S601の後は、スロット置換部41が、スロット部用バッファ72から上述したスロット情報を一つ抽出し、テンポラリスロットバッファ80に書き込む(S602)。例えば、スロット置換部41は、図18に示すスロット部用バッファ72から、最初に「&HUMAN-SUBJ」に関するスロット情報を抽出する。また、抽出されたスロット情報については、制御部12は、スロット置換部41が抽出済みであることを示すフラグ(図示せず)を立てる。なお、以下では、説明の便宜上、上記のようにテンポラリスロットバッファ80に記憶されたスロット情報をスロット情報(SX)として表記する。
 ステップS602の後は、スロット置換部41が、テンポラリ語句バッファ79に書き込んだ語句(WX)が抽出したスロット情報(SX)に関連する語句であるか否かを判断する(S603)。
 ステップS603について具体的には、以下のように判断する。なお、語句(WX)として語句W14(図14、図77参照)が読み出されており、かつスロット情報(SX)として「&HUMAN-SUBJ」に関するスロット情報が抽出されているものとする。この場合、スロット置換部41が、図7に示したシソーラスデータを参照し、「&HUMAN-SUBJ」といった区分に含まれる語句に、語句W14といった語句が存在するか否かを判断する。実際のところ、「&HUMAN-SUBJ」といった区分に含まれる語句に語句W14は存在しないので、この場合、スロット置換部41は、ステップS603において、テンポラリ語句バッファ79に書き込んだ語句(WX)は抽出したスロット情報(SX)に関連する語句ではないと判断する。
 ステップS603において関連する語句であると判断された場合には、制御部12は、処理をステップS604に進める。一方、ステップS603において関連する語句ではないと判断された場合には、制御部12は、処理をステップS610に進める。
 ここで、説明の便宜上、ステップS604からステップS609の説明の前に、ステップS610の説明を行なう。
 ステップS610においては、スロット置換部41が、スロット部用バッファ72に、未だ抽出されていないスロット情報が存在するか否かを判断する。ステップS610においてスロット情報が存在すると判断された場合には、制御部12は、処理をステップS602に進める。一方、ステップS610においてスロット情報が存在しないと判断された場合には、制御部12は、処理をステップS611に進める。
 ここで、上記の例では、「&HUMAN-SUBJ」に関するスロット情報は抽出されているが、「&VB_EAT」に関するスロット情報は未だ抽出されていないため、スロット置換部41は、ステップS610においてスロット情報が存在すると判断する。そして、ステップS602において、図21に示すとおり、スロット置換部41が「&VB_EAT」に関するスロット情報を抽出する。なお、図21は、テンポラリスロットバッファ80に記憶されたスロット情報の構成を示した図である。
 さらに、この場合、スロット置換部41は、テンポラリ語句バッファ79に書き込まれた語句W14(WX)が、「&VB_EAT」に関するスロット情報に関連する語句であるか否かを、ステップS603において判断することになる。ここでは、上記と同様に、スロット置換部41が、図7に示したシソーラスデータを参照し、「&VB_EAT」といった区分に含まれる語句に、語句W14が存在するか否かを判断する。実際のところ、「&VB_EAT」といった区分に含まれる語句に語句W14は存在するため、この場合、スロット置換部41は、ステップS603において、テンポラリ語句バッファ79に書き込んだ語句(WX)は抽出したスロット情報(SX)に関連する語句であると判断する。その結果、制御部12は、処理をステップS604に進める。
 ここで、ステップS604からステップS609について説明する。なお、ステップS604からステップS609の説明においては、語句(WX)として語句W14が読み出されており、かつスロット情報(SX)として「&VB_EAT」に関するスロット情報が抽出されている例を挙げて説明する。
 ステップS604においては、辞書検索部40が、語句(WX)を含んだ辞書データを辞書データベース61から読み出し、当該読み出した辞書データをテンポラリ辞書バッファ78に書き込む。さらに、ステップS604の後は、スロット置換部41が、テンポラリ辞書データにおける見出しの欄に書き込まれた英語と中国語とのデータを用いて、テンポラリ語句バッファ79の英語の語句の欄と中国語の語句の欄との書き込みを行なう(S605)。また、ステップS605の後は、制御部12は、処理をステップS606に進める。
 ステップS604およびステップS605について具体例を挙げて説明すると、以下の通りである。まず、ステップS604において、辞書検索部40は、図22に示すとおり、語句W14(WX)を含んだ辞書データを、テンポラリ辞書バッファ78に書き込む。なお、図22は、テンポラリ辞書バッファ78に記憶された辞書データを示した図である。ここで、見出しの欄に書き込まれた英語のデータが「drink」であり、中国語のデータが語句W17である。したがって、ステップS605において、スロット置換部41は、「drink」と語句W17とを、図23に示すとおり、それぞれ、テンポラリ語句バッファ79の英語の語句の欄と中国語の語句の欄とに書き込む。なお、図23は、テンポラリ語句バッファ79に記憶されたデータを示した図である。
 ステップS606においては、変化形探索部43が、テンポラリスロットバッファ80に書き込まれたスロット情報(SX)において、上記活用情報の欄にデータが書き込まれているかを判断する。そして、ステップS606においてデータが書き込まれていると判断された場合には、スロット置換部41が、当該活用情報とテンポラリ辞書バッファ78の活用の欄のデータと図5に示した日本語活用形テーブル62とを用いて、テンポラリ語句バッファ79における語句(WX)の語形を変化させる(S607)。さらに、ステップS607においては、スロット置換部41が、上記活用情報を用いて、テンポラリ語句バッファ79における、語句(WX)に対応する英語の語句と中国語の語句との語形を変化させる。そして、ステップS607の後は、ステップS608に進む。
 ステップS606およびステップS607について具体例を挙げて説明すると、以下の通りである。先ず、テンポラリスロットバッファ80に、図21に示すとおり、「&VB_EAT」に関するスロット情報(SX)があるため、当該スロット情報の活用情報の欄を、スロット置換部41が確認する。ここで、活用情報の欄には、日本語に関しては動詞の連用形1を示す「v.ren1」が書き込まれており、英語に関しては進行形を示す「ing」が書き込まれている。
 そして、語句W14(WX)については、図22に示すテンポラリ辞書データの活用の欄に、語句W19(図77参照)が示す活用であることを示す語句W18が書き込まれている。それゆえ、スロット置換部41が、当該語句W18が示す情報と「v.ren1」という情報とを用いて、図5に示した日本語活用形テーブル62から活用形で用いられる語句(この例では、語句W31(inflected suffix))を取得する。そして、スロット置換部41は、テンポラリ語句バッファ79における語句W14のうち語句W32(inflected suffix)を、当該取得した語句W31で置換する(図23,77参照)。
 また、「drink」といった語句については、スロット置換部41が、テンポラリスロットバッファ80の「ing」という情報に基づき、テンポラリ辞書バッファ78の活用の欄から「*ing」という情報を得る。この「*ing」という情報は、「*」の部分に、テンポラリ辞書バッファ78の見出しの欄の語句「drink」を挿入すればよいことを示した情報である。それゆえ、スロット置換部41は、テンポラリ語句バッファ79の「drink」を、「*」の部分に「drink」を挿入して得られた「drinking」に置換する。
 なお、中国語である語句W17(図22参照)に関しては、活用情報が書き込まれていないため、スロット置換部41は、語形の変化を行わない。
 以上の結果、テンポラリ語句バッファ79には、図24に示すとおり、語句W33(動詞)と「drinking」と語句W17とが各言語の欄に書き込まれることになる。なお、図24は、テンポラリ語句バッファ79に記憶された、語形変化を行った後のデータを示した図である。
 次に、ステップS608においては、スロット置換部41が、処理文格納バッファ75に記憶された各言語のテンプレートにおける上記スロット情報に関連するスロット部を、テンポラリ語句バッファ79に記憶されている語句で置換する。そして、ステップS608の後は、制御部12は、処理をステップS609に進める。
 ステップS608について具体例を挙げて説明すると、以下の通りである。
 まず、処理文格納バッファ75には、図17に示したテンプレートデータが記憶されている。また、テンポラリ語句バッファ79(図24参照)には、日本語の欄に語句W33が、英語の欄に「drinking」が、中国語の欄に語句W17が書き込まれている。
 そこで、スロット置換部41は、図17に示した日本語テンプレートの{2:&VB_EAT+v.ren1}を語句W33に置換する。また、スロット置換部41は、同図に示した英語テンプレートの{2:&VB_EAT+ing}を上記「drinking」に置換する。さらに、スロット置換部41は、同図に示した中国語テンプレートの{2:&VB_EAT}を語句W17に置換する。
 以上により、図25に示すとおりのテンプレートデータが処理文格納バッファ75に記憶されることになる。なお、図25は、処理文格納バッファ75に記憶された、スロット部における置換処理の途中状態のテンプレートデータを示した図である。
 ところで、図25においては、可変部であることを判別しやすくするため、便宜上、置換した語句(語句W33と「drinking」と語句W17)を、{}といった括弧書きで記載している。実際には、翻訳装置1においては、{}を含めた可変部全体が語句で置換されることになる。つまり、置換された可変部には{}といった括弧は存在しなくなる。後述する、図27と図34と図39と図40と図45と図50と図55とにおいても、同様である。
 ステップS609においては、制御部12は、スロット部用バッファ72に記憶されている上記スロット情報(SX)の置換語句の欄に、各言語のテンプレートの置換に用いた語句を書き込むとともに、上記処理済フラグの欄に置換処理済であることを示すフラグを立てる。
 この処理により、例えば図18で示された、スロット部用バッファ72に記憶されているデータが更新される。ここでは、制御部12は、図26に示すとおり、「&VB_EAT」に関するスロット情報における置換語句の日本語の欄に語句W33を、英語の欄に「drinking」を、中国語の欄に語句W17を書き込む。さらに、制御部12は、同図に示すとおり、「&VB_EAT」に関するスロット情報における処理済フラグの欄に、「1」を書き込む。なお、図26は、スロット部用バッファ72に記憶された、スロット部における置換処理の途中状態のスロット情報を示した図である。
 ステップS609の後は、ステップS610に進む。なお、ステップS610については説明を行ったので、ここでの説明は省略する。
 ステップS610の後は、スロット置換部41が、未だ読み出されていない語句が抽出語句バッファ70に存在するか否かを判断する(S611)。ステップS611において存在すると判断された場合には、制御部12は、処理をステップS601に戻す。一方、ステップS611において存在しないと判断された場合には、制御部12は、処理をステップS612に進める。
 なお、ステップS612に進む際には、処理文格納バッファ75において、各言語のテンプレートのスロット部が、例えば図27に示すとおり語句で置換されている。なお、図27は、処理文格納バッファ75に記憶された、スロット部の置換処理が完了した状態におけるテンプレートデータを示した図である。
 また、スロット部用バッファ72は、図26に示した状態から図28に示した状態に遷移する。つまり、制御部12は、「&HUMAN_SUBJ」に関するスロット情報における置換語句の日本語の欄に語句W12を、英語の欄に「he」を、中国語の欄に語句W34(名詞)を書き込む。さらに、同図に示すとおり、「&HUMAN_SUBJ」に関するスロット情報における処理済フラグの欄に、制御部12は、「1」を書き込む。なお、図28は、スロット部用バッファ72に記憶された、スロット部の置換処理が完了した状態におけるスロット情報を示した図である。
 この場合、以上の処理により全てのスロット情報が読み出されているため、全てのスロット情報について、抽出済みフラグ(図示せず)が立っている。一方で、抽出部20で抽出した語句がn個(n:自然数)であり、日本語テンプレートにおけるスロット部の個数がn+1個以上の場合等には、スロット部に語句が置換されていない状況が起こりうる。つまり、この場合、置換処理済みであることを示すフラグが立っていないスロット情報が存在する。
 そこで、ステップS612においては、スロット置換部41が、全てのスロット情報について、抽出済みであることを示すフラグを消去する。そして、ステップS612の後は、スロット置換部41が、再度、スロット部用バッファ72からスロット情報を一つ抽出し、当該抽出したスロット情報をテンポラリスロットバッファ80に再度書き込む(S613)。
 ステップS613の後は、スロット置換部41が、抽出したスロット情報において、置換処理済であることを示すフラグが立っているか否かを判断する(S614)。ステップS614においてフラグが立っていると判断された場合には、制御部12は、処理をステップS616に進める。一方、ステップS614においてフラグが立っていないと判断された場合には、未入力箇所置換部44が、当該スロット情報に対応する各言語のテンプレートのスロット部を、所定の語句に置換する(S615)。さらに、制御部12は、当該スロット情報の置換語句の欄にも、上記置換された語句と同じ語句を書き込む。また、ステップS615の後は、制御部12は、処理をステップS616に進める。
 なお、上記語句の置換の仕方としては、例えば、ユーザが入力部10を介して入力する構成とすることができる。また、未入力箇所置換部44が、図7に示したシソーラスデータを参照し、上記スロット部のラベルが存在する階層の語句および当該階層よりも下層の語句の何れかを用いて、語句の置換を行なう構成としてもよい。この場合、置換する語句としては、例えば上述した代表値を用いることができる。また、ユーザが入力する場合であっても、未入力箇所置換部44が、上記スロット部のラベルで示される区分に含まれる語句を、埋め込み対象語句として出力部11に表示するとともに、表示した語句の中から一つの語句をユーザに選択させる構成としてもよい。未入力箇所置換部44における置換の方法は特に限定されるものではない。
 ステップS616においては、スロット置換部41が、未だ読み出されていない語句が抽出語句バッファ70に存在するか否かを判断する。ステップS616において存在すると判断された場合には、制御部12は、処理を、再度、ステップS613に進める。一方、ステップS616において存在しないと判断された場合には、制御部12は、処理を図15のステップS407に進める。
 次に、上記ステップS408における共起部の処理の詳細について、図29A、図29B、および図30から図40に基づいて説明する。
 図29Aは、共起部の処理フローにおける前半の処理フローを示したフローチャートである。図29Bは、共起部の処理フローにおける後半の処理フローを示したフローチャートである。
 まず、共起置換部42が、共起部用バッファ73から上述した共起情報を一つ抽出し、テンポラリ第1共起バッファ81に書き込む(S801)。共起置換部42は、例えば、図19に示す共起部用バッファ73内のデータから、最初に「be_AUX」に関する共起情報を抽出し、当該共起情報を、図30に示すとおり、テンポラリ第1共起バッファ81に書き込む。また、制御部12は、抽出された共起情報については、共起置換部42が抽出済みであることを示すフラグ(図示せず)を立てる。なお、図30は、テンポラリ第1共起バッファ81に記憶された共起情報を示した図である。また、以下では、説明の便宜上、上記のようにテンポラリ第1共起バッファ81に書き込まれた情報を共起情報(CX)として表記する。
 ステップS801の後は、制御部12は、テンポラリ第1共起バッファ81に書き込まれた共起情報において、優先処理フラグが立っているか否かを判断する(S802)。ステップS802において優先処理フラグが立っていると判断された場合には、制御部12は、処理をステップS803に進める。一方、ステップS802において優先処理フラグが立っていないと判断されたされた場合には、制御部12は、処理をステップS807に進める。例えば、「be_AUX」に関する共起情報については、図30に示すように優先処理フラグが立っていないので、この場合には、制御部12は、処理をステップS808に進める。
 ここで、説明の便宜上、ステップS803からステップS807の説明の前に、ステップS808の説明を行なう。
 ステップS808においては、共起置換部42が、未だ抽出されていない共起情報が存在するか否かを判断する。ステップS808において共起情報が存在すると判断された場合には、制御部12は、処理をステップS801に進める。一方、ステップS808において共起情報が存在しないと判断された場合には、制御部12は、処理をステップS809に進める。
 ここで、上記の例では、「be_AUX」に関する共起情報は抽出されているが、「DET_MY-NULL」に関する共起情報は未だ抽出されていないため、制御部12は、ステップS808においてスロット情報が存在すると判断する。そして、ステップS801において、図31に示すとおり、共起置換部42が「DET_MY-NULL」に関する共起情報を抽出する。なお、図31は、テンポラリ第1共起バッファ81に記憶された共起情報の構成を示した図である。
 また、同図に示すとおり「DET_MY-NULL」に関する共起情報は優先処理フラグが立っているため、制御部12は、ステップS802においては優先処理フラグがあると判断し、その結果、処理をステップS803に進める。
 ここで、ステップS803からステップS807について説明する。なお、ステップS803からステップS807の説明においては、共起情報(CX)として「DET_MY-NULL」に関する共起情報が抽出されている例を挙げて説明する。
 ステップS803においては、共起置換部42が、スロット部用バッファ72から、共起情報(CX)に含まれる共起フラグを有するスロット情報を読み出し、当該読み出したスロット情報をテンポラリスロットバッファ80に書き込む。
 ここで、具体例を挙げて説明する。図21に示す「DET_MY-NULL」に関する共起情報(CX)には、共起フラグ「i」が立っている。一方、スロット部用バッファ72には、図28に示すとおり、共起フラグ「i」を含んだ「&HUMAN-SUBJ」に関するスロット情報が存在する。したがって、共起置換部42は、テンポラリスロットバッファ80に、図32に示すような「&HUMAN-SUBJ」に関するスロット情報を書き込む。なお、図32は、テンポラリスロットバッファ80に記憶されたスロット情報の構成を示した図である。
 ステップS803の後は、共起置換部42が、テンポラリ第1共起バッファ81に書き込んだ共起情報に基づき、共起関係対応データベースから共起関係対応データを読み出す(S804)。そして、ステップS804の後は、共起置換部42が、テンポラリスロットバッファ80に書き込んだスロット情報と、上記読み出した共起関係対応データとに基づいて、テンポラリ語句バッファ79に語句を書き込む(S805)。また、ステップS805の後は、制御部12は、処理をステップS806に進める。
 ステップS804およびステップS805について具体例を挙げて説明すると、以下の通りである。
 まず、ステップS804において、共起置換部42は、図9Bに示す共起関係データを読み出す。そして、ステップS805において、共起置換部42は、図32に示すスロット情報と、当該読み出した共起関係データとに基づいて、テンポラリ語句バッファ79に語句を書き込む。この例の場合、スロット情報に置換される語句W12(図7参照)の属するのカテゴリ(ラベルの一種)が「&HUMAN-PRON_SUBJ(&HUMAN-SUBJ)」であるため、共起置換部42は、当該ラベルが条件として指定された場合に用いられる文字を書き込む。
 図9Bによると、ラベルが「&HUMAN-MY」に属する場合は「my」という文字が書き込まれるが、それ以外の場合には「(NULL)」という文字が書き込まれる。したがって、ステップS805において、共起置換部42は、図33に示すとおり、テンポラリ語句バッファ79における英語の欄に、「(NULL)」を書き込む。なお、(NULL)については、後述する。なお、図33は、テンポラリ語句バッファ79に記憶されたデータを示した図である。
 このように、共起部の置換候補を決定する場合には、シソーラスデータの木をたどり、ラベルの包含関係も考慮に入れる必要がある。
 ステップS806においては、共起置換部42が、処理文格納バッファ75に記憶された各言語のテンプレートにおける上記共起情報に関連する共起部を、テンポラリ語句バッファ79に記憶されている語句で置換する。そして、ステップS806の後は、ステップS807に進む。
 ステップS806について具体例を挙げて説明すると、以下の通りである。まず、共起置換部42は、図27に示した英語テンプレートの「{-i:#DET_MY-NULL}」といった共起部の「-i:#DET_MY-NULL」を「(NULL)」で置き換える。ただし、「(NULL)」とは、本実施の形態においては何も記さないことを意味する記号であるため、共起置換部42は「-i:#DET_MY-NULL」を消去する。この結果、上記英語テンプレートは、図34に示すように、「{-i:be_AUX+pres}」と「{he}」との間の共起部が、単に「{}」といった記号で示されることになる。なお、図34は、処理文格納バッファ75に記憶された、共起部における置換処理の途中状態のテンプレートデータを示した図である。
 ステップS807においては、制御部12は、図35に示すとおり、上記共起情報(CX)を優先共起バッファ74に書き込む。なお、図35は、優先共起バッファに記憶された共起情報を示した図である。
 そして、S807の後は、制御部12は、処理をステップS808に進める。なお、ステップS808については説明を行ったので、ここでの説明は省略する。
 ステップS809においては、共起置換部42が、全ての共起情報について、抽出済みであることを示すフラグを消去する。そして、ステップS809の後は、共起置換部42が、共起部用バッファ73から共起情報を一つ抽出し、当該抽出した共起情報をテンポラリ第1共起バッファ81に書き込む(S810)。
 共起置換部42は、例えば、図19に示す共起部用バッファ73から、最初に「be_AUX」に関する共起情報を抽出する。また、制御部12は、抽出された共起情報については、抽出済みであることを示すフラグ(図示せず)を立てる。
 ステップS810の後は、テンポラリ第1共起バッファ81に書き込まれた上記共起情報において、制御部12は、優先処理フラグが立っているか否かを判断する(S811)。そして、ステップS811において優先処理フラグが立っていると判断された場合には、制御部12は、処理をステップS817に進める。一方、ステップS811において優先処理フラグが立っていないと判断されたされた場合には、制御部12は、処理をステップS812に進める。
 上記の例では、共起置換部42は、図19に示す共起部用バッファ73内のデータから、最初に「be_AUX」に関する共起情報を再度抽出し、当該共起情報を、図30に示すとおり、テンポラリ第1共起バッファ81に再度書き込む。例えば、「be_AUX」に関する共起情報については、同図に示すように優先処理フラグが立っていないので、この場合には、制御部12は、処理をステップS812に進める。
 なお、ステップS811において優先処理フラグの有無を判断する理由は、「{-i:#DET_MY-NULL}」といった共起部のように、もはや処理の必要でない共起部を、以降のステップS812からステップS816における処理の対象外とするためである。
 ここで、説明の便宜上、ステップS812からステップS816の説明の前に、ステップS817の説明を行なう。
 ステップS817においては、共起置換部42が、未だ抽出されていない共起情報が存在するか否かを判断する。ステップS817において共起情報が存在すると判断された場合には、制御部12は、処理をステップS810に進める。一方、ステップS817において共起情報が存在しないと判断された場合には、制御部12は、処理をステップS409に進める。
 上記の例では、「be_AUX」に関する共起情報は抽出されているが、「DET_MY-NULL」に関する共起情報は未だ抽出されていないため、共起置換部42は、ステップS817において共起情報が存在すると判断する。そして、ステップS810において、図31に示すとおり、共起置換部42が「DET_MY-NULL」に関する共起情報を抽出する。
 ここで、ステップS812からステップS815について説明する。なお、ステップS812からステップS815の説明においては、共起情報(CX)として「be_AUX」に関する共起情報が抽出されている例を挙げて説明する。
 ステップS812においては、共起置換部42が、スロット部用バッファ72から、共起情報(CX)に含まれる共起フラグを有するスロット情報を読み出し、当該読み出したスロット情報をテンポラリスロットバッファ80に書き込む。
 例えば、優先処理フラグのない図30に示す共起情報(CX)に含まれる共起フラグ「i」を有するスロット情報は、「&HUMAN-SUBJ」に関するスロット情報である。したがって、共起置換部42は、「&HUMAN-SUBJ」に関するスロット情報をスロット部用バッファ72から読み出し、図36に示すとおり、当該読み出したスロット情報(SX)をテンポラリスロットバッファ80に書き込む。なお、図36は、テンポラリスロットバッファ80に記憶されたスロット情報を示した図である。
 ステップS812の後は、共起置換部42は、優先共起バッファ74から、上記共起情報(CX)と同じ共起フラグを有する共起情報を読み出す(S813)。例えば、図35に示すとおり、「be_AUX」に関する共起情報(CX)と同じ共起フラグ「i」を有する共起情報として、「DET_MY-NULL」に関する共起情報が優先共起バッファ74に存在する。
このため、共起置換部42は、当該「DET_MY-NULL」に関する共起情報を読み出し、図37に示すとおり、当該読み出した共起情報をテンポラリ第2共起バッファ82に書き込む。なお、図37は、テンポラリ第2共起バッファに記憶された共起情報を示した図である。また、以下では、上記のようにテンポラリ第2共起バッファ82に書き込まれた共起情報を共起情報(CHX)と表記する。
 ステップS813の後は、共起置換部42が、テンポラリ第1共起バッファ81に書き込んだ共起情報(CX)と、テンポラリ第2共起バッファ82に書き込んだ共起情報(CHX)とに基づき、共起関係対応データベースから共起関係対応データを読み出す(S814)。そして、ステップS814の後は、共起置換部42が、上記読み出した共起関係対応データと、テンポラリスロットバッファ80に書き込んだスロット情報(SX)とに基づいて、テンポラリ語句バッファ79に語句を書き込む(S815)。また、ステップS815の後は、制御部12は、処理をステップS816に進める。
 ステップS814およびステップS815について具体例を挙げて説明すると、以下の通りである。なお、以下の例では、共起情報(CX)に基づき、共起関係対応データベースから共起関係対応データを読み出す構成を説明する。
 まず、ステップS814において、共起置換部42は、図30に示す共起情報(CX)に基づき、図9Aに示す共起関係対応データを読み出す。具体的には、共起置換部42は、図30に示された共起情報のラベルと同じラベルを有する共起関係対応データを読み出す。そして、ステップS815において、共起置換部42は、図9Aに示す共起関係対応データと、図36に示すスロット情報(SX)とに基づいて、テンポラリ語句バッファ79に語句を書き込む。
 この例の場合、スロット情報の置換語句が「he」であるため、共起置換部42は、当該「he」が用いられた場合における共起部に用いる語句をテンポラリ語句バッファ79に書き込む。図9Aによると、共起置換部42は、置換語句が「I」の場合には「am」という語句をテンポラリ語句バッファ79に書き込む。また、置換語句が「you」または複数形の語句である場合には、共起置換部42は、「are」という語句をテンポラリ語句バッファ79に書き込む。さらに、これら以外の置換語句の場合には、共起置換部42は、「is」という語句をテンポラリ語句バッファ79に書き込む。したがって、共起置換部42は、テンポラリ語句バッファ79の英語の欄に、図38に示すとおり、「is」といった語句を書き込む。なお、図38は、テンポラリ語句バッファ79に記憶された語句を示した図である。
 ステップS816においては、共起置換部42は、処理文格納バッファ75に記憶されたテンプレートにおける上記共起情報に関する共起部を、テンポラリ語句バッファ79に記憶された語句で置換する。具体的には、共起置換部42は、図34に示した英語テンプレートの{-i:be_AUX+pres}を上記「is」に置換する。これにより、図39に示すとおりのテンプレートデータが処理文格納バッファ75に記憶されることになる。なお、図39は、処理文格納バッファ75に記憶された、共起部の置換処理が完了した状態におけるテンプレートデータを示した図である。
 そして、ステップS816の後は、S817に進む。
 ここで、図15のステップS409における処理を説明する。
 ステップS409においては、出力文整形部26が、処理文格納バッファ75に記憶された、例えば図39に示すテンプレートデータにおける日本語テンプレートの語句W35(音節)という語句を、図40に示すとおり語句W36(音節(語句W35の濁音))に変更する。なお、図40は、処理文格納バッファ75に記憶された文例データを示した図である。
 翻訳装置1には、このように文を整形する規則が記憶されており、例えば全ての可変部が置換された後に当該規則にしたがって文を整形する。この規則の一例としては、語句W19(図77参照)で示した活用の動詞の活用形が語句W26で示した活用形(つまり、ren1)であり、当該動詞の直後が語句W35である場合には語句W36に変更し、当該動詞の直後が図77に示す語句W38(音節)である場合には図77に示す語句W39(音節(語句W38の濁音))に変更するといった規則が挙げられる。
 以上の結果、翻訳装置1では、各言語のテンプレートに基づき、日本語の文例が得られるとともに、当該日本語の文例を翻訳した英語の文例と、当該日本語の文例を翻訳した中国語の文例とが得られる。そして、これらの各文例は表示制御部25によって出力部で表示されるため、ユーザは、少なくとも自身が入力した文と同じ文例あるいは最も近い文例の翻訳結果を確認することができる。
 このように、翻訳装置1は、所定の語句で構成された固定部と予め定められた複数の語句のうちの何れかの語句に置換可能な可変部とをそれぞれ対応する位置に含んだ、第1言語(例えば、日本語)によるテンプレートと当該テンプレートと対応関係にある第2言語(例えば、英語)によるテンプレートとを記憶した記憶装置13から、第1言語によるテンプレートと第2言語によるテンプレートとを読み出すデータ読出部21と、データ読出部21によって読み出された第1言語による複数のテンプレートについて、入力部10を介して第1言語で入力された文に含まれる語句が、上記所定の語句および上記予め定めた複数の語句の何れかと一致するかを判定する判定部22と、当該判定の結果に基づいて、上記複数のテンプレートの中から、少なくとも一つのテンプレートを選択する選択部23と、選択部23によって上記一致した語句に置換可能な可変部を含むテンプレートが選択された場合、データ読出部21によって読み出された、上記選択されたテンプレートと対応関係にある第2言語によるテンプレートについて、上記一致した語句に置換可能な可変部に対応した可変部を、上記一致した語句に対応する第2言語による語句に置換する第1置換部24とを備える構成であるといえる。
 それゆえ、このような構成では、第1言語による各テンプレートの可変部における語句を上記複数の語句から選ぶことができるため、当該可変部において語句の選択の幅を持たせることができる。例えば、可変部においてn個の語句が置換可能な場合、翻訳装置1は、一つのテンプレートにより、n通りの文例を作成することができる。また、例えば2つの可変部を有する場合、一方の可変部においてn個の語句が置換可能であって、他方の可変部においてm個の語句が置換可能である場合、翻訳装置1は、一つのテンプレートから、n×m個の文例を作成することができる。
 このように、可変部を有さない従来の装置と、本実施の形態に係る翻訳装置1とにおいて、仮に同じ数のテンプレートを備えた構成とした場合、作成可能な文例の数は明らかに本実施の形態に係る翻訳装置1の方が多くなる。このため、本実施の形態に係る翻訳装置1の方が、従来の装置に比べ、正確な文例を選ぶことが可能となる。
 また、特に、シソーラスデータを用いることにより、翻訳装置1は、一つの可変部に含まれる語句を容易に決めることができる。また、シソーラスデータを用いれば、一つの可変部における上記複数の語句を、概念的に似通った語句とすることができる。このため、意味の通じない文例が作成されるおそれがなくなる。
 また、翻訳装置1は、少なくとも、第1置換部24による置換を行った後の第2言語によるテンプレートに基づく画像を出力部11に表示させる表示制御部25を備える構成でもある。それゆえ、当該構成により、翻訳装置1のユーザは、第2言語による文例を確認することができる。
 さらに、翻訳装置1は、選択部23によって第1言語によるテンプレートが選択された場合、一致した語句に置換可能な可変部を前記一致した語句に置換するとともに、第1置換部24による置換を行った後の第1言語によるテンプレートに基づく画像を出力部11に表示させる構成でもある。それゆえ、当該構成により、ユーザは、第1言語による文例と第2言語による文例とを同時に確認することができる。
 特に、翻訳装置1では、図4に示したとおり、記憶装置13には、第1言語によるテンプレートの可変部における上記予め定めた複数の語句それぞれについて、第2言語に翻訳した語句が一つ対応付けて記憶されている。そして、第1置換部24が、第2言語によるテンプレートの可変部を、記憶装置13において上記対応付けて記憶された第2言語に翻訳した語句に置換する。それゆえ、翻訳装置1においては、第1言語のテンプレートの可変部において置換された語句に対応する、第2言語による語句が一意に定まる。したがって、翻訳装置1は、第2言語によるテンプレートに基づいた、正確な第2言語の文例を得ることができる。
 また、翻訳装置1では、上述したように、第1言語によるテンプレートの可変部と、当該可変部に対応した第2言語によるテンプレートの可変部とには、語句の活用形に関する情報が対応付けられている。そして、第1置換部24が、この活用形に関する情報に基づいて、上記置換した語句について語形を変化させる。それゆえ、翻訳装置1は、第1言語による文例と第2言語による文例とのそれぞれについて、語形を変化させない場合に比べ、より正確な文例とすることができる。
 また、翻訳装置1では、上述したように、第2言語によるテンプレートには可変部として、スロット部と共起部とが含まれており、第1置換部24は、スロット部を第2言語による語句に置換するとともに、当該置換後の語句に応じて共起部の語句を決定する。それゆえ、スロット部において置換された語句に対応した語句を用いて、共起部を置換可能となる。したがって、翻訳装置1は、置換後の語句に応じて共起部の語句を決定しない構成に比べ、より正確な文例を作成することができる。
 ところで、図29BのステップS814およびステップS815についての具体例を挙げた説明においては、共起置換部42が、テンポラリ第1共起バッファ81に書き込んだ共起情報(CX)に基づき、共起関係対応データベースから共起関係対応データを読み出す構成を説明した。ここでは、共起置換部42が、テンポラリ第1共起バッファ81に書き込んだ共起情報(CX)と、テンポラリ第2共起バッファ82に書き込んだ共起情報(CHX)とに基づき、共起関係対応データベースから共起関係対応データを読み出す構成を図41から図45に基づいて説明する。
 図41は、テンプレートデータベース60に記憶されているテンプレートデータの構成を示したものである。説明の便宜上、日本語テンプレートと英語テンプレートとを示している。同図に示すとおり、日本語テンプレートには、「{1:NOUN}」といったスロット部が含まれている。また、英語テンプレートには、「{1-i:NOUN}」といったスロット部と、「{-i:DET_A}」および「{-i#CLASSIFIER}」といった共起部とが含まれている。
 ここで、「{-i#CLASSIFIER}」に関する共起情報が共起情報(CHX)に該当する。つまり、以下では、「{1:NOUN}」に関するスロット情報と「{-i#CLASSIFIER}」に関する共起情報とに基づき、「{-i:DET_A}」に置換される語句が決定される。
 図42は、図41に示したテンプレートデータにおける日本語テンプレートのスロット部において置換される語句の例を示した図である。なお、図41においては、入力例Aと入力例Bと入力例Cと入力例Dとは、それぞれ、「{1:NOUN}」といったスロット部において置換された語句の例を挙げたものである。例えば入力例Aは、「{1:NOUN}」といったスロット部が「コーヒー」で置換された場合を示している。
 図43は、辞書データベース61に記憶されておる辞書データを示した図である。同図に示すとおり、辞書データには、日本語の語句と当該語句に対応する英語の語句とが対応付けて記憶されている。また、辞書データにおいては、当該英語の各語句に対して、助数詞に関する情報が対応付けて記憶されている。
 図44は、このようなテンプレートデータと辞書データとを用いて、英語の文例を作成する際のフローを示したフローチャートである。
 まず、日本語テンプレートのスロット部「{1:NOUN}」において置換された語句に応じて、スロット置換部41が、辞書データを参照することにより、英語テンプレートのスロット部「{1-i:NOUN}」を、例えば「coffee」といった語句に置換する(S901)。ステップS901の後は、共起置換部42が、英語テンプレートの共起部「{-i#CLASSIFIER}」に関し、置換する語句を決定する(S902)。
 例えば入力例Aの場合には、ステップS902においては、共起置換部42は、辞書データを参照することにより、共起部「{-i#CLASSIFIER}」を「cup of」といった語句で置換することを決定する。また、入力例Bの場合には、同様に、共起置換部42は、共起部「{-i#CLASSIFIER}」を「order of」といった語句で置換することを決定する。一方、入力例Cの場合には、辞書データを参照すると、「ペン」といった語句に対応する助数詞の情報が「(NULL)」であるため、共起置換部42は、共起部「{-i#CLASSIFIER}」を「(NULL)」で置換することを決定する。入力例Dの場合についても、「入力例C」の場合と同様である。
 ステップS902の後は、共起置換部42が、辞書データに基づいて、共起部「{-i#CLASSIFIER}」に関し、決定された語句の訳があるか否かを判断する(S903)。
 ステップS903において訳があると判断された場合、共起置換部42が、当該決定された語句の読みに基づき、共起部「{-i:DET_A}」を「a」で置換するか、それとも「an」で置換するかを決定する(S904)。例えば、入力例Aの場合には、共起置換部42は、共起部「{-i:DET_A}」を「a」で置換することを決定する。また、入力例Bの場合には、共起置換部42は、共起部「{-i:DET_A}」を「an」で置換することを決定する。
 一方、ステップS903において訳がないと判断された場合、共起置換部42が、「{1-i:NOUN}」といったスロット部において置換されることが決定した語句の読みに基づき、共起部{-i:DET_A}」を「a」で置換するか、それとも「an」で置換するかを決定する(S905)。例えば、入力例Cの場合には、共起置換部42は、共起部「{-i:DET_A}」を「a」で置換することを決定する。また、入力例Dの場合には、共起置換部42は、共起部「{-i:DET_A}」を「an」で置換することを決定する。
 ステップS904とステップS905の後は、制御部12は、処理をステップS906に進める。ステップS906においては、共起置換部42は、共起部「{-i#CLASSIFIER}」において置換する語句として決定された語句と、共起部「{-i:DET_A}」において置換する語句として決定された語句を用いて、それぞれの共起部を置換する。ただし、「(NULL)」とは、上述したとおり、何も記さないことを意味する記号であるため、共起置換部42は「-i#CLASSIFIER」を消去する。
 その結果、翻訳装置1は、図45に示すとおり、入力例A~入力例Dのそれぞれについて、スロット部と2つの共起部とが語句で置換された英語文例を生成する。
 ところで、上記の説明においては、スロット部において置換する語句は、スロット部同士の間で独立して決定可能な構成を例に挙げて説明した。つまり、例えば図3において、「{1:&HUMAN-SUBJ}」と「{2:&VB_EAT+v.ren1}」との何れを先に決定しても問題ない構成について説明した。以下では、スロット部間において共起関係を形成する2つの例について、図46から図55に基づいて説明する。
 まず、一つ目の例を、図46から図50に基づいて説明する。
 図46は、テンプレートデータベース60に記憶されているテンプレートデータの構成を示したものである。説明の便宜上、日本語テンプレートと英語テンプレートとを示している。同図に示すとおり、日本語テンプレートには、「{1:THIS-THAT}」と「{2:GOODS}」といった2つのスロット部が含まれている。また、英語テンプレートには、「{1-i:THIS-THAT}」と「{2-i:GOODS}」といった2つのスロット部が含まれている。この英語テンプレートの両方のスロット部においては、「-i」といった符号が付されている。つまり、両スロット部は互いに共起関係を有している。
 図47は、図46に示したテンプレートデータにおける日本語テンプレートのスロット部において置換された語句の例を示した図である。なお、図47においては、入力例Aと入力例Bと入力例Cと入力例Dとは、それぞれ、「{1:THIS-THAT}」と「{2:GOODS}」といったスロット部において置換された語句の例を挙げたものである。例えば入力例Aは、「{1-i:THIS-THAT}」といったスロット部が語句W40(指示代名詞)で置換され、「{2-i:GOODS}」といったスロット部が語句W41(名詞)で置換された場合を示している。
 図48は、辞書データベース61に記憶されておる辞書データを示した図である。同図に示すとおり、辞書データには、日本語の語句と当該語句に対応する英語の語句とが対応付けて記憶されている。また、辞書データにおいては、当該英語の各語句に対して、当該各語句の複数形に関する情報が対応付けて記憶されている。
 図49は、このようなテンプレートデータと辞書データとを用いて、英語の文例を作成する際のフローを示したフローチャートである。なお、以下では、日本語テンプレートのスロット部における置換処理は終了しているものとし、英語テンプレートのスロット部における置換処理を説明する。
 まず、スロット置換部41が、英語テンプレートのスロット部「{1-i:THIS-THAT}」において置換される語句が、複数形であるか否かを判断する(S1001)。ここで、語句が複数形であるか否かの判断は、スロット置換部41が辞書データベース61を参照することにより行なう。なお、辞書データベース61には、語句が単数あるいは複数形であることを示す情報が記憶されている。
 例えば入力例Aと入力例Bと入力例Cとの場合には、ステップS1001において、スロット置換部41は、複数形でないと判断する。一方、入力例Dと入力例Eと入力例Fとの場合には、ステップS1001において、スロット置換部41は、複数形であると判断する。
 ステップ1001において複数形であると判断された場合には、スロット置換部41が、英語テンプレートのスロット部「{2-i:GOODS}」において置換される語句が複数形を有するか否かを判断する(S1002)。一方、ステップS1001において複数形ではないと判断された場合には、制御部12は、処理をステップS1004に進める。
 ステップS1002において複数形を有すると判断された場合には、スロット置換部41が、図48に示した辞書データを参照することにより、上記英語テンプレートのスロット部「{2-i:GOODS}」に用いられる英語の語句を複数形に変換する(S1003)。一方、ステップS1002において複数形を有しないと判断された場合には、制御部12は、処理をステップS1004に進める。
 例えば入力例Dの場合には、ステップS1003において、スロット置換部41は、「book」という語句を「books」といった複数形の語句に変換する。また、同様に、入力例Eの場合には、スロット置換部41は、「trousers」という語句を「trousers」といった複数形(この場合、単数形と複数形とで同一)の語句に変換する。一方、例えば、入力例Fの場合には、図48にも示すとおり「luggage」という語句に複数形は存在しないので、この場合には、制御部12は、処理をステップS1004に進める。
 ステップS1004においては、スロット置換部41が、再度、英語テンプレートのスロット部「{2-i:GOODS}」において置換される語句が複数形を有するか否かを判断する。ステップS1004において複数形を有すると判断された場合には、スロット置換部41が、英語テンプレートのスロット部「{2-i:GOODS}」において置換される語句が複数形であるか否かを判断する(S1005)。一方、ステップS1004において複数形を有しないと判断された場合には、スロット置換部41が、辞書データを参照することにおより、英語テンプレートのスロット部「{1-i:THIS-THAT}」に用いられる語句を単数形に変換する(S1006)。そして、ステップS1006の後は、ステップS1008に進む。
 例えば、入力例Aと入力例Bと入力例Dと入力例Eとの場合には、ステップS1004において、スロット置換部41は、英語テンプレートのスロット部「{2-i:GOODS}」において置換される語句が複数形を有すると判断する。一方、入力例Cと入力例Fとの場合には、ステップS1006において、スロット置換部41は、スロット部「{2-i:GOODS}」を単数形に変換する。具体的には、入力例Cの場合には、実質的な変更はないが、スロット置換部41は「this」を「this」に変換する。また、入力例Fの場合には、スロット置換部41は、「these」を「this」に変換する。
 そして、ステップS1005においては、スロット置換部41は、入力例Aと入力例Bと入力例Dと入力例Eとのうち、入力例Bと入力例Dと入力例Eとについては、スロット部「{2-i:GOODS}」において置換される語句が複数形であると判断する。一方、同ステップにおいては、スロット置換部41は、入力例Aについては、スロット部「{2-i:GOODS}」において置換される語句が複数形でないと判断する。
 ステップS1005において複数形であると判断された場合には、スロット置換部41が、英語テンプレートのスロット部「{1-i:THIS-THAT}」に用いられる語句を複数形に変換する(S1007)。そして、ステップS1007の後は、制御部12は、処理をステップS1008に進める。一方、ステップS1005において複数形でないと判断された場合には、語句を複数形に変換することなく、制御部12は、処理をステップS1008に進める。
 例えば、入力例Bと入力例Dと入力例Eとの場合には、ステップS1007において、スロット置換部41は、英語テンプレートのスロット部「{1-i:THIS-THAT}」において置換される語句を複数形に変換する。具体的には、入力例Bの場合には、スロット置換部41は、「this」を「these」に変換する。また、入力例Dと入力例Eとの場合には、実質的な変更はないが、スロット置換部41は、「these」を「these」に変換する。
 ステップS1008においては、スロット置換部41が、上述した変換処理後の語句を用いて、スロット部「{1-i:THIS-THAT}」とスロット部「{2-i:GOODS}」とを置換する。
 以上の結果、図50に示すとおり、入力例A~入力例Fのそれぞれについて、2つのスロットが語句で置換された英語文例が生成される。
 次に、二つ目の例を、図51から図55に基づいて説明する。
 図51は、テンプレートデータベース60に記憶されているテンプレートデータの構成を示したものである。説明の便宜上、日本語テンプレートと英語テンプレートとを示している。同図に示すとおり、日本語テンプレートには、「{1-i:NOUN}」と「{2:NUM}」と「{3-i:CLASSIFIER}」といった3つのスロット部が含まれている。また、英語テンプレートには、「{2-j:NUM}」と「{3-j:CLASSIFIER}」と「{1-j:NOUN}」といった3つのスロット部が含まれている。この英語テンプレートの3つスロット部においては、共起関係を示す「-j」といった符号が付されている。つまり、3つのスロット部は互いに共起関係を有している。
 図52は、図51に示したテンプレートデータにおける日本語テンプレートのスロット部において置換される語句の例を示した図である。なお、図52においては、入力例Aと入力例Bとは、それぞれ、「{1-i:NOUN}」と「{2:NUM}」と「{3-i:CLASSIFIER}」といったスロット部において置換される語句の例を挙げたものである。例えば入力例Aは、「{1-i:NOUN}」といったスロット部が語句W42(名詞)で置換され、「{2:NUM}」といったスロット部が「2」で置換され、「{3-i:CLASSIFIER}」といったスロット部が語句W43(名詞)で置換された場合を示している。
 図53は、辞書データベース61に記憶されておる辞書データを示した図である。同図に示すとおり、辞書データには、日本語の語句と当該語句に対応する英語の語句とが対応付けて記憶されている。
 図54は、このようなテンプレートデータと辞書データとを用いて、英語の文例を作成する際のフローを示したフローチャートである。
 まず、スロット置換部41が、辞書データを参照し、日本語テンプレートのスロット部「{1-i:NOUN}」において置換された語句に応じて、日本語テンプレートのスロット部「{3-i:CLASSIFIER}」において置換可能な語句の候補を選定する(S1101)。例えば、図52に示す入力例Aの場合には、スロット置換部41は、上記候補として、語句W43と語句W41(図53参照)とを選定する。また、同図に示す入力例Bの場合には、スロット置換部41は、上記候補として、語句W44(名詞)を選定する。
 ステップS1101の後は、スロット置換部41は、スロット部{3-i:CLASSIFIER}」において一旦置換された語句に基づき、上記候補のうちから一つの語句を決定する(S1102)。スロット置換部41は、例えば、入力例Aの場合には、日本語テンプレートのスロット部「{3-i:CLASSIFIER}」において置換可能な語句を語句W43に決定し、入力例Bの場合には、当該スロット部「{3-i:CLASSIFIER}」において置換可能な語句を語句W44に決定する。
 そして、ステップS1102の後は、制御部12は、処理を英語テンプレートの処理に移行する。
 ステップS1102の後は、スロット置換部41により、日本語テンプレートのスロット部「{2:NUM}」が「2」以上であるか否かが判断される(S1103)。ステップS1103において「2」以上であると判断された場合には、スロット置換部41が、日本語テンプレートのスロット部{3-i:CLASSIFIER}」における語句の訳が存在するか否かを判断する(S1104)。一方、ステップS1103において「2」以上でないと判断された場合には、ステップS1107に進む。
 ステップS1104において訳が存在すると判断された場合には、スロット置換部41は、英語テンプレートのスロット部「{3-j:CLASSIFIER}」の語句を複数形に変換する(S1105)。そして、ステップS1105の後は、制御部12は、処理をステップS1107に進める。一方、ステップS1104において訳が存在しないと判断された場合には、スロット置換部41は、英語テンプレートのスロット部「{2-j:NOUN}」の語句を複数形に変換する(S1106)。そして、ステップS1106の後は、制御部12は、処理をステップS1107に進める。
 例えば入力例Aの場合には、ステップS1105において、スロット置換部41は、「glass of」を「glasses of」に変換する。また、入力例Bの場合には、ステップS1106において、スロット置換部41は、「magazine」を「magazines」に変換する。
 そして、ステップS1107においては、翻訳装置1は、変換後の語句を用いて置換処理を行なう。
 以上の結果、図55に示すとおり、翻訳装置1は、入力例Aおよび入力例Bのそれぞれについて、各スロットが語句で置換された英語文例を生成する。
 なお、上記の実施の形態においては、図13のフローにも示すとおり、テンプレートデータベース内の全てのテンプレートデータを検索対象とし、抽出した語句が固定部または可変部に含まれるようなテンプレートを検索する構成を例に挙げて説明した。しかしながら、これに限定されるものではなく、テンプレートデータの一部のテンプレートを検索の対象としてもよい。
 また、上記においては、図3に示すとおり、複数の言語のテンプレートが1つのテンプレートデータに含まれる構成を例に挙げて説明したが、これに限定されるものではない。例えば、一つのテンプレートデータには一つの言語のテンプレートデータが含まれている構成としてもよい。この場合、上記一つの言語のテンプレートデータと対応関係にある他の言語のテンプレートデータが、当該一つの言語のテンプレートデータと関連付けられて記憶装置13に記憶されていればよい。
 また、上記においては、図7に示すとおり、シソーラスデータを用いた例を挙げて説明したが、これに限定されるものではない。
 あくまでも、可変部において置換可能な上記予め定められた複数の語句は、所定の識別標識により特定される語句であればよい。つまり、シソーラスデータにおける区分としてのラベルで特定される語句に限定されず、予め区分が設けられたデータにおける或る区分を表す識別標識で特定される語句であればよい。
 例えば、記憶装置13に記憶された第1言語の辞書データでは、当該辞書データに含まれる語句のうち全部または一部の語句が、それぞれ、少なくとも一つのグループに属するように分類しておき、上記所定の識別標識を、前記複数のグループのうちの所定のグループを示す標識としてもよい。つまり、ある語句「A」を、少なくとも一つのグループ(例えば、グループAおよびグループB)に含まれるようにしておき、例えば上記所定の識別標識としてグループBを示す標識を用いた場合には、グループBに含まれる語句全てが、一つの可変部において置換対象となるようにすればよい。
 また、翻訳装置1は、出力部11において画像を出力する構成であったが、これに限定されるものではない。例えば、翻訳装置1を、画像を出力すると共に、得られた各言語の文例を音声出力する構成としてもよい。また、翻訳装置1を、当該文例を画像出力することなく、単に、音声出力するだけの構成としてもよい。
 以上述べてきたように、本実施の形態に係る翻訳装置1を用いることにより、入力文とテンプレートとのマッチングの際に、同一意味概念の言葉(語句)は同定される。その結果、翻訳装置1は、適切な文例(ベースとなる文例)の選択が可能となる。また、テンプレートにおける一文中の可変部の数が増えても、不当に類似度(マッチ度合い)が低下することはない。さらに、テンプレートにおいて、予め可変部となる箇所がスロット化されて特定されているため、翻訳装置1は、非マッチ部分の特定を誤ることがない。また、可変部で置換可能な語句が予め対訳辞書に指定されているため、翻訳装置1は、確実な訳語置換を行なうことができる。さらに、共起関係を記したテンプレート、共起関係対応データ、活用形に関する情報等のデータを用いるため、翻訳装置1は、従来の用例主導型方式をはじめとする各種方式の翻訳装置では実現できなかった「100%正しい」といえる翻訳結果を得ることがきる。
 <翻訳装置1の変形例>
 ところで、上記においては、翻訳装置1は、翻訳処理を実行しない場合であっても、図3に示した形式の日本語テンプレートや英語テンプレートを、記憶装置13のテンプレートデータベース60に記憶している。以下では、翻訳装置が、翻訳処理を実行する際に、記憶装置13のテンプレートデータベースに予め記憶されたテンプレートに基づいて、日本語テンプレートおよび英語テンプレートを生成する構成について説明する。なお、以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。
 図56は、翻訳装置1Aの概略構成を示した図である。図56を参照して、翻訳装置1Aは、入力部10と、出力部11と、制御部12Aと、記憶装置13Aと、メモリ14Aとを備えている。つまり、翻訳装置1Aが制御部12Aおよび記憶装置13Aを有する点において、制御部12および記憶装置13を有する翻訳装置1とは異なる。
 記憶装置13Aは、テンプレートデータベース60Aと、辞書データベース61と、日本語活用形テーブル62と、カテゴリデータベース63と、シソーラスデータ64と、共起関係データベース65とを記憶している。
 テンプレートデータベース60Aは、日本語テンプレートデータの代わりに、当該日本語テンプレートを生成するためのテンプレート(以下、「テンプレートTJ」と称する)を記憶している。また、記憶装置13Aは、英語テンプレートの代わりに、当該英語テンプレートを生成するためのテンプレート(以下、「テンプレートTE」と称する)を記憶している。また、記憶装置13Aは、中国語テンプレートの代わりに、当該中国語テンプレートを生成するためのテンプレート(以下、「テンプレートTC」と称する)を記憶している。テンプレートTJ、テンプレートTE、およびテンプレートTCの概要については、後述する(図57参照)。
 メモリ14Aは、抽出語句バッファ70と、検索結果テンプレートバッファ71と、スロット部用バッファ72と、共起部用バッファ73と、優先共起バッファ74と、処理文格納バッファ75と、翻訳結果バッファ76と、テンポラリテンプレートバッファ77と、テンポラリ辞書バッファ78と、テンポラリ語句バッファ79と、テンポラリスロットバッファ80と、テンポラリ第1共起バッファ81と、テンポラリ第2共起バッファ82と、入力文バッファ83と、展開データ格納バッファ(図示せず)と、処理待ちバッファ(図示せず)と、要素バッファ(図示せず)とを備えている。
 制御部12Aは、抽出部20と、データ読出部21Aと、判定部22と、選択部23と、第1置換部24と、表示制御部25と、出力文整形部26と、テンプレート生成部27とを備えている。
 データ読出部21Aは、記憶装置13Aから上記テンプレートTJと上記テンプレートTEとを読み出す。
 テンプレート生成部27は、読み出されたテンプレートTJとテンプレートTEとテンプレートTCとに基づき、日本語テンプレートと当該日本語テンプレートと対応関係にある英語テンプレートおよび中国語テンプレートとをそれぞれ複数生成する。テンプレート生成部27は、当該生成した日本語テンプレートと英語テンプレートと中国語テンプレートとを記憶装置13Aに記憶させる。
 以上の処理により、翻訳装置1Aは、記憶装置13Aに、日本語テンプレートと英語テンプレートと中国語テンプレートとを記憶させることができる。以下、テンプレートTJ、テンプレートTE、およびテンプレートTCの構成を説明しつつ、テンプレート生成部27の詳細な処理を説明する。
 図57は、テンプレートデータベース60Aに含まれる一つのテンプレートデータの構成を示した図である。図57を参照して、テンプレートデータは、テンプレートIDと、テンプレートTJと、テンプレートTEと、テンプレートTCとを含んでいる。
 テンプレートTJは、所定の語句で構成された第1部と、予め定められた複数の語句のうちの何れかの語句に置換可能な可変部と、予め定められた複数の要素のうちの何れかの要素を選択可能な第2部とを含んでいる。
 図57においては、語句W36、語句W45(否定を示す文字)、および語句W46(句点)が第1部に該当する。また、{1:&LANGUAGE}が可変部に該当する。さらに、文字列W47と、{2:(&VB_EXPLAIN+v.kanou)|(&VB_PRONOUNCE+v.kanou)|(&VB_INTERPRET+v.kanou)}とが、第2部に該当する。
 テンプレートTEは、テンプレートTJと同様に、第1部と可変部と第2部とを含んでいる。図57においては、「I」と「can't」とが第1部に該当する。また、{1:&LANGUAGE}が可変部に該当する。さらに、{2:(&VB_EXPLAIN+inf) it in|(&VB_PRONOUNCE+inf) it in|(&VB_INTERPRET+inf) it in}が第2部に該当する。
 テンプレートTCについても、図57に示すとおり、テンプレートTJとテンプレートTEと同様に、第1部と可変部と第2部とを含んでいる。
 以上のように、テンプレートTJとテンプレートTE(あるいはテンプレートTC)とは、所定の語句で構成された第1部と予め定められた複数の要素のうちの何れかの要素を選択可能な第2部とを含んでいる。
 翻訳装置1Aにおける処理の概略は、図12に示したフローチャートと同じである。ただし、翻訳装置1Aにおけるテンプレート検索(ステップS2)の処理は、図13に示したフローチャートとは異なる。
 図58は、テンプレート検索における前半の処理の流れを示したフローチャートである。図59は、当該テンプレート検索における後半の処理の流れを示したフローチャートである。図58を参照して、ステップS202とステップS203との間に、新たに2つのステップS2001,S2002を含む点で、図58の処理は図13の処理(ステップS201~ステップS204)とは異なる。図59を参照して、ステップS207とステップS208との間に、新たにステップS2003を含む点で、図59の処理は図13の処理(ステップS205~ステップS208)とは異なる。
 再び図58を参照して、ステップS2001において、テンプレート生成部27は、記憶装置13Aから読み出されたテンプレートデータ(図57参照)を展開し、当該展開して得られたテンプレートデータを上記展開データ格納バッファに書き込む。テンプレート生成部27は、テンプレートデータの展開により、少なくとも1つ以上のテンプレートデータを展開データ格納バッファに書き込む。ステップS2002において、テンプレート生成部27は、展開データ格納バッファからテンプレートデータを1つ読み出す。
 再び図59を参照して、ステップS2003において、テンプレート生成部27は、未だ読み出していないテンプレートデータが展開データ格納バッファに存在するか否かを判断する。テンプレートデータが存在すると判断された場合(ステップS2003においてYES)、翻訳装置1Aは、処理をステップS2002に戻す。一方、テンプレートデータが存在しないと判断された場合(ステップS2003においてNO)、翻訳装置1Aは、処理をステップS208に進める。ステップS208においては、制御部12が、テンプレートデータベース60A内に、未だ読み出していないテンプレートデータがテンプレートデータベースに存在するか否かを判断する。
 図60は、図58におけるステップS2001の詳細の一部を示したフローチャートである。図61は、図58におけるステップS2001の詳細の残りの部分を示したフローチャートである。
 図60を参照して、ステップS2101において、翻訳装置1Aは、ステップS202にて読み出した一つのテンプレートデータを、処理待ちバッファに格納する。例えば、翻訳装置1は、図57に示したテンプレートデータを処理待ちバッファに格納する。以下では、図57に示したテンプレートデータ(以下、「テンプレートデータ(ID1971-1)」と称する)が処理待ちバッファに格納された場合を例に挙げて説明する。
 ステップS2103において、翻訳装置1Aは、処理待ちバッファから、テンプレートデータを1件読み出す。処理待ちバッファにテンプレートデータ(ID1971-1)のみが格納されているため、翻訳装置1Aは、このテンプレートデータ(ID1971-1)を読み出す。
 ステップS2105において、翻訳装置1Aは、読み出したテンプレートデータ内に「|」といった区分けを示す記号が存在するか否かを判断する。記号「|」が存在すると判断された場合(ステップS2105においてYES)、翻訳装置1Aは、処理をステップS2111(図61参照)に進める。
 記号「|」が存在しないと判断された場合(ステップS2105においてNO)、ステップS2107において、翻訳装置1Aは、テンプレートデータを展開データ格納バッファに書き込む。そして、ステップS2109において、翻訳装置1Aは、処理待ちバッファ内に読み出していないテンプレートデータが存在するか否かを判断する。テンプレートデータが存在すると判断された場合(ステップS2109においてYES)、翻訳装置1Aは、処理をステップS2103に戻す。一方、テンプレートデータが存在しないと判断された場合(ステップS2109においてNO)、翻訳装置1Aは、処理をステップS2002(図58参照)に進める。
 テンプレートデータ(ID1971-1)は記号「|」を含んでいるため、翻訳装置1Aは、ステップS2105の後、ステップS2111を実行する。図61を参照して、ステップS2111において、翻訳装置1Aは、記号「|」を含む第2部を1つ読み出す。たとえば、翻訳装置1Aは、テンプレートデータ(ID1971-1)のテンプレートTJから、文字列W47(図57参照)を読み出す。
 ステップS2113において、翻訳装置1Aは、読み出した第2部の「{}」内において「|」で仕切られて存在している各要素を、要素バッファに書き込む。具体的には、翻訳装置1Aは、図62に示すとおり、語句W48(副詞)と語句W49(副詞)と「 」(つまり空白)とを要素バッファの日本語の欄に書き込む。なお、図62は、1度目のステップS2113の処理において、要素が書き込まれた後の要素バッファの状態を示した図である。なお、テンプレートTEおよびテンプレートTCには、文字列W47に対応する第2部が存在しないため、翻訳装置1Aは、要素バッファの英語および中国語の欄について、「Null」の状態を維持する。
 ステップS2115において、翻訳装置1Aは、要素内にラベルが存在するか否かを判断する。ラベルが存在すると判断された場合(ステップS2115においてYES)、ステップS2117において、翻訳装置1Aは、読み出した要素内に、「()」が存在するか否かを判断する。「()」が存在すると判断された場合(ステップS2117においてYES)、ステップS2119において、翻訳装置1Aは、まず、要素バッファにおいて、「(」を「{」に変更するとともに、「)」を「}」に変更する。さらに、ステップS2119において、翻訳装置1Aは、「{」の後にスロット番号を追記する。一方、「()」が存在しないと判断された場合(ステップS2117においてNO)、翻訳装置1Aは、要素バッファにおいて、要素全体を「()」で括るとともに、「{」の後にスロット番号を追記する。
 一方、ラベルが存在しないと判断された場合(ステップS2115においてNO)、翻訳装置1Aは、処理をステップS2123に進める。ステップS2123において、翻訳装置1Aは、テンプレートデータを要素バッファ内の各要素を用いて書き換え、当該書き換えたテンプレートデータを処理待ちバッファに格納する。
 上記のように、要素バッファに、語句W48と語句W49と「 」(つまり空白)とが書き込まれている場合(図62参照)、ステップS2115において、翻訳装置1Aは、ラベルが存在しないと判断する。このため、ステップS2123の処理の結果、翻訳装置1Aは、図63に示すテンプレートデータ、図64に示すテンプレートデータ、および図65に示すテンプレートデータを、処理待ちバッファに格納する。
 なお、図63は、処理待ちバッファに格納した後の1つのテンプレートデータ(以下、「テンプレートデータ(1971-1_1)」と称する)を示した図である。なお、テンプレートデータ(1971-1_1)は、翻訳装置1が、テンプレートデータ(ID1971-1)の文字列W47を、語句W48(要素)を用いて書き換えることにより得られらデータである。
 また、図64は、処理待ちバッファに格納した後の他のテンプレートデータ(以下、「テンプレートデータ(1971-1_2)」と称する)を示した図である。なお、テンプレートデータ(1971-1_2)は、翻訳装置1が、テンプレートデータ(ID1971-1)の文字列W47を、語句W49(要素)を用いて書き換えることにより得られるデータである。
 さらに、図65は、処理待ちバッファに格納した後のさらに他のテンプレートデータ(以下、「テンプレートデータ(1971-1_3)」と称する)を示した図である。なお、テンプレートデータ(1971-1_3)は、翻訳装置1が、テンプレートデータ(ID1971-1)の文字列W47を、「 」(つまり空白)といった要素を用いて書き換えることにより得られらデータである。
 翻訳装置1Aが、テンプレートデータ(1971-1_1)、テンプレートデータ(1971-1_2)、およびテンプレートデータ(1971-1_3)を処理待ちバッファに格納した場合、ステップS2103において、翻訳装置1は、当該格納した3つのテンプレートデータから、1つのテンプレートデータを読み出す。ここで、翻訳装置1Aが、テンプレートデータ(ID1971-1_1)を読み出したとする。この場合、翻訳装置1Aは、ステップS2105においては肯定的な判断をし、翻訳装置1Aは、処理をステップS2111に進める。
 図66は、2度目のステップS2113の処理において、要素が書き込まれた後の要素バッファの状態を示した図である。図66を参照して、翻訳装置1Aは、「(&VB_EXPLAIN+v.kanou)」と「(&VB_PRONOUNCE+v.kanou)」と「(&VB_INTERPRET+v.kanou)」とを、要素バッファの日本語の欄に書き込む。また、翻訳装置1Aは、「(&VB_EXPLAIN+inf) it in」と「(&VB_PRONOUNCE+inf) it in」と「(&VB_INTERPRET+inf) it in」とを、要素バッファの英語の欄に書き込む。なお、翻訳装置1Aは、要素バッファの中国語の欄についても、日本語の欄および英語の欄と同様の処理を行なう。
 要素バッファの状態が、ステップS2113の処理により図66に示す状態となった場合、要素内にラベルが存在するため、翻訳装置1Aは、ステップS2115において肯定的な判断を行い、処理をステップS2117に進める。さらに、読み出した要素内に「()」が存在するため、翻訳装置1Aは、ステップS2117において肯定的な判断を行い、処理をステップS2119に進める。
 1度目のステップS2117の処理を行なった後、翻訳装置1Aは、要素バッファの各言語の欄において、まず、「(」を「{」に変更するとともに、「)」を「}」に変更する。さらに、翻訳装置1Aは、「{」の後にスロット番号「2」を追記する。なお、図67は、当該1度目のステップS2117の処理を行なった後の、要素バッファの状態を示した図である。
 当該ステップS2117の後、翻訳装置1AがステップS2123の処理を行なうことにより、処理待ちバッファには、テンプレートデータ(ID1971-1_2)と、テンプレートデータ(ID1971-1_3)と、図68に示すテンプレートデータと、図69に示すテンプレートデータと、図70に示すテンプレートデータとが格納される。
 なお、図68は、テンプレートデータ(ID1971-1_1)を、図67に示す要素1を用いて書き換えたテンプレートデータ(以下、「テンプレートデータ(ID1971-1_11)」と称する)を示した図である。また、図69は、テンプレートデータ(ID1971-1_1)を、図67に示す要素2を用いて書き換えたテンプレートデータ(以下、「テンプレートデータ(ID1971-1_12)」と称する)を示した図である。図70は、テンプレートデータ(ID1971-1_1)を、図67に示す要素3を用いて書き換えたテンプレートデータ(以下、「テンプレートデータ(ID1971-1_13)」と称する)を示した図である。
 ステップS2123の後は、ステップS2103において、翻訳装置1Aは、処置待ちバッファから、上記5つのテンプレートデータのうち、1つのテンプレートデータを読み出す。
 図60および図61に示す一連の処理が完了した時点において、展開データ格納バッファには、図68から図76に示す9つのテンプレートデータが書き込まれている。
 なお、図71は、テンプレートデータ(ID1971-1_2)を、図67に示す要素1を用いて書き換えたテンプレートデータを示した図である。図72は、テンプレートデータ(ID1971-1_2)を、図67に示す要素2を用いて書き換えたテンプレートデータを示した図である。図73は、テンプレートデータ(ID1971-1_2)を、図67に示す要素3を用いて書き換えたテンプレートデータを示した図である。
 また、図74は、テンプレートデータ(ID1971-1_3)を、図67に示す要素1を用いて書き換えたテンプレートデータを示した図である。図75は、テンプレートデータ(ID1971-1_3)を、図67に示す要素2を用いて書き換えたテンプレートデータを示した図である。図76は、テンプレートデータ(ID1971-1_3)を、図67に示す要素3を用いて書き換えたテンプレートデータを示した図である。
 このように、翻訳装置1Aは、図57に示した1つのテンプレートデータに基づいて、図63から図65、および図71から図76に示した9つのテンプレートを生成することができる。
 なお、上記においては、図57に示すとおり、複数の言語のテンプレートが1つのテンプレートデータに含まれる構成を例に挙げて説明したが、これに限定されるものではない。例えば、一つのテンプレートデータには一つの言語のテンプレートデータが含まれている構成としてもよい。この場合、上記一つの言語のテンプレートデータと対応関係にある他の言語のテンプレートデータが、当該一つの言語のテンプレートデータと関連付けられて記憶装置13Aに記憶されていればよい。
 以上説明したように、翻訳装置1Aの記憶装置13Aには、少なくとも、日本語テンプレートを生成するためのテンプレートTJと、当該日本語テンプレートと対応関係にある英語テンプレートとを生成するためのテンプレートTEとが記憶されている。データ読出部21Aは、記憶装置13AからテンプレートTJとテンプレートTEとを読出す。テンプレート生成部27は、読出されたテンプレートTJとテンプレートTEとに基づき、日本語テンプレートと当該テンプレートと対応関係にある英語テンプレートとをそれぞれ複数生成する。さらに、テンプレート生成部27は、当該生成した日本語テンプレートと英語テンプレートとを記憶装置13Aに記憶させる。
 したがって、翻訳装置1Aは、テンプレートTJから日本語テンプレートを複数生成できる。さらに、翻訳装置1Aは、テンプレートTEから当該日本語テンプレートと対応関係にある英語テンプレートを複数生成することができる。
 それゆえ、翻訳装置1のように予め日本語テンプレートおよび英語テンプレートを記憶装置13に記憶しておく構成に比べ、翻訳装置1Aは、予め記憶しておくテンプレートの数を少なくすることができる。このため、翻訳装置1Aは、翻訳装置1に比べて、テンプレートを記憶させておく領域の容量を小さくすることができる。
 また、テンプレートTJとテンプレートTEとは、所定の語句で構成された第1部と予め定められた複数の要素のうちの何れかの要素を選択可能な第2部とを含む。テンプレート生成部27は、テンプレートTJおよびテンプレートTEにおいて互いに対応する位置の要素を、テンプレートTJおよびテンプレートTEにおいて順に選択することにより、日本語テンプレートと当該テンプレートに対応する英語テンプレートとをそれぞれ複数生成する。
 したがって、翻訳装置1Aは、第2部に含まれる要素の数に応じた、日本語テンプレートおよび英語テンプレートを生成することができる。
 また、図57に示したように、要素は可変部であってもよい。要素が可変部である場合には、翻訳装置1Aは、要素が可変部でない場合よりも、数多くの文例を作成することができる。
 <<2.翻訳装置の具体的機能>>
 <1.概要>
 翻訳装置1の具体的機能の概要について、図78から図81に基づいて説明する。図78は、テンプレートデータベース60に含まれる一つのテンプレートデータの構成を示した図である。図78を参照して、説明の便宜上、日本語テンプレート(第1テンプレート)と英語テンプレート(第2テンプレート)とを示しており、中国語テンプレートは示していない。
 図79は、図78のテンプレートデータの可変部(スロット部、共起部)を置換した後における、上記処理文格納バッファに記憶された文例データを示した図である。
 図80は、図78に示したテンプレートデータ(対訳テンプレート)を用いて生成された対訳文である。つまり、図80は、図79における日本語テンプレートが示す文と、英語テンプレートが示す文とを対応付けて示した図である。なお、以下では、「対訳文」とは、日本語による文と英語による文とをいう。また、「対訳」とは、原文に対応させて訳文を示すことである。図80を参照して、翻訳装置1は、原文W101(第1文)と、当該原文W101に対する訳文W201(第2文)とを、出力部11に表示する。
 図81は、ユーザが、マウス120などのポインティングデバイスを用いて、原文W101における少なくとも1つの語句を選択した場合に、翻訳装置1が行なう処理を説明するための図である。
 図81(a)は、原文W101において、ユーザが語句W111を選択した場合を説明するための図である。図81(a)を参照して、翻訳装置1は、語句W111に対応する、訳文W201の語句W211と語句W212との表示態様を変更する。たとえば、翻訳装置1は、語句W211と語句W212とをマーカ表示する。したがって、ユーザは、原文においてユーザが選択した語句(原文の語句)に対応する訳文の語句を容易に判断することができる。
 さらに、翻訳装置1は、語句W211の解説文W311と、語句W212の解説文W312とを出力部11に表示する。したがって、ユーザは、語句W211と語句W212との解説文を確認することができる。
 図81(b)は、ユーザが、原文W101の要素W121を選択した場合を説明するための図である。ここで、「要素」とは、文の一部分をいう。また、要素は、語句を含む概念である。要素が1つの語句である場合もある。原文W101の要素W121は、複数の連続した語句を含む。図81(b)を参照して、翻訳装置1は、原文W101の要素W121に対応する、訳文W201の要素W221の表示態様を変更する。なお、訳文W201の要素W221は、複数の連続した語句を含む。さらに、翻訳装置1は、当該要素W221の解説文W321を出力部11に表示する。
 図81(c)は、ユーザが、原文W101の要素W131を選択した場合を説明するための図である。なお、原文W101の要素W131は、複数の連続した語句W131a、W131bを含む。図81(b)を参照して、翻訳装置1は、原文W101の要素W131に対応する、訳文W201の要素W231、語句W232、および語句W233の表示態様を変更する。なお、訳文W201の要素W231は、複数の連続した語句を含む。さらに、翻訳装置1は、当該要素W231および語句W232、W233について、それぞれ解説文W331、W332、W333を出力部11に表示する。
 また、翻訳装置1は、要素W231と、語句W232および語句W233との表示態様を異なる態様とする。たとえば、翻訳装置1は、要素231を黄色のマーカ表示とし、語句W232および語句W233を緑色のマーカ表示とする。さらに、翻訳装置1は、要素231に対応する語句W131aを、要素231と同じ表示態様で表示する。また、翻訳装置1は、語句W232、W233に対応する語句131bを、語句W232、W233と同じ表示態様で表示する。このような表示により、ユーザは、選択した範囲における原文の語句と、当該範囲に対応する訳文の語句との対応関係を容易に判断することができる。
 以下、図81に示した処理を実行するための翻訳装置1が備える構成について、図82から図89に基づいて説明する。
 <2.データ>
 図82は、記憶装置13に格納された複数の上位カテゴリデータ(関連付けデータ)のうち、3つの上位カテゴリデータを示した図である。
 図82(a)は、カテゴリIDが「01001」である上位カテゴリデータCD1を示した図である。図82(a)を参照して、上位カテゴリデータCD1は、ラベル名と、展開データと、上位データと、解説文との情報を含んでいる。また、展開データは、日本語テンプレート(第3テンプレート)と、英語テンプレート(第4テンプレート)とを含んでいる。つまり、上位カテゴリデータでは、展開データの日本語テンプレート(以下、「第1展開テンプレート」とも称する)と、当該テンプレートと対応関係にある英語テンプレート(以下、「第2展開テンプレート」とも称する)とが互いに関連付けられている。
 上位カテゴリデータCD1のラベル名は、「TEMPL_NP-AND2」である。また、ラベル名は、展開データを置換するためのデータ(置換用データ)として用いられる。展開データの日本語テンプレートは、2つの可変部と1つの固定部とを含む。展開データの英語テンプレートは、2つの可変部と3つの固定部とを含む。また、可変部である「{1:&NOUN}」および「{2:&NOUN}」は、シソーラスデータ(図7参照)における「&NOUN」といった区分に含まれる語句が、当該可変部に置いて置換可能な候補であることを示している。具体的には、「{1:&NOUN}」および「{2:&NOUN}」は、当該部分が名詞に置換されることを示す。上位データは、上記ラベル名が属するグループを示している。
 解説文は、ラベル名に対応付けられた展開データを解説する文である。より詳しくは、解説文は、展開データにおける日本語テンプレートの可変部および英語テンプレートの可変部が置換された場合、当該置換後の両テンプレートが、どのような文法上の意味を有するかを示した文である。たとえば、解説文として、「名詞の並列表現」といった情報が、上位カテゴリデータに含まれる。
 図82(b)は、カテゴリIDが「01002」である上位カテゴリデータCD2を示した図である。図82(b)を参照して、当該上位カテゴリデータCD2は、上位カテゴリデータCD1と同様に、ラベル名と、展開データと、上位データと、解説文との情報を含んでいる。
 上位カテゴリデータCD2のラベル名は、「TEMPL_NP-COMPLETE」である。また、展開データの日本語テンプレート(第3テンプレート)は、2つの可変部と複数の固定部とを含む。展開データの英語テンプレート(第4テンプレート)は、2つの可変部と2つの固定部とを含む。可変部である「{1:&TEMPL_NP}」は、シソーラスデータにおける「&TEMPL_NP」といった区分に含まれる語句が、当該可変部に置いて置換可能な候補であることを示している。また、可変部である「{2:&NOUN}」は、当該部分が名詞に置換されることを示す。
 図82(c)は、カテゴリIDが「02001」である上位カテゴリデータCD3を示した図である。図82(c)を参照して、当該上位カテゴリデータCD3は、上位カテゴリデータCD1、CD2と同様に、ラベル名と、展開データと、上位データと、解説文との情報を含んでいる。
 上位カテゴリデータCD3のラベル名は、「TEMPL_PLACE-VCL」である。また、展開データの日本語テンプレート(第3テンプレート)は、1つの可変部と1つの固定部とを含む。展開データの英語テンプレート(第4テンプレート)は、3つの可変部を含む。可変部である「{1:&VIHECLE}」は、シソーラスデータにおける「&VIHECLE」といった区分に含まれる語句が、当該可変部に置いて置換可能な候補であることを示している。なお、「{-i:LOC-PREP}」および「{-i:DEF-DET}」は、可変部の1種である共起部である。
 図83は、シソーラスデータにおける「&NOUN」といった区分に含まれる語句の一例を示した図である。図83を参照して、当該区分には、たとえば、「&WALLET」といった区分に含まれる語句、「&TICKET」といった区分に含まれる語句、「&MONEY」といった区分に含まれる語句が含まれる。
 図84は、共起関係データを示した図である。図84(a)は、ラベル名が「my_DET」である共起関係データKD1を示した図である。図84(a)を参照して、共起条件の欄には、可変部の1種であるスロット部に用いられる語句(例えば、「I」)と、当該語句が用いられた場合における共起部に用いる文字(例えば、「my」)との対応関係が記されている。また、共起関係データKD1は、解説文の情報を含んでいる。当該解説文は、共起部に用いる文字についての文法的意味を説明する文である。具体的には、当該解説文として、「置換語に対応した所有格代名詞」といった内容が記載されている。
 図84(b)は、ラベル名が「DEF-DET」である共起関係データKD2を示した図である。図84(b)を参照して、解説文として、「置換語に対応した定冠詞を付与」といった内容が記載されている。
 図84(c)は、ラベル名が「LOC-PREP」である共起関係データKD3を示した図である。図84(c)を参照して、解説文として、「置換語に対応した前置詞を付与」といった内容が記載されている。
 <3.機能ブロック>
 図85は、翻訳装置1における変更指示部30の詳細を示した図である。図85を参照して、変更指示部30は、データ生成部31と、検知部32と、特定部33とを備える。特定部33は、第2置換部331と、第2抽出部332と、設定部333と、第1判断部334と、第3置換部335と、第2判断部336と、第3判断部337とを備える。
 なお、以下においても、説明の便宜上、日本語の文(原文)と英語の文(訳文)と例に挙げて説明する。また、以下では、既に対訳文が表示されている状態(図80参照)から行なわれる処理について説明する。
 データ生成部31は、第1置換部24による可変部の置換に基づき、日本語による文と英語による文とを出力部11に表示させるための表示用データとは異なるデータであって、日本語の文(たとえば、図81(b)の原文W101)において選択された語句(要素W121)に対応する対応語句(要素W221)の表示態様を変更するための処理用データとを生成する。なお、当該処理用データは、メモリ14に一時的に格納される。
 検知部32は、入力部10を介した入力に基づき、日本語による文(第1文)に含まれる少なくとも1つの語句(たとえば、連続する2つ以上の語句)が選択されたことを検知する。たとえば、検知部32は、マウス120などのポインティングデバイスにより、図81(b)の要素W121が選択されたことを検知する。
 特定部33は、少なくとも対訳テンプレート(日本語のテンプレートおよび英語のテンプレート)に基づいて、英語による文(第2文)に含まれる、上記対応語句を特定する。詳しくは、対訳テンプレートと上記上位カテゴリデータとに基づいて、上記対応語句を特定する。より詳しくは、特定部33は、複数の第1展開テンプレート(第3テンプレート)のうち上記選択された語句の少なくとも一部と対応関係にある第1展開テンプレートと、当該第1展開テンプレートと対応関係にある第2展開テンプレート(第4テンプレート)と、当該第1展開テンプレートおよび当該第2展開テンプレートと関連付けられたカテゴリラベルとに基づいて、上記対応語句を特定する。
 表示制御部25は、上記対応語句が特定されたことに基づき、当該対応語句の表示態様を変更する。
 次に、特定部33のさらに詳細な動作について、特定部33に含まれる各ブロックに基づいて説明する。
 第2抽出部332は、上記選択された語句(要素)から、可変部の語句をキーワードとして抽出する。設定部333は、上記抽出したキーワードの組み合わせ、および当該抽出したキーワード単体を検索候補に設定する。
 第1判断部334は、各検索候補について、第1展開テンプレートが示す条件を当該検索候補が満たしているか否かを、第1展開テンプレート毎に判断する。
 第3置換部335は、第1判断部334によって上記条件を満たしていると判断されたことに基づき、第1展開テンプレートの可変部を検索候補のキーワードで置換する。また、第3置換部335は、第1判断部334によって上記条件を満たしていると判断されたことに基づき、第2展開テンプレートの可変部を上記検索候補に対応する語句(英語)で置換する。
 第2判断部336は、検索候補のキーワードで置換した後の第1展開テンプレートが、上記選択された語句の少なくとも一部と一致するか否かを判断する。
 第2置換部331は、上記処理用データにおける英語テンプレートに基づくデータのうち、上記選択された語句の少なくとも一部に対応する第1展開テンプレートと対応関係にある第2展開テンプレートに対応する箇所を、当該第1展開テンプレートおよび当該第2展開テンプレートと関連付けられたラベル名(つまり上位カテゴリデータのラベル名)に置換する。また、第2置換部331は、上記処理用データにおける日本語テンプレートに基づくデータのうち、上記選択された語句の少なくとも一部に対応する第1展開テンプレートに対応する箇所を、当該第1展開テンプレートと関連付けられたラベル名(つまり上位カテゴリデータのラベル名)に置換する。
 より詳しくは、第2置換部331は、第2判断部336により一致していると判断されたことに基づき、上記処理用データにおける英語テンプレートに基づくデータのうち、第3置換部335による置換後の第1展開テンプレートと対応関係にある第2展開テンプレートの箇所を、上記ラベル名(置換用データ)に置換する。
 第3判断部337は、第1判断部334による判断の結果、各検索候補について上記条件を満たしていないと判断されたことに基づき、当該各検索候補を設定するために用いたキーワードの個数が複数であるか否かを判断する。
 以下、特定部33における処理について、具体例を挙げて説明する。
 <4.第1の具体例>
 以下では、説明を簡単にするため、記憶装置13には、複数の上位カテゴリデータとして、3つの上位カテゴリデータCD1、CD2、CD3のみが格納されているとする。
 図86は、図81(b)に示す原文W101から要素W121を選択した場合における翻訳装置1の動作を説明するための図である。図86(a)を参照して、第2抽出部332は、上記選択に基づき、上記処理用データ(図79参照)において、選択された要素W121における可変部を特定するとともに、当該可変部の語句をキーワードとして抽出する。つまり、第2抽出部332は、上記処理用データから、語句W401と、語句W402と、語句W403とをキーワードとして抽出する。
 図86(b)を参照して、設定部333は、3つの語句W401、W402、W403における語句の組み合わせ、および語句W401、W402、W403単体を検索候補に設定する。3つの語句がある場合、3つの語句の組み合わせが1つ、2つの語句の組み合わせが3つ、語句単体が3つあるため、設定部333は、合計7個の検索候補を設定する。
 以下では、語句W401と語句W402と語句W403との組み合わせを、「検索候補-1」とする。語句W401と語句W402との組み合わせを、「検索候補-2」とする。語句W401と語句W403との組み合わせを、「検索候補-3」とする。語句W402と語句W403との組み合わせを、「検索候補-4」とする。語句W401単体を、「検索候補-5」とする。語句W402単体を、「検索候補-6」とする。語句W403単体を、「検索候補-7」とする。
 第1判断部334は、まず、検索候補-1について、各上位カテゴリデータCD1、CD2、CD3において、第1展開テンプレートが示す条件を当該検索候補-1が満たしているか否かを判断する。つまり、第1判断部334は、第1展開テンプレートが示す条件を検索候補-1が満たしているか否かを、第1展開テンプレート毎に判断する。
 検索候補-1として示した3つの語句の組み合わせは、上位カテゴリデータCD1の第1展開テンプレート(つまり展開データの日本語テンプレート)の型とは一致しない。また、当該3つの語句の組み合わせは、上位カテゴリデータCD2、CD3の第1展開テンプレートの型とも一致しない。したがって、第1判断部334は、各上位カテゴリデータCD1、CD2、CD3において、第1展開テンプレートが示す条件を当該検索候補-1が満たしていないと判断する。
 第1判断部334は、次に、検索候補-2について、検索候補-1と同様の処理を行なう。検索候補-2として示した語句W401と語句W402との組み合わせは、上位カテゴリデータCD1の第1展開テンプレートの型とは一致する。
 この場合、図86(c)を参照して、第3置換部335は、当該第1展開テンプレートの各可変部を検索候補-2の各語句W401、W402で置換する。また、第3置換部335は、当該第1展開テンプレートと対応付けられた第2展開テンプレートの各可変部を検索候補-2に対応する各語句(つまり、「ticket」、「money」)で置換する。
 第2判断部336は、検索候補-2の語句W401、W402で置換した後の第1展開テンプレートが、上記選択された要素W121(図81(b)参照)の少なくとも一部と一致するか否かを判断する。この場合、第2判断部336は、一致していると判断する。
 第2判断部336が一致していると判断したことに基づき、第2置換部331は、以下の処理を行なう。図86(d)を参照して、第2置換部331は、上記処理用データにおける英語テンプレートに基づくデータのうち、要素W121の少なくとも一部(図86(c)に示す箇所)に対応する第1展開テンプレート(図82(a)参照)と対応関係にある第2展開テンプレートに対応する箇所(a {3:ticket} and {4:money})を、上位カテゴリデータCD1のラベル名を含む「{&TEMPL_NP-AND2}」に置換する。第2置換部331は、当該処理用データにおける日本語テンプレートについても、英語テンプレートと同様の処理を行なう。
 一方、検索候補-2として示した語句W401と語句W402との組み合わせは、上位カテゴリデータCD2、CD3の第1展開テンプレートの型とは一致しない。このため、第1判断部334は、上位カテゴリデータCD2、CD3において、第1展開テンプレートが示す条件を当該検索候補-1が満たしていないと判断する。
 なお、第2置換部331による置換処理が実行されたため、検索候補-3、検索候補-4、検索候補-5、検索候補-6、および検索候補-7については、検索候補-1と同様の処理を行なう必要はない。したがって、特定部33は、図86(d)に示した処理用データに基づき、次の処理を進める。
 図86(e)を参照して、第2抽出部332は、上記処理用データ(図86(d)参照)タから、「TEMPL_NP-AND2」(語句)と、語句W403とを新たなキーワードとして抽出する。
 設定部333は、第2抽出部332の再度のキーワード抽出処理に基づき、検索候補の再設定を行なう。図86(f)を参照して、設定部333は、「TEMPL_NP-AND2」と語句W403といった検索候補と、「TEMPL_NP-AND2」といった検索候補と、語句W403といった検索候補とを設定する。なお、以下では、説明の便宜上、「TEMPL_NP-AND2」と語句W403との組み合わせを、「検索候補-11」とする。「TEMPL_NP-AND2」単体を、「検索候補-12」とする。語句W403単体を、「検索候補-13」とする。
 第1判断部334は、まず、検索候補-11について、各上位カテゴリデータCD1、CD2、CD3において、第1展開テンプレートが示す条件を当該検索候補-11が満たしているか否かを判断する。ここで、検索候補-11として示した「TEMPL_NP-AND2」と語句W403との組み合わせは、上位カテゴリデータCD1、CD3の第1展開テンプレートの型とは一致しない。しかしながら、当該組み合わせは、上位カテゴリデータCD2の第1展開テンプレートの型と一致する。
 この場合、図86(g)を参照して、第3置換部335は、当該第1展開テンプレートの各可変部を検索候補-11の「TEMPL_NP-AND2」および語句W403で置換する。また、第3置換部335は、当該第1展開テンプレートと対応付けられた第2展開テンプレートの各可変部を検索候補-11に対応する各語句(つまり、「wallet」および「&TEMPL_NP-AND2)で置換する。
 第2判断部336は、検索候補-12の「TEMPL_NP-AND2」および語句W403で置換した後の第1展開テンプレートが、上記置換後の処理用データ(図86(d)参照)の少なくとも一部と一致するか否かを判断する。この場合、第2判断部336は、一致していると判断する。
 第2判断部336が一致していると判断したことに基づき、第2置換部331は、以下の処理を行なう。図86(h)を参照して、第2置換部331は、上記処理用データにおける英語テンプレートに基づくデータのうち、「{wallet} complete with {&TEMPL_NP-AND2}」を、上位カテゴリデータCD2のラベル名を含む「{&TEMPL_NP-COMPLETE}」に置換する。第2置換部331は、当該処理用データにおける日本語テンプレートについても、英語テンプレートと同様の処理を行なう。
 なお、第2置換部331による置換処理が実行されたため、検索候補-12、検索候補-13については、検索候補-11と同様の処理を行なう必要はない。したがって、特定部33は、図86(h)に示した処理用データに基づき、次の処理を進める。
 図86(i)を参照して、第2抽出部332は、上記処理用データ(図86(h)参照)タから、「TEMPL_NP-COMPLETE」を新たなキーワードとして抽出する。しかしながら、抽出したキーワードが1つしかない。このため、特定部33は、設定部333による上述した処理、第1判断部334による上述した処理などは行なわず、以下の処理を行なう。
 特定部33は、表示用データの英語テンプレート(図79参照)における、「{&TEMPL_NP-COMPLETE}」に対応する箇所を上記対応語句として特定する。つまり、「{&TEMPL_NP-COMPLETE}」が「{wallet} complete with {&TEMPL_NP-AND2}」に対応し、かつ「{&TEMPL_NP-AND2}」が「a {3:ticket} and {4:money}」に対応するため、特定部33は、「{5:wallet} complete with a {3:ticket} and {4:money}」を上記対応語句として特定する。
 表示制御部25は、当該対応語句の表示態様を変更する。この際、ユーザが選択した要素W121(図81(b))の表示態様を、当該対応語句の表示態様と同様にすることが、視覚的効果の観点から好ましい。
 また、表示制御部25は、図86(i)に示した「&TEMPL_NP-COMPLETE}」がラベル名である上位カテゴリデータCD2の解説文を、対応語句に対応付けた状態で、出力部11に表示させる。
 以上の構成によって、翻訳装置1は、図81(b)に示した対訳文を出力部11に表示できる。したがって、ユーザは、原文においてユーザが選択した語句(原文の語句)に対応する訳文の語句を容易に判断することができる。さらに、翻訳装置1は解説文を対応語句に対応付けて表示するため、ユーザは、対応語句の解説文を確認することができる。
 また、翻訳装置1を用いることにより、ユーザが対訳文に基づいて作文を行なうことができる。すなわち、対訳文(例文)における原文と作文したい内容の原文とに差分があるときは、ユーザは、翻訳装置1を用いることにより、当該差分に対応する翻訳文の箇所(つまり置換すべき箇所)を容易に特定できる。このため、ユーザは、当該箇所を、当該差分の訳語に置換することにより、所望となる文を作成することができる。
 <5.第2の具体例>
 以下においても、「<4.第1の具体例>」と同様に、記憶装置13には、複数の上位カテゴリデータとして、3つの上位カテゴリデータCD1、CD2、CD3のみが格納されているとする。
 図87は、図81(c)に示す原文W101から要素W131を選択した場合における翻訳装置1の動作を説明するための図である。図87(a)を参照して、第2抽出部332は、上記選択に基づき、上記処理用データ(図79参照)において、選択された要素W131における可変部を特定するとともに、当該可変部の語句をキーワードとして抽出する。つまり、第2抽出部332は、上記処理用データから、語句W501と語句W502とをキーワードとして抽出する。
 図87(b)を参照して、設定部333は、2つの語句W501、W502における語句の組み合わせ、および語句W501、W502単体を検索候補に設定する。つまり、設定部333は、合計3個の検索候補を設定する。
 以下では、語句W501と語句W502との組み合わせを、「検索候補-21」とする。語句W501単体を、「検索候補-22」とする。語句W502単体を、「検索候補-23」とする。
 第1判断部334は、まず、検索候補-21について、各上位カテゴリデータCD1、CD2、CD3において、第1展開テンプレートが示す条件を当該検索候補-21が満たしているか否かを判断する。
 検索候補-21として示した2つの語句の組み合わせは、上位カテゴリデータCD1の第1展開テンプレート(つまり展開データの日本語テンプレート)の型とは一致しない。また、当該2つの語句の組み合わせは、上位カテゴリデータCD2、CD3の第1展開テンプレートの型とも一致しない。したがって、第1判断部334は、各上位カテゴリデータCD1、CD2、CD3において、第1展開テンプレートが示す条件を当該検索候補-1が満たしていないと判断する。
 第1判断部334は、次に、検索候補-22について、検索候補-21と同様の処理を行なう。検索候補-22として示した語句W501単体は、上位カテゴリデータCD1の第1展開テンプレートの型とは一致しない。また、語句W501単体は、上位カテゴリデータCD2の第1展開テンプレートの型とは一致しない。したがって、第1判断部334は、上位カテゴリデータCD1、CD2において、第1展開テンプレートが示す条件を当該検索候補-22が満たしていないと判断する。
 しかしながら、語句W501単体は、上位カテゴリデータCD3の第1展開テンプレートの型とは一致する。したがって、第1判断部334は、上位カテゴリデータCD3において、第1展開テンプレートが示す条件を当該検索候補-1が満たしていると判断する。この場合、図87(c)を参照して、第3置換部335は、当該第1展開テンプレートの可変部を検索候補-22の各語句W501で置換する。また、第3置換部335は、当該第1展開テンプレートと対応付けられた第2展開テンプレートの可変部(スロット部)を検索候補-22に対応する各語句(つまり、「train」)で置換する。
 さらに、第3置換部335は、当該第2展開テンプレートの他の可変部(つまり共起部)を、図84(b)および図84(c)に示した共起関係データを用いて置換する。具体的には、第3置換部335は、スロット部「1:&VIHECLE」が「train」に置換されるため、図86(c)の共起条件に基づき、共起部「{-i:LOC-PREP}」を「on」に置換する。また、第3置換部は、図86(b)の共起条件に基づき、共起部「-i:DEF-DET」を「the」に置換する。
 第2判断部336は、検索候補-22の語句W501で置換した後の第1展開テンプレートが、上記選択された要素W131(図81(c)参照)の少なくとも一部と一致するか否かを判断する。この場合、第2判断部336は、一致していると判断する。
 第2判断部336が一致していると判断したことに基づき、第2置換部331は、以下の処理を行なう。図87(d)を参照して、第2置換部331は、上記処理用データにおける英語テンプレートに基づくデータのうち、要素W131の少なくとも一部(図87(c)に示す箇所)に対応する第1展開テンプレート(図82(c)参照)と対応関係にある第2展開テンプレートに対応する箇所({-i:On} {-i:the} {1-i:train})を、上位カテゴリデータCD1のラベル名を含む「{&TEMPL_PLACE-VCL}」に置換する。第2置換部331は、当該処理用データにおける日本語テンプレートについても、英語テンプレートと同様の処理を行なう。
 なお、第2置換部331による置換処理が実行されたため、検索候補-23については、検索候補-21と同様の処理を行なう必要はない。したがって、特定部33は、図87(d)に示した処理用データに基づき、次の処理を進める。
 図87(e)を参照して、第2抽出部332は、上記処理用データ(図87(d)参照)から、「TEMPL_PLACE-VCL」(語句)と、語句W502とを新たなキーワードとして抽出する。
 設定部333は、第2抽出部332の再度のキーワード抽出処理に基づき、検索候補の再設定を行なう。図87(f)を参照して、設定部333は、「TEMPL_PLACE-VCL」と語句W502といった検索候補と、「TEMPL_PLACE-VCL」といった検索候補と、語句W502といった検索候補とを設定する。なお、以下では、説明の便宜上、「TEMPL_PLACE-VCL」と語句W502との組み合わせを、「検索候補-31」とする。「TEMPL_PLACE-VCL」単体を、「検索候補-32」とする。語句W502単体を、「検索候補-33」とする。
 第1判断部334は、まず、検索候補-31について、各上位カテゴリデータCD1、CD2、CD3において、第1展開テンプレートが示す条件を当該検索候補-31が満たしているか否かを判断する。この場合、検索候補-31として示した「TEMPL_PLACE-VCL」と語句W502との組み合わせは、上位カテゴリデータCD1、CD2、CD3の第1展開テンプレートの型とは一致しない。
 そこで、第1判断部334は、検索候補-32について、各上位カテゴリデータCD1、CD2、CD3において、第1展開テンプレートが示す条件を当該検索候補-32が満たしているか否かを判断する。この場合も、検索候補-32として示した「TEMPL_PLACE-VCL」は、上位カテゴリデータCD1、CD2、CD3の第1展開テンプレートの型とは一致しない。
 そこで、第1判断部334は、検索候補-33について、各上位カテゴリデータCD1、CD2、CD3において、第1展開テンプレートが示す条件を当該検索候補-33が満たしているか否かを判断する。この場合も、検索候補-33として示した語句W502は、上位カテゴリデータCD1、CD2、CD3の第1展開テンプレートの型とは一致しない。
 したがって、特定部33は、図87(c)に示したような第3置換部335による置換処理を行なわない。
 特定部33の第3判断部337は、検索候補-31、検索候補-32、検索候補-33の各々について、上位カテゴリデータCD1、CD2、CD3の第1展開テンプレートの型と一致しない場合、以下の処理を行なう。すなわち、第3判断部337は、当該各検索候補を設定するために用いたキーワードの個数が複数であるか否かを判断する。図87の例では、図87(e)に示すとおりキーワードの個数は2つであるため、第3判断部337は、キーワードの個数が複数であると判断する。
 特定部33は、各キーワードに対応する訳文の箇所を、上記対応語句として特定する。具体的には、特定部33は、表示用データの英語テンプレート(図79参照)における、「{&TEMPL_PLACEP-VCL}」および語句W502に対応する箇所を上記対応語句として特定する。つまり、「{&TEMPL_PLACE-VCL}」が「{-i:LOC-PREP} {-i:DEF-DET} {1:&VIHECLE}」に対応し、語句W502が「{2-j:I}」および「{-j:my}」に対応するため、特定部33は、「{-i:On} {-i:the} {1-i:train}」、「{2-j:I}」、および「{-j:my}」を上記対応語句として特定する。
 表示制御部25は、当該対応語句の表示態様を変更する。この際、表示制御部25は、第3判断部337の判断に基づいた表示制御を行なう。すなわち、表示制御部25は、キーワードが複数であると判断されたことに基づき、キーワードに応じた訳文の箇所を、キーワード毎に互いに異なる表示態様で表示させる(図81(c)参照)。具体的には、表示制御部25は、キーワード「TEMPL_PLACE-VCL」に関する「On the train」と、キーワードである語句W502に関する「I」および「my」とを、互いに異なる表示態様として出力部11に表示させる。さらに、表示制御部25は、原文(日本語)についても訳文と同様の表示態様の変更処理を行なう。
 また、表示制御部25は、図86(e)に示した「&TEMPL_PLACE-VCL}」がラベル名である上位カテゴリデータCD3の解説文を、対応語句(「On the train」)に対応付けた状態で、出力部11に表示させる。さらに、表示制御部25は、図84(a)に示した解説文を、対応語句(「my」)に対応付けた状態で、出力部11に表示させる。
 以上の構成によって、翻訳装置1は、図81(c)に示した対訳文を出力部11に表示できる。したがって、ユーザは、原文においてユーザが選択した語句(原文の語句)に対応する訳文の語句を容易に判断することができる。さらに、翻訳装置1は解説文を対応語句に対応付けて表示するため、ユーザは、対応語句の解説文を確認することができる。
 また、翻訳装置1を用いることにより、「<4.第1の具体例>」で述べたように、ユーザは、所望となる文を作成することができる。
 <6.制御構造>
 図88は、翻訳装置1で行なわれる処理を示したフローチャートである。図88を参照して、ステップS301において、翻訳装置1は、入力として、ユーザから原文における範囲の選択(つまり、少なくとも1つの語句を選択)を受け付ける。ステップS302において、翻訳装置1は、原文において選択した範囲に対応する訳文の範囲を特定する。ステップS303において、翻訳装置1は、出力として、特定された訳文の範囲の表示態様を変更する。
 図89は、図88のステップS302の詳細を示したフローチャートである。なお、以下では、図86(a)に示したデータ、図86(e)に示したデータ、図86(i)に示したデータ、図87(a)に示したデータ、および図87(e)に示したデータのように、ユーザの選択に基づくデータを、「選択データ」と称する。
 図89を参照して、ステップS3001において、翻訳装置1は、選択された範囲からキーワードの抽出を行なう。ステップS3002において、翻訳装置1は、抽出したキーワードを用いて検索候補を生成する。ステップS3003において、翻訳装置1は、生成した検索候補から検索候補を1つ選択する。
 ステップS3004において、翻訳装置1は、選択した検索候補を用いて、上位カテゴリデータを検索する。つまり、翻訳装置1は、上位カテゴリデータに含まれる第1展開テンプレートが示す条件を当該選択した検索候補が満たしているか否かを各上位カテゴリデータについて判断し、当該条件を満たしている場合、当該上位カテゴリデータを抽出する。
 ステップS3005において、翻訳装置1は、検索された上位カテゴリデータから1つの上位カテゴリデータを選択する。たとえば、翻訳装置1がステップS3004において複数の上位カテゴリデータが抽出した場合、翻訳装置1は、当該複数の上位カテゴリデータから1つの上位カテゴリデータを選択する。
 ステップS3006において、翻訳装置1は、選択された上位カテゴリデータに含まれる日本語テンプレート(第1展開テンプレート)と英語テンプレート(第2展開テンプレート)とを読み込む。ステップS3007において、翻訳装置1は、当該読み込んだ第1展開テンプレートと第2展開テンプレートとを用いて、文の生成処理を行なう。
 ステップS3008において、翻訳装置1は、生成した文(置換後の第1展開テンプレート)と、選択した語句の少なくとも一部、あるいは置換後の処理用データ(たとえば図86(d))の少なくとも一部とが一致するか否かを判断する。
 翻訳装置1は、ステップS3008において一致すると判断した場合(ステップS3008においてYES)、ステップS3011において、処理用データにおける対訳例文の変換処理を行なう。すなわち、翻訳装置1は、第2置換部331による上述した置換処理を行なう。ステップS3012において、翻訳装置1は、処理対象となる選択データの更新を行なう。たとえば、翻訳装置1は、処理対象となる選択データを、図86(a)に示す選択データから図86(e)に示す選択データに更新する。
 翻訳装置1は、ステップS3008において一致しないと判断した場合(ステップS3008においてNO)、ステップS3009において、選択していない上位カテゴリデータが存在するか否かを判断する。
 翻訳装置1は、ステップS3009において存在すると判断した場合(ステップS3009においてYES)、ステップS3013において、選択していない上位カテゴリデータから、1つの上位カテゴリデータを選択する。翻訳装置1は、ステップS3009において存在しないと判断した場合(ステップS3009においてNO)、ステップS3010において、選択していない検索候補が存在するか否かを判断する。
 翻訳装置1は、ステップS3010において存在すると判断した場合(ステップS3010においてYES)、ステップS3014において、選択していない検索候補から、1つの検索候補を選択する。翻訳装置1は、ステップS3010において存在しないと判断した場合(ステップS3010においてNO)、処理を図88のステップS303に進める。
 <7.その他>
 (1)「<<2.翻訳装置の具体的機能>>」においては、翻訳装置1の具体的機能を述べたが、当該具体的な機能を翻訳装置1Aが備える構成としてもよい。
 (2)今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて請求の範囲によって示され、請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
 1 翻訳装置、1A 翻訳装置、10 入力部、11 出力部、12 制御部、12A 制御部、13 記憶装置、13A 記憶装置、14 メモリ、14A メモリ、20 第1抽出部、21 データ読出部、21A データ読出部、22 判定部、23 選択部、24 第1置換部、25 表示制御部、26 出力文整形部、27 テンプレート生成部、30 変更指示部、31 データ生成部、32 検知部、33 特定部、40 辞書検索部、41 スロット置換部、42 共起置換部、43 変化形探索部、44 未入力箇所置換部、331 第2置換部、332 第2抽出部、333 設定部、334 判断部、335 第3置換部、336 第2判断部、337 第3判断部。

Claims (10)

  1.  対訳テンプレートを用いて第1言語による第1文を第2言語による第2文に翻訳する情報処理装置(1,1A)であって、
     前記第1文と前記第2文とを表示装置(11)に表示させる表示制御部(25)と、
     前記第1文に含まれる1つまたは複数の語句が選択されたことを検知する検知部(32)と、
     少なくとも前記対訳テンプレートに基づいて、前記第2文に含まれる、前記選択された語句に対応する複数の対応語句を特定する特定部(33)とを備え、
     前記表示制御部は、前記対応語句が特定されたことに基づき、当該対応語句の表示態様を変更する、情報処理装置。
  2.  前記対訳テンプレートは、前記第1言語による第1テンプレートと当該第1テンプレートと対応関係にある前記第2言語による第2テンプレートとを含み、
     前記第1テンプレートと前記第2テンプレートとは、所定の語句で構成された固定部と予め定められた複数の語句のうちの何れかの語句に置換可能な可変部とをそれぞれ対応する位置に含み、
     前記情報処理装置は、
     前記第1言語による第3テンプレートと、当該第3テンプレートと対応関係にある前記第2言語による第4テンプレートとを互いに関連付けた関連付けデータを複数格納した記憶装置(13,13A)をさらに備え、
     各前記第3テンプレートは、2つ以上の前記可変部、あるいは少なくとも1つの前記可変部と少なくとも1つの前記固定部とを含み、
     前記特定部は、前記対訳テンプレートと前記関連付けデータとに基づいて、前記対応語句を特定する、請求の範囲第1項に記載の情報処理装置。
  3.  前記関連付けデータは、各々、前記第3テンプレートおよび前記第4テンプレートに関連付けて置換用データをさらに格納し、
     前記特定部は、前記複数の第3テンプレートのうち前記選択された語句の少なくとも一部と対応関係にある第3テンプレートと、当該第3テンプレートと対応関係にある前記第4テンプレートと、当該第3テンプレートおよび当該第4テンプレートと関連付けられた前記置換用データとに基づいて、前記対応語句を特定する、請求の範囲第2項に記載の情報処理装置。
  4.  前記情報処理装置は、
     前記第1テンプレートの前記可変部と前記第2テンプレートの前記可変部とを前記予め定められた複数の語句のうちの何れかの語句で置換する第1置換部(24)と、
     前記置換に基づき、前記第1文と前記第2文とを前記表示装置に表示させるための表示用データとは異なる、前記対応語句の表示態様を変更するための処理用データとを生成する生成部(31)をさらに備え、
     前記特定部は、
     前記処理用データにおける前記第2テンプレートに基づくデータのうち、前記選択された語句の少なくとも連続する一部に対応する前記第3テンプレートと対応関係にある前記第4テンプレートに対応する箇所を、当該第3テンプレートおよび当該第4テンプレートと関連付けられた前記置換用データに置換する第2置換部(331)をさらに含み、
     少なくとも、前記処理用データにおいて前記置換用データに置換された箇所に対応する前記第2文の箇所を、前記対応語句として特定し、
     前記表示制御部は、前記特定された前記第2文の箇所の前記表示態様を変更する、請求の範囲第3項に記載の情報処理装置。
  5.  前記特定部は、
     前記選択された語句から、前記可変部の語句をキーワードとして抽出する抽出部(332)と、
     前記抽出したキーワードの組み合わせ、および前記抽出したキーワード単体を検索候補に設定する設定部(333)と、
     各前記検索候補について、前記第3テンプレートが示す条件を当該検索候補が満たしているか否かを、前記第3テンプレート毎に判断する第1判断部(334)と、
     前記条件を満たしていると判断されたことに基づき、前記第3テンプレートの前記可変部を前記検索候補のキーワードで置換する第3置換部(335)と、
     前記検索候補のキーワードで置換した後の前記第3テンプレートが、前記選択された語句の少なくとも一部と一致するか否かを判断する第2判断部(336)とをさらに備え、
     前記第2置換部は、前記第2判断部により一致していると判断されたことに基づき、前記処理用データにおける前記第2テンプレートに基づくデータのうち、前記置換後の第3テンプレートと対応関係にある前記第4テンプレートの箇所を、前記置換用データに置換する、請求の範囲第4項に記載の情報処理装置。
  6.  前記第2置換部が前記第4テンプレートの箇所を前記置換用データに置換した後に、前記抽出部は、当該置換用データと、前記キーワードのうち前記置換後の前記第3テンプレートに含まれていないキーワードとを、新たにキーワードとして抽出し、
     前記情報処理装置は、
     前記新たに抽出したキーワードに基づき、前記設定部による前記設定と、前記第1判断部による前記判断と、前記第3置換部による前記置換とを再度行い、
     前記第2判断部は、前記第3置換部による前記再度の置換に基づき、当該置換後の前記第3テンプレートが、前記置換用データで置換された後の前記処理用データにおける前記第2テンプレートの少なくとも一部と一致するか否かを判断し、
     前記第2置換部は、前記第2判断部により一致していると判断されたことに基づき、再度、前記処理用データにおける前記第2テンプレートに基づくデータのうち、前記置換後の第3テンプレートと対応関係にある前記第4テンプレートの箇所を、前記置換用データに置換する、請求の範囲第5項に記載の情報処理装置。
  7.  前記特定部は、
     前記第1判断部による判断の結果、各前記検索候補について前記条件を満たしていないと判断されたことに基づき、当該各検索候補を設定するために用いた前記キーワードの個数が複数であるか否かを判断する第3判断部(337)をさらに含み、
     少なくとも、当該各キーワードに対応する前記第2文の箇所を、前記対応語句として特定し、
     前記表示制御部は、前記キーワードが複数であると判断されたことに基づき、前記キーワードに応じた前記第2文の箇所を、キーワード毎に互いに異なる表示態様で表示させる、請求の範囲第6項に記載の情報処理装置。
  8.  前記関連付けデータは、各々、前記第3テンプレートの内容を解説する解説文をさらに格納し、
     前記表示制御部は、前記解説文を前記対応語句に対応付けて表示させる、請求の範囲第2項から第7項のいずれか1項に記載の情報処理装置。
  9.  対訳テンプレートを用いて第1言語による第1文を第2言語による第2文に翻訳する情報処理装置(1,1A)における表示制御方法であって、
     前記情報処理装置のプロセッサ(110)が、前記第1文と前記第2文とを表示装置(11)に表示させるステップと、
     前記プロセッサが、前記第1文に含まれる1つまたは複数の語句が選択されたことを検知するステップと(S301)、
     前記プロセッサが、少なくとも前記対訳テンプレートに基づいて、前記第2文に含まれる、前記選択された語句に対応する複数の対応語句を特定するステップと(S302)、
     前記プロセッサが、前記対応語句を特定したことに基づき、当該対応語句の表示態様を変更するステップ(S303)とを備える、表示制御方法。
  10.  対訳テンプレートを用いて第1言語による第1文を第2言語による第2文に翻訳する情報処理装置(1,1A)において実行されるプログラムであって、
     前記プログラムは、
     前記第1文と前記第2文とを表示装置(11)に表示させるステップと、
     前記第1文に含まれる1つまたは複数の語句が選択されたことを検知するステップ(S301)と、
     少なくとも前記対訳テンプレートに基づいて、前記第2文に含まれる、前記選択された語句に対応する複数の対応語句を特定するステップ(S302)と、
     前記対応語句が特定されたことに基づき、当該対応語句の表示態様を変更するステップ(S303)とを前記情報処理装置に実行させる、プログラム。
PCT/JP2010/062600 2009-08-21 2010-07-27 情報処理装置、表示制御方法、およびプログラム WO2011021479A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US13/391,528 US20120150530A1 (en) 2009-08-21 2010-07-27 Information processing device and display control method
CN2010800473170A CN102625935A (zh) 2009-08-21 2010-07-27 信息处理装置、显示控制方法以及程序

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009192131A JP2011044023A (ja) 2009-08-21 2009-08-21 情報処理装置、表示制御方法、およびプログラム
JP2009-192131 2009-08-21

Publications (1)

Publication Number Publication Date
WO2011021479A1 true WO2011021479A1 (ja) 2011-02-24

Family

ID=43606934

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2010/062600 WO2011021479A1 (ja) 2009-08-21 2010-07-27 情報処理装置、表示制御方法、およびプログラム

Country Status (4)

Country Link
US (1) US20120150530A1 (ja)
JP (1) JP2011044023A (ja)
CN (1) CN102625935A (ja)
WO (1) WO2011021479A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8301437B2 (en) * 2008-07-24 2012-10-30 Yahoo! Inc. Tokenization platform
US9460082B2 (en) * 2012-05-14 2016-10-04 International Business Machines Corporation Management of language usage to facilitate effective communication
JP6096489B2 (ja) * 2012-11-30 2017-03-15 株式会社東芝 外国語文章作成支援装置、方法、及びプログラム
RU2632137C2 (ru) * 2015-06-30 2017-10-02 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер транскрипции лексической единицы из первого алфавита во второй алфавит
CN114091483B (zh) * 2021-10-27 2023-02-28 北京百度网讯科技有限公司 翻译处理方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6154565A (ja) * 1984-08-24 1986-03-18 Hitachi Ltd 多品詞訳語の校正方法
JPH10116286A (ja) * 1996-10-09 1998-05-06 Nippon Telegr & Teleph Corp <Ntt> 自然言語翻訳方法及び装置
JP2004220616A (ja) * 2003-01-14 2004-08-05 Cross Language Inc 3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5696916A (en) * 1985-03-27 1997-12-09 Hitachi, Ltd. Information storage and retrieval system and display method therefor
JP2815714B2 (ja) * 1991-01-11 1998-10-27 シャープ株式会社 翻訳装置
JPH05151260A (ja) * 1991-11-29 1993-06-18 Hitachi Ltd 翻訳テンプレート学習方法および翻訳テンプレート学習システム
JPH09251462A (ja) * 1996-03-18 1997-09-22 Sharp Corp 機械翻訳装置
US6275789B1 (en) * 1998-12-18 2001-08-14 Leo Moser Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language
US7383320B1 (en) * 1999-11-05 2008-06-03 Idom Technologies, Incorporated Method and apparatus for automatically updating website content
JP2001297083A (ja) * 2000-04-13 2001-10-26 Hitachi Ltd 文書作成方法、装置、文書作成プログラムを格納した記録媒体及び文書作成サービス提供システム
JP3813911B2 (ja) * 2002-08-22 2006-08-23 株式会社東芝 機械翻訳システム、機械翻訳方法及び機械翻訳プログラム
CN101034394B (zh) * 2007-03-30 2010-05-26 传神联合(北京)信息技术有限公司 一种提高翻译效率的系统及方法
JP5239307B2 (ja) * 2007-11-20 2013-07-17 富士ゼロックス株式会社 翻訳装置及び翻訳プログラム
WO2009107456A1 (ja) * 2008-02-29 2009-09-03 シャープ株式会社 情報処理装置、方法、およびプログラム
CN101359330B (zh) * 2008-05-04 2015-05-06 索意互动(北京)信息技术有限公司 内容扩展的方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6154565A (ja) * 1984-08-24 1986-03-18 Hitachi Ltd 多品詞訳語の校正方法
JPH10116286A (ja) * 1996-10-09 1998-05-06 Nippon Telegr & Teleph Corp <Ntt> 自然言語翻訳方法及び装置
JP2004220616A (ja) * 2003-01-14 2004-08-05 Cross Language Inc 3つ以上の対訳画面を同時に表示し編集可能にする機械翻訳装置

Also Published As

Publication number Publication date
JP2011044023A (ja) 2011-03-03
US20120150530A1 (en) 2012-06-14
CN102625935A (zh) 2012-08-01

Similar Documents

Publication Publication Date Title
JP5319655B2 (ja) 情報処理装置、情報処理方法、プログラム、およびプログラムを記録したコンピュータ読取り可能な記録媒体
Sin-Wai Routledge encyclopedia of translation technology
JP4050755B2 (ja) コミュニケーション支援装置、コミュニケーション支援方法およびコミュニケーション支援プログラム
US8055495B2 (en) Apparatus and method for translating input speech sentences in accordance with information obtained from a pointing device
Osborn et al. African languages in a digital age: Challenges and opportunities for indigenous language computing
WO2011021479A1 (ja) 情報処理装置、表示制御方法、およびプログラム
van Esch et al. Future directions in technological support for language documentation
JP2009140466A (ja) 使用者製作問答データに基づいた会話辞書サービスの提供方法及びシステム
Lyons A review of Thai–English machine translation
Hannay 3.1 Types of bilingual dictionaries
JP6144458B2 (ja) 手話翻訳装置及び手話翻訳プログラム
US20090024382A1 (en) Language information system
Verma et al. Toward machine translation linguistic issues of Indian Sign Language
JP5688884B2 (ja) 情報処理装置、訳文接続方法、およびプログラム
Efthimiou et al. Sign search and sign synthesis made easy to end user: the paradigm of building a SL oriented interface for accessing and managing educational content
JP4643183B2 (ja) 翻訳装置および翻訳プログラム
Jadhav et al. Study of machine transliteration for cross language retrieval
Vijayanand et al. Named entity recognition and transliteration for Telugu language
JP5632213B2 (ja) 機械翻訳装置及び機械翻訳プログラム
Popovych et al. Ukrainian Redaction of Church Slavonic (URCS): Needs for Digitalization and Text Corpora Platform Generation. Part I.
Hurskainen Can machine translation assist in Bible translation?
Jamoussi et al. Road sign romanization in Oman: The linguistic landscape close-up
Divate KTM-POP: Transliteration of K-POP Lyrics to Marathi
Jancso et al. A web application for geolocalized signs in synthesized swiss german sign language
JP2010039864A (ja) 形態素解析装置、形態素解析方法及びコンピュータプログラム

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201080047317.0

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10809824

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 13391528

Country of ref document: US

122 Ep: pct application non-entry in european phase

Ref document number: 10809824

Country of ref document: EP

Kind code of ref document: A1