JP5928714B2 - Information processing apparatus and information processing program - Google Patents

Information processing apparatus and information processing program Download PDF

Info

Publication number
JP5928714B2
JP5928714B2 JP2012128122A JP2012128122A JP5928714B2 JP 5928714 B2 JP5928714 B2 JP 5928714B2 JP 2012128122 A JP2012128122 A JP 2012128122A JP 2012128122 A JP2012128122 A JP 2012128122A JP 5928714 B2 JP5928714 B2 JP 5928714B2
Authority
JP
Japan
Prior art keywords
character string
character
translation
line
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012128122A
Other languages
Japanese (ja)
Other versions
JP2013254258A (en
Inventor
裕也 今野
裕也 今野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2012128122A priority Critical patent/JP5928714B2/en
Publication of JP2013254258A publication Critical patent/JP2013254258A/en
Application granted granted Critical
Publication of JP5928714B2 publication Critical patent/JP5928714B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Description

本発明は、情報処理装置及び情報処理プログラムに関する。   The present invention relates to an information processing apparatus and an information processing program.

特許文献1には、文書を構成する単語の区切りに空白文字が存在する外国語文書において、各単語の区切りを確実に検出し、空白文字を区切りに確実に再挿入することができる技術を提供することを課題とし、英語表記ルールによる判断、元文書データに含まれる空白文字の有無の情報による判断、隣接する文字同士が含まれる文字列オブジェクトの同一性による判断、隣接する文字同士が含まれる文字列オブジェクトの間隔による判断を用いて隣接する文字が同じ単語に含まれるかどうか(空白の有無)について判断し、これらの処理をこの記述の順番で判断するのが好ましいことが開示されている。   Patent Document 1 provides a technology that can reliably detect the break of each word in a foreign language document in which a blank character exists in the break of the word constituting the document, and reliably reinsert the blank character at the break. The determination based on the rules of English notation, the determination based on the presence / absence of blank characters included in the original document data, the determination based on the identity of the character string object including the adjacent characters, and the adjacent characters are included. It is disclosed that it is preferable to determine whether adjacent characters are included in the same word using the determination based on the interval of the character string object (whether there is a space) and to determine these processes in the order of this description. .

特開2012−008965号公報JP 2012-008965 A

本発明は、表音文字によって表された文字列であって、行末に空白があるか否かによって意味が異なる場合にあって、行末に空白があるか否かを判断するようにした情報処理装置及び情報処理プログラムを提供することを目的としている。   The present invention relates to an information process for determining whether or not there is a blank at the end of a line, in a case where the meaning is different depending on whether or not there is a blank at the end of a line. An object is to provide an apparatus and an information processing program.

かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、表音文字によって表された文書内の第1の行の行末にある1以上の文字列と該第1の行に続く第2の行の先頭にある1以上の文字列を接続した第1の文字列と、該第1の行の行末にある1以上の文字列と該第2の行の先頭にある文字列の間に空白文字を挿入して接続した第2の文字列を作成する文字列作成手段と、前記文字列作成手段によって作成された第1の文字列と第2の文字列をそれぞれ日本語に翻訳する翻訳手段と、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数すること、又は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数する計数手段と、前記計数手段によって計数されたそれぞれの文字数を比較することによって、前記第1の行の行末に空白文字を挿入するか否かを判断する第1の判断手段を具備し、前記翻訳手段は、表音文字の文字列を翻訳できなかった場合、該文字列の表音を示すカタカナによる表記を翻訳結果とする翻訳処理を行い、前記計数手段は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数し、前記第1の判断手段は、前記計数手段によって計数されたカタカナ文字の文字数の少ない方が前記第1の文字列である場合は、前記第1の行の行末に空白文字を挿入しないと判断することを特徴とする情報処理装置である。
The gist of the present invention for achieving the object lies in the inventions of the following items.
The invention of claim 1 is characterized in that one or more character strings at the end of the first line in a document represented by phonetic characters and one or more characters at the beginning of the second line following the first line. A second character string in which a blank character is inserted between a first character string in which columns are connected, one or more character strings at the end of the first row, and a character string at the beginning of the second row A character string creating means for creating the character string, a translation means for translating the first character string and the second character string created by the character string creating means into Japanese, respectively, and a first by the translation means Count the number of katakana characters in the translation result of the character string and the second character string, respectively, or count the number of characters that are the translation result of the first character string and the second character string by the translation unit, respectively. The counting means and the number of characters counted by the counting means are compared. I, wherein at the end of the first row comprises a first determination means for determining whether or not to insert a space character, said translation means, if it can not translate text phonetic characters, the The translation processing is performed with the katakana notation indicating the phonetic character of the character string as a translation result, and the counting means calculates the number of katakana characters in the translation result of the first character string and the second character string by the translation means. The first determination means inserts a blank character at the end of the first line when the smaller number of katakana characters counted by the counting means is the first character string. It is an information processing device characterized in that it is determined not to .

請求項2の発明は、前記第1の判断手段は、前記計数手段によって計数されたカタカナ文字の文字数の少ない方が前記第2の文字列である場合は、前記第1の行の行末に空白文字を挿入すると判断することを特徴とする請求項1に記載の情報処理装置である。 According to a second aspect of the present invention, the first determination means includes a blank at the end of the first line when the smaller number of katakana characters counted by the counting means is the second character string. The information processing apparatus according to claim 1, wherein it is determined to insert a character .

請求項3の発明は、表音文字によって表された文書内の第1の行の行末にある1以上の文字列と該第1の行に続く第2の行の先頭にある1以上の文字列を接続した第1の文字列と、該第1の行の行末にある1以上の文字列と該第2の行の先頭にある文字列の間に空白文字を挿入して接続した第2の文字列を作成する文字列作成手段と、前記文字列作成手段によって作成された第1の文字列と第2の文字列をそれぞれ日本語に翻訳する翻訳手段と、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数すること、又は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数する計数手段と、前記計数手段によって計数されたそれぞれの文字数を比較することによって、前記第1の行の行末に空白文字を挿入するか否かを判断する第1の判断手段を具備し、前記翻訳手段は、表音文字の文字列を翻訳できなかった場合、翻訳結果を出力しない翻訳処理を行い、前記計数手段は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数し、前記第1の判断手段は、前記計数手段によって計数された文字数の多い方が前記第1の文字列である場合は、前記第1の行の行末に空白文字を挿入しないと判断することを特徴とする情報処理装置である。 The invention according to claim 3 is characterized in that one or more character strings at the end of the first line in the document represented by phonetic characters and one or more characters at the beginning of the second line following the first line. A second character string in which a blank character is inserted between a first character string in which columns are connected, one or more character strings at the end of the first row, and a character string at the beginning of the second row A character string creating means for creating the character string, a translation means for translating the first character string and the second character string created by the character string creating means into Japanese, respectively, and a first by the translation means Count the number of katakana characters in the translation result of the character string and the second character string, respectively, or count the number of characters that are the translation result of the first character string and the second character string by the translation unit, respectively. The counting means and the number of characters counted by the counting means are compared. And a first judging means for judging whether or not to insert a blank character at the end of the first line, and the translation means translates the character string of the phonetic character when the character string cannot be translated. A translation process that does not output a result is performed, and the counting unit counts the number of characters that are translation results of the first character string and the second character string by the translation unit, respectively, and the first determination unit In the information processing apparatus, it is determined that no blank character is inserted at the end of the first line when the number of characters counted by the means is the first character string .

請求項4の発明は、前記第1の判断手段は、前記計数手段によって計数された文字数の多い方が前記第2の文字列である場合は、前記第1の行の行末に空白文字を挿入すると判断することを特徴とする請求項3に記載の情報処理装置である。 According to a fourth aspect of the present invention, the first determining means inserts a blank character at the end of the first line when the number of characters counted by the counting means is the second character string. The information processing apparatus according to claim 3, wherein the information processing apparatus is determined.

請求項5の発明は、韓国語の表音文字によって表された文書内の第1の行の行末にある1以上の文字列と該第1の行に続く第2の行の先頭にある1以上の文字列を接続した第1の文字列と、該第1の行の行末にある1以上の文字列と該第2の行の先頭にある文字列の間に空白文字を挿入して接続した第2の文字列を作成する文字列作成手段と、前記文字列作成手段によって作成された第1の文字列と第2の文字列をそれぞれ日本語に翻訳する翻訳手段と、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数すること、又は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数する計数手段と、前記計数手段によって計数されたそれぞれの文字数を比較することによって、前記第1の行の行末に空白文字を挿入するか否かを判断する第1の判断手段を具備し、前記翻訳手段は、表音文字の文字列を翻訳できなかった場合、該文字列の翻訳結果を出力しない翻訳処理を行い、前記計数手段は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数し、前記第1の判断手段は、前記計数手段によって計数された文字数の多い方が前記第1の文字列である場合は、前記第1の行の行末に空白文字を挿入しないと判断することを特徴とする情報処理装置である。 The invention according to claim 5 is characterized in that one or more character strings at the end of the first line in the document represented by Korean phonetic characters and 1 at the beginning of the second line following the first line. Connect by inserting a blank character between the first character string connecting the above character strings, one or more character strings at the end of the first line, and the character string at the beginning of the second line A character string creating means for creating the second character string, a translation means for translating the first character string and the second character string created by the character string creating means into Japanese, respectively, and the translation means Counting the number of katakana characters in the translation results of the first character string and the second character string, respectively, or calculating the number of characters as a translation result of the first character string and the second character string by the translation means The counting means for counting each is compared with the number of characters counted by the counting means. Thus, it comprises first determination means for determining whether or not to insert a blank character at the end of the first line, and the translation means, when the character string of the phonetic character cannot be translated, The translation processing that does not output the translation result of the character string is performed, and the counting means counts the number of characters that are the translation results of the first character string and the second character string by the translation means, respectively, and the first determination means In the information processing apparatus, it is determined that no blank character is inserted at the end of the first line when the larger number of characters counted by the counting means is the first character string. is there.

請求項6の発明は、前記第1の判断手段は、前記計数手段によって計数された文字数の多い方が前記第2の文字列である場合は、前記第1の行の行末に空白文字を挿入すると判断することを特徴とする請求項5に記載の情報処理装置である。 According to a sixth aspect of the present invention, the first determining means inserts a blank character at the end of the first line when the number of characters counted by the counting means is the second character string. The information processing apparatus according to claim 5, wherein the information processing apparatus is determined.

請求項7の発明は、韓国語の表音文字によって表された文書内の第1の行の行末にある1以上の文字列と該第1の行に続く第2の行の先頭にある1以上の文字列を接続した第1の文字列と、該第1の行の行末にある1以上の文字列と該第2の行の先頭にある文字列の間に空白文字を挿入して接続した第2の文字列を作成する文字列作成手段と、前記文字列作成手段によって作成された第1の文字列と第2の文字列をそれぞれ日本語に翻訳する翻訳手段と、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数すること、又は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数する計数手段と、前記計数手段によって計数されたそれぞれの文字数を比較することによって、前記第1の行の行末に空白文字を挿入するか否かを判断する第1の判断手段を具備し、前記翻訳手段は、表音文字の文字列を翻訳できなかった場合、該文字列の表音を示すカタカナによる表記を翻訳結果とする翻訳処理を行い、前記計数手段は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数し、前記第1の判断手段は、前記計数手段によって計数されたカタカナ文字の文字数の少ない方が前記第1の文字列である場合は、前記第1の行の行末に空白文字を挿入しないと判断することを特徴とする情報処理装置である。 The invention according to claim 7 is characterized in that one or more character strings at the end of the first line in a document represented by Korean phonetic characters and 1 at the beginning of the second line following the first line. Connect by inserting a blank character between the first character string connecting the above character strings, one or more character strings at the end of the first line, and the character string at the beginning of the second line A character string creating means for creating the second character string, a translation means for translating the first character string and the second character string created by the character string creating means into Japanese, respectively, and the translation means Counting the number of katakana characters in the translation results of the first character string and the second character string, respectively, or calculating the number of characters as a translation result of the first character string and the second character string by the translation means The counting means for counting each is compared with the number of characters counted by the counting means. Thus, it comprises first determination means for determining whether or not to insert a blank character at the end of the first line, and the translation means, when the character string of the phonetic character cannot be translated, The translation processing is performed with the katakana notation indicating the phonetic character of the character string as a translation result, and the counting means calculates the number of katakana characters in the translation result of the first character string and the second character string by the translation means. The first determination means inserts a blank character at the end of the first line when the smaller number of katakana characters counted by the counting means is the first character string. It is an information processing device characterized in that it is determined not to .

請求項8の発明は、前記第1の判断手段は、前記計数手段によって計数されたカタカナ文字の文字数の少ない方が前記第2の文字列である場合は、前記第1の行の行末に空白文字を挿入すると判断することを特徴とする請求項7記載の情報処理装置である。 The invention according to claim 8 is characterized in that the first determining means has a blank at the end of the first line when the smaller number of katakana characters counted by the counting means is the second character string. 8. The information processing apparatus according to claim 7, wherein it is determined that a character is inserted .

請求項9の発明は、コンピュータを、表音文字によって表された文書内の第1の行の行末にある1以上の文字列と該第1の行に続く第2の行の先頭にある1以上の文字列を接続した第1の文字列と、該第1の行の行末にある1以上の文字列と該第2の行の先頭にある文字列の間に空白文字を挿入して接続した第2の文字列を作成する文字列作成手段と、前記文字列作成手段によって作成された第1の文字列と第2の文字列をそれぞれ日本語に翻訳する翻訳手段と、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数すること、又は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数する計数手段と、前記計数手段によって計数されたそれぞれの文字数を比較することによって、前記第1の行の行末に空白文字を挿入するか否かを判断する第1の判断手段として機能させ、前記翻訳手段は、表音文字の文字列を翻訳できなかった場合、該文字列の表音を示すカタカナによる表記を翻訳結果とする翻訳処理を行い、前記計数手段は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数し、前記第1の判断手段は、前記計数手段によって計数されたカタカナ文字の文字数の少ない方が前記第1の文字列である場合は、前記第1の行の行末に空白文字を挿入しないと判断することを特徴とする情報処理プログラムである。 According to the ninth aspect of the present invention, there is provided a computer having one or more character strings at the end of the first line in the document represented by phonetic characters and the first one at the beginning of the second line following the first line. Connect by inserting a blank character between the first character string connecting the above character strings, one or more character strings at the end of the first line, and the character string at the beginning of the second line A character string creating means for creating the second character string, a translation means for translating the first character string and the second character string created by the character string creating means into Japanese, respectively, and the translation means Counting the number of katakana characters in the translation results of the first character string and the second character string, respectively, or calculating the number of characters as a translation result of the first character string and the second character string by the translation means Counting means for counting each and the number of characters counted by the counting means In the case where a comparison is made to function as first determination means for determining whether or not to insert a blank character at the end of the first line, and the translation means cannot translate the character string of the phonetic character , Performing a translation process using the katakana notation indicating the phonetic representation of the character string as a translation result, and the counting means calculates katakana characters in the translation result of the first character string and the second character string by the translation means. The number of characters is counted, and the first determination means determines that a blank character at the end of the first line if the smaller number of katakana characters counted by the counting means is the first character string. It is an information processing program characterized in that it is determined not to be inserted.

請求項10の発明は、コンピュータを、表音文字によって表された文書内の第1の行の行末にある1以上の文字列と該第1の行に続く第2の行の先頭にある1以上の文字列を接続した第1の文字列と、該第1の行の行末にある1以上の文字列と該第2の行の先頭にある文字列の間に空白文字を挿入して接続した第2の文字列を作成する文字列作成手段と、前記文字列作成手段によって作成された第1の文字列と第2の文字列をそれぞれ日本語に翻訳する翻訳手段と、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数すること、又は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数する計数手段と、前記計数手段によって計数されたそれぞれの文字数を比較することによって、前記第1の行の行末に空白文字を挿入するか否かを判断する第1の判断手段として機能させ、前記翻訳手段は、表音文字の文字列を翻訳できなかった場合、翻訳結果を出力しない翻訳処理を行い、前記計数手段は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数し、前記第1の判断手段は、前記計数手段によって計数された文字数の多い方が前記第1の文字列である場合は、前記第1の行の行末に空白文字を挿入しないと判断することを特徴とする情報処理プログラムである。
請求項11の発明は、コンピュータを、韓国語の表音文字によって表された文書内の第1の行の行末にある1以上の文字列と該第1の行に続く第2の行の先頭にある1以上の文字列を接続した第1の文字列と、該第1の行の行末にある1以上の文字列と該第2の行の先頭にある文字列の間に空白文字を挿入して接続した第2の文字列を作成する文字列作成手段と、前記文字列作成手段によって作成された第1の文字列と第2の文字列をそれぞれ日本語に翻訳する翻訳手段と、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数すること、又は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数する計数手段と、前記計数手段によって計数されたそれぞれの文字数を比較することによって、前記第1の行の行末に空白文字を挿入するか否かを判断する第1の判断手段として機能させ、前記翻訳手段は、表音文字の文字列を翻訳できなかった場合、該文字列の翻訳結果を出力しない翻訳処理を行い、前記計数手段は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数し、前記第1の判断手段は、前記計数手段によって計数された文字数の多い方が前記第1の文字列である場合は、前記第1の行の行末に空白文字を挿入しないと判断することを特徴とする情報処理プログラムである。
請求項12の発明は、コンピュータを、韓国語の表音文字によって表された文書内の第1の行の行末にある1以上の文字列と該第1の行に続く第2の行の先頭にある1以上の文字列を接続した第1の文字列と、該第1の行の行末にある1以上の文字列と該第2の行の先頭にある文字列の間に空白文字を挿入して接続した第2の文字列を作成する文字列作成手段と、前記文字列作成手段によって作成された第1の文字列と第2の文字列をそれぞれ日本語に翻訳する翻訳手段と、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数すること、又は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数する計数手段と、前記計数手段によって計数されたそれぞれの文字数を比較することによって、前記第1の行の行末に空白文字を挿入するか否かを判断する第1の判断手段として機能させ、前記翻訳手段は、表音文字の文字列を翻訳できなかった場合、該文字列の表音を示すカタカナによる表記を翻訳結果とする翻訳処理を行い、前記計数手段は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数し、前記第1の判断手段は、前記計数手段によって計数されたカタカナ文字の文字数の少ない方が前記第1の文字列である場合は、前記第1の行の行末に空白文字を挿入しないと判断することを特徴とする情報処理プログラムである。
The invention according to claim 10 is the computer having one or more character strings at the end of the first line in the document represented by phonetic characters and the first one at the beginning of the second line following the first line. Connect by inserting a blank character between the first character string connecting the above character strings, one or more character strings at the end of the first line, and the character string at the beginning of the second line A character string creating means for creating the second character string, a translation means for translating the first character string and the second character string created by the character string creating means into Japanese, respectively, and the translation means Counting the number of katakana characters in the translation results of the first character string and the second character string, respectively, or calculating the number of characters as a translation result of the first character string and the second character string by the translation means Counting means for counting and each character counted by the counting means , And the translation means could not translate the character string of the phonetic character. The translation means could not translate the character string of the phonetic character. A translation process that does not output a translation result, and the counting means counts the number of characters that are the translation results of the first character string and the second character string by the translation means, respectively, and the first determination means An information processing program for determining that a blank character is not inserted at the end of the first line when the larger number of characters counted by the counting means is the first character string. .
The invention according to claim 11 is the computer having one or more character strings at the end of the first line in the document represented by Korean phonetic characters and the beginning of the second line following the first line. A blank character is inserted between the first character string in which one or more character strings are connected to each other, the one or more character strings at the end of the first line, and the character string at the beginning of the second line. A character string creating means for creating the connected second character string, a translation means for translating the first character string and the second character string created by the character string creating means into Japanese, respectively, Counting the number of katakana characters in the translation result of the first character string and the second character string by the translation means, respectively, or by the translation result of the first character string and the second character string by the translation means A counting means for counting a certain number of characters, respectively, and each counted by the counting means. By comparing the number of characters in the first row to function as a first judging means for judging whether or not to insert a blank character at the end of the first line, and the translating means can translate the character string of the phonetic character. If not, the translation processing that does not output the translation result of the character string is performed, the counting means counts the number of characters that are the translation results of the first character string and the second character string by the translation means, respectively, The first determining means determines that a blank character is not inserted at the end of the first line when the larger number of characters counted by the counting means is the first character string. Information processing program.
According to the invention of claim 12, the computer causes one or more character strings at the end of the first line in the document represented by Korean phonetic characters and the beginning of the second line following the first line. A blank character is inserted between the first character string in which one or more character strings are connected to each other, the one or more character strings at the end of the first line, and the character string at the beginning of the second line. A character string creating means for creating the connected second character string, a translation means for translating the first character string and the second character string created by the character string creating means into Japanese, respectively, Counting the number of katakana characters in the translation result of the first character string and the second character string by the translation means, respectively, or by the translation result of the first character string and the second character string by the translation means A counting means for counting a certain number of characters, respectively, and each counted by the counting means. By comparing the number of characters in the first row to function as a first judging means for judging whether or not to insert a blank character at the end of the first line, and the translating means can translate the character string of the phonetic character. If not, a translation process is performed with the katakana notation indicating the phonetic representation of the character string as a translation result, and the counting means includes a translation result of the first character string and the second character string by the translation means. Each of the number of katakana characters is counted, and the first determining means, if the smaller number of katakana characters counted by the counting means is the first character string, the end of the first line. It is an information processing program characterized in that it is determined that no blank character is inserted in.

請求項1の情報処理装置によれば、表音文字によって表された文字列であって、行末に空白があるか否かによって意味が異なる場合にあって、行末に空白があるか否かを判断することができる。また、翻訳手段による翻訳処理の種類によって、行末に空白があるか否かの判断を異ならせることができる。 According to the information processing apparatus of claim 1, whether or not there is a character string represented by a phonetic character and the meaning varies depending on whether or not there is a blank at the end of the line, and whether or not there is a blank at the end of the line. Judgment can be made. In addition, it can be determined whether there is a blank at the end of the line depending on the type of translation processing performed by the translation means.

請求項2の情報処理装置によれば、翻訳後のカタカナ文字の文字数が少ない方が第2の文字列である場合は、第1の行の行末に空白文字を挿入すると判断することができる。 According to the information processing apparatus of the second aspect, when the number of translated katakana characters is smaller is the second character string, it can be determined that a blank character is inserted at the end of the first line.

請求項3の情報処理装置によれば、表音文字によって表された文字列であって、行末に空白があるか否かによって意味が異なる場合にあって、行末に空白があるか否かを判断することができる。また、翻訳後の文字数が多い方が第1の文字列である場合は、第1の行の行末に空白文字を挿入しないと判断することができる。 According to the information processing apparatus of claim 3, whether the character string is represented by a phonetic character and has different meaning depending on whether there is a blank at the end of the line, and whether there is a blank at the end of the line. Judgment can be made. In addition, when the number of characters after translation is the first character string, it can be determined that no blank character is inserted at the end of the first line.

請求項4の情報処理装置によれば、翻訳後の文字数が多い方が第2の文字列である場合は、第1の行の行末に空白文字を挿入すると判断することができる。 According to the information processing apparatus of the fourth aspect, when the number of characters after translation is the second character string, it can be determined that a blank character is inserted at the end of the first line.

請求項5の情報処理装置によれば、韓国語の表音文字によって表された文字列であって、行末に空白があるか否かによって意味が異なる場合にあって、行末に空白があるか否かを判断することができる。また、翻訳手段による翻訳処理の種類によって、行末に空白があるか否かの判断を異ならせることができる。 According to the information processing apparatus of claim 5, whether the character string is expressed by a Korean phonetic character and has different meaning depending on whether there is a blank at the end of the line, and whether there is a blank at the end of the line. It can be determined whether or not. In addition, it can be determined whether there is a blank at the end of the line depending on the type of translation processing performed by the translation means.

請求項6の情報処理装置によれば、翻訳後の文字数が多い方が第2の文字列である場合は、第1の行の行末に空白文字を挿入すると判断することができる。 According to the information processing apparatus of the sixth aspect, when the number of characters after translation is the second character string, it can be determined that a blank character is inserted at the end of the first line.

請求項7の情報処理装置によれば、韓国語の表音文字によって表された文字列であって、行末に空白があるか否かによって意味が異なる場合にあって、行末に空白があるか否かを判断することができる。また、翻訳後のカタカナ文字の文字数が少ない方が第1の文字列である場合は、第1の行の行末に空白文字を挿入しないと判断することができる。 According to the information processing apparatus of claim 7, whether the character string is expressed by a Korean phonetic character and the meaning differs depending on whether there is a blank at the end of the line, and whether there is a blank at the end of the line It can be determined whether or not. Further, when the translated character of the katakana character is the first character string, it can be determined that no blank character is inserted at the end of the first line.

請求項8の情報処理装置によれば、翻訳後のカタカナ文字の文字数の少ない方が第2の文字列である場合は、第1の行の行末に空白文字を挿入すると判断することができる。 According to the information processing apparatus of the eighth aspect, when the smaller number of translated katakana characters is the second character string, it can be determined that a blank character is inserted at the end of the first line.

請求項9の情報処理プログラムによれば、表音文字によって表された文字列であって、行末に空白があるか否かによって意味が異なる場合にあって、行末に空白があるか否かを判断することができる。また、翻訳手段による翻訳処理の種類によって、行末に空白があるか否かの判断を異ならせることができる。 According to the information processing program of claim 9, whether or not there is a character string represented by a phonetic character and the meaning varies depending on whether or not there is a blank at the end of the line, and whether or not there is a blank at the end of the line. Judgment can be made. In addition, it can be determined whether there is a blank at the end of the line depending on the type of translation processing performed by the translation means.

請求項10の情報処理プログラムによれば、表音文字によって表された文字列であって、行末に空白があるか否かによって意味が異なる場合にあって、行末に空白があるか否かを判断することができる。また、翻訳後の文字数が多い方が第1の文字列である場合は、第1の行の行末に空白文字を挿入しないと判断することができる。
請求項11の情報処理プログラムによれば、韓国語の表音文字によって表された文字列であって、行末に空白があるか否かによって意味が異なる場合にあって、行末に空白があるか否かを判断することができる。また、翻訳手段による翻訳処理の種類によって、行末に空白があるか否かの判断を異ならせることができる。
請求項12の情報処理プログラムによれば、韓国語の表音文字によって表された文字列であって、行末に空白があるか否かによって意味が異なる場合にあって、行末に空白があるか否かを判断することができる。また、翻訳後のカタカナ文字の文字数が少ない方が第1の文字列である場合は、第1の行の行末に空白文字を挿入しないと判断することができる。
According to the information processing program of claim 10, whether or not there is a character string represented by a phonetic character, and the meaning varies depending on whether or not there is a blank at the end of the line, and whether or not there is a blank at the end of the line. Judgment can be made. In addition, when the number of characters after translation is the first character string, it can be determined that no blank character is inserted at the end of the first line.
According to the information processing program of claim 11, is a character string represented by a Korean phonetic character, where the meaning differs depending on whether there is a blank at the end of the line, and whether there is a blank at the end of the line It can be determined whether or not. In addition, it can be determined whether there is a blank at the end of the line depending on the type of translation processing performed by the translation means.
According to the information processing program of claim 12, is a character string represented by a Korean phonetic character, where the meaning differs depending on whether there is a blank at the end of the line, and whether there is a blank at the end of the line It can be determined whether or not. Further, when the translated character of the katakana character is the first character string, it can be determined that no blank character is inserted at the end of the first line.

本実施の形態の構成例についての概念的なモジュール構成図である。It is a conceptual module block diagram about the structural example of this Embodiment. 本実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by this Embodiment. 本実施の形態による処理例を示す説明図である。It is explanatory drawing which shows the process example by this Embodiment. 本実施の形態による処理例を示す説明図である。It is explanatory drawing which shows the process example by this Embodiment. 本実施の形態による処理例を示す説明図である。It is explanatory drawing which shows the process example by this Embodiment. 本実施の形態が処理対象とする文字情報テーブルのデータ構造例を示す説明図である。It is explanatory drawing which shows the example of a data structure of the character information table made into this Embodiment. 本実施の形態による処理例を示す説明図である。It is explanatory drawing which shows the process example by this Embodiment. 本実施の形態による処理例を示す説明図である。It is explanatory drawing which shows the process example by this Embodiment. 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。It is a block diagram which shows the hardware structural example of the computer which implement | achieves this Embodiment.

以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
Hereinafter, an example of a preferred embodiment for realizing the present invention will be described with reference to the drawings.
FIG. 1 shows a conceptual module configuration diagram of a configuration example of the present embodiment.
The module generally refers to components such as software (computer program) and hardware that can be logically separated. Therefore, the module in the present embodiment indicates not only a module in a computer program but also a module in a hardware configuration. Therefore, the present embodiment is a computer program for causing these modules to function (a program for causing a computer to execute each procedure, a program for causing a computer to function as each means, and a function for each computer. This also serves as an explanation of the program and system and method for realizing the above. However, for the sake of explanation, the words “store”, “store”, and equivalents thereof are used. However, when the embodiment is a computer program, these words are stored in a storage device or stored in memory. It is the control to be stored in the device. Modules may correspond to functions one-to-one, but in mounting, one module may be configured by one program, or a plurality of modules may be configured by one program, and conversely, one module May be composed of a plurality of programs. The plurality of modules may be executed by one computer, or one module may be executed by a plurality of computers in a distributed or parallel environment. Note that one module may include other modules. Hereinafter, “connection” is used not only for physical connection but also for logical connection (data exchange, instruction, reference relationship between data, etc.). “Predetermined” means that the process is determined before the target process, and not only before the process according to this embodiment starts but also after the process according to this embodiment starts. In addition, if it is before the target processing, it is used in accordance with the situation / state at that time or with the intention to be decided according to the situation / state up to that point. When there are a plurality of “predetermined values”, they may be different values, or two or more values (of course, including all values) may be the same. In addition, the description having the meaning of “do B when it is A” is used in the meaning of “determine whether or not it is A and do B when it is judged as A”. However, the case where it is not necessary to determine whether or not A is excluded.
In addition, the system or device is configured by connecting a plurality of computers, hardware, devices, and the like by communication means such as a network (including one-to-one correspondence communication connection), etc., and one computer, hardware, device. The case where it implement | achieves by etc. is included. “Apparatus” and “system” are used as synonymous terms. Of course, the “system” does not include a social “mechanism” (social system) that is an artificial arrangement.
In addition, when performing a plurality of processes in each module or in each module, the target information is read from the storage device for each process, and the processing result is written to the storage device after performing the processing. is there. Therefore, description of reading from the storage device before processing and writing to the storage device after processing may be omitted. Here, the storage device may include a hard disk, a RAM (Random Access Memory), an external storage medium, a storage device via a communication line, a register in a CPU (Central Processing Unit), and the like.

本実施の形態である情報処理装置は、表音文字によって表された文字列であって、行末に空白があるか否かによって意味が異なる場合にあって、行末に空白があるか否かを判断するものであって、図1の例に示すように、受付モジュール110、文字列作成モジュール120、翻訳モジュール130、カウントモジュール140、判断モジュール150を有している。
表音文字によって表される言語であって、行末に空白があるか否かによって意味が異なるものとして、例えば、韓国語がある。韓国語では、行の境(行末)に空白が入るか否かは文章の内容を理解しなければ判断できない。本実施の形態は、その空白の有無を判断する。
The information processing apparatus according to the present embodiment is a character string represented by phonetic characters, and the meaning varies depending on whether or not there is a blank at the end of the line, and whether or not there is a blank at the end of the line. As shown in the example of FIG. 1, the determination module 110 includes a reception module 110, a character string creation module 120, a translation module 130, a count module 140, and a determination module 150.
As a language expressed by phonetic characters and having a different meaning depending on whether there is a space at the end of a line, for example, there is Korean. In Korean, it is impossible to determine whether or not there is a blank at the line boundary (end of line) without understanding the content of the sentence. In the present embodiment, the presence or absence of the blank is determined.

受付モジュール110は、文字列作成モジュール120と接続されている。受付モジュール110は、表音文字によって表された文書を受け付ける。ここで文書とは、PDF(Portable Document Format)等の電子文書、文書画像を文字認識した結果等であってもよい。これらの文書では、文字コード、その文字コードで示される文字の位置が記憶されているが、行末に空白があるか否かの情報は含まれていないのが一般的である。また、文書を受け付けるとは、例えば、文書処理装置から文書を受信すること、ハードディスク(コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている画像を読み出すこと等が含まれる。受け付ける文書は、1枚であってもよいし、複数枚であってもよい。また、文書の内容として、ビジネスに用いられる文書、広告宣伝用のパンフレット等であってもよい。   The reception module 110 is connected to the character string creation module 120. The reception module 110 receives a document represented by phonetic characters. Here, the document may be an electronic document such as PDF (Portable Document Format), a result of character recognition of a document image, or the like. In these documents, the character code and the position of the character indicated by the character code are stored, but generally the information on whether or not there is a blank at the end of the line is not included. Also, accepting a document is, for example, receiving a document from a document processing device, stored in a hard disk (including those built in a computer, connected through a network, etc.), etc. For example, reading out an existing image. One document or a plurality of documents may be accepted. Further, the content of the document may be a document used for business, a pamphlet for advertisement, or the like.

文字列作成モジュール120は、受付モジュール110、翻訳モジュール130と接続されている。文字列作成モジュール120は、受付モジュール110によって受け付けられた文書内の第1の行の行末にある1以上の文字列とその第1の行に続く第2の行の先頭にある1以上の文字列を接続した第1の文字列を作成する。そして、その第1の行の行末にある1以上の文字列とその第2の行の先頭にある文字列の間に空白文字を挿入して接続した第2の文字列を作成する。2の(行数−1)乗個の文字列ができる。
例えば、第1の行内の全部の文字列と第2の行内の全部の文字列をそのまま接続した第1の文字列、第1の行内の全部の文字列と第2の行内の全部の文字列の間に空白文字を挿入して接続した第2の文字列、の2つの文字列を作成することになる。また、第1の行内の行末にある1つの文字列と第2の行の先頭にある1つの文字列を接続した第1の文字列を作成し、第1の行内の行末にある1つの文字列と第2の行の先頭にある1つの文字列の間に空白文字を挿入して接続した第2の文字列を作成するようにしてもよい。また、第1の行内の行末にある複数の文字列(最後尾の文字列を含む)と第2の行の先頭にある複数の文字列(1番目の文字列を含む)を接続した第1の文字列を作成し、第1の行内の行末にある複数の文字列(最後尾の文字列を含む)と第2の行の先頭にある複数の文字列(1番目の文字列を含む)の間に空白文字を挿入して接続した第2の文字列を作成するようにしてもよい。
The character string creation module 120 is connected to the reception module 110 and the translation module 130. The character string creating module 120 includes one or more character strings at the end of the first line in the document received by the receiving module 110 and one or more characters at the beginning of the second line following the first line. A first character string connecting columns is created. Then, a second character string is created by inserting a blank character between one or more character strings at the end of the first line and a character string at the beginning of the second line. 2 (number of lines minus 1) power character strings are generated.
For example, the first character string in which all the character strings in the first row and all the character strings in the second row are connected as they are, all the character strings in the first row and all the character strings in the second row. Two character strings, that is, a second character string that is connected by inserting a blank character between them, are created. Also, a first character string is created by connecting one character string at the end of the line in the first line and one character string at the beginning of the second line, and one character at the end of the line in the first line. A second character string in which a blank character is inserted between the column and one character string at the head of the second row may be created. Also, a first character string in which a plurality of character strings (including the last character string) at the end of the first line and a plurality of character strings (including the first character string) at the beginning of the second line are connected. A character string is created, and a plurality of character strings (including the last character string) at the end of the first line and a plurality of character strings (including the first character string) at the beginning of the second line are created. A second character string in which a blank character is inserted between them may be created.

翻訳モジュール130は、文字列作成モジュール120、カウントモジュール140と接続されている。翻訳モジュール130は、文字列作成モジュール120によって作成された第1の文字列と第2の文字列をそれぞれ日本語に翻訳する。翻訳モジュール130は、表音文字の文字列を翻訳できなかった場合、その文字列の表音を示すカタカナによる表記を翻訳結果とする翻訳処理を行う。又は、翻訳モジュール130は、表音文字の文字列を翻訳できなかった場合、その文字列の翻訳結果を出力しない翻訳処理を行う。一般に、韓国語を日本語に翻訳する翻訳モジュール130にあって、文字列を翻訳できなかった場合は、「カタカナで表記される」又は「文字列が削除される」のいずれかであることが多い。前者の場合はカタカナの文字数、後者の場合は残った文字数により判断することとなる。   The translation module 130 is connected to the character string creation module 120 and the count module 140. The translation module 130 translates the first character string and the second character string created by the character string creating module 120 into Japanese. When the translation module 130 cannot translate the phonetic character string, the translation module 130 performs a translation process using the katakana notation indicating the phonetic character of the character string as a translation result. Or the translation module 130 performs the translation process which does not output the translation result of the character string, when the character string of the phonetic character cannot be translated. In general, in the translation module 130 that translates Korean into Japanese, if the character string cannot be translated, it may be “represented in katakana” or “character string is deleted”. Many. In the former case, the number of katakana characters is determined. In the latter case, the number of remaining characters is determined.

カウントモジュール140は、翻訳モジュール130、判断モジュール150と接続されている。カウントモジュール140は、翻訳モジュール130による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数すること、又は、翻訳モジュール130による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数する。
カウントモジュール140は、翻訳モジュール130が、表音文字の文字列を翻訳できなかった場合、その文字列の表音を示すカタカナによる表記を翻訳結果とする翻訳処理を行うか否かを判断するようにしてもよい。そして、カタカナによる表記を翻訳結果とする翻訳処理を行うと判断した場合は、翻訳モジュール130による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数するようにしてもよい。
また、カウントモジュール140は、カタカナによる表記を翻訳結果とする翻訳処理を行うと判断しなかった場合は、翻訳モジュール130による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数するようにしてもよい。
The count module 140 is connected to the translation module 130 and the determination module 150. The counting module 140 counts the number of katakana characters in the translation result of the first character string and the second character string by the translation module 130, respectively, or the first character string and the second character string by the translation module 130, respectively. The number of characters that are the translation result of the character string is counted.
When the translation module 130 cannot translate the phonetic character string, the count module 140 determines whether or not to perform a translation process using the katakana notation indicating the phonetic character of the character string as a translation result. It may be. If it is determined that the translation processing using the katakana notation as the translation result is performed, the number of katakana characters in the translation result of the first character string and the second character string by the translation module 130 is counted. May be.
In addition, when the count module 140 does not determine that the translation processing using the katakana notation as the translation result is performed, the count module 140 calculates the number of characters as the translation result of the first character string and the second character string by the translation module 130, respectively. You may make it count.

カウントモジュール140は、翻訳モジュール130が、表音文字の文字列を翻訳できなかった場合、その文字列の翻訳結果を出力しない翻訳処理を行うか否かを判断するようにしてもよい。そして、翻訳結果を出力しない翻訳処理を行うと判断した場合は、翻訳モジュール130による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数するようにしてもよい。
また、カウントモジュール140は、翻訳結果を出力しない翻訳処理を行うと判断しなかった場合は、翻訳モジュール130による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数するようにしてもよい。
When the translation module 130 cannot translate the phonetic character string, the count module 140 may determine whether to perform a translation process that does not output the translation result of the character string. If it is determined that a translation process that does not output the translation result is performed, the number of characters that are the translation result of the first character string and the second character string by the translation module 130 may be counted.
If the count module 140 does not determine that the translation process that does not output the translation result is performed, the count module 140 determines the number of katakana characters in the translation result of the first character string and the second character string by the translation module 130, respectively. You may make it count.

判断モジュール150は、カウントモジュール140と接続されている。判断モジュール150は、カウントモジュール140によって計数されたそれぞれの文字数を比較することによって、第1の行の行末に空白文字を挿入するか否かを判断する。
判断モジュール150は、カウントモジュール140によって、カタカナによる表記を翻訳結果とする翻訳処理を行うと判断した場合は、カウントモジュール140によって計数されたカタカナ文字の文字数の少ない方が第1の文字列である場合は、第1の行の行末に空白文字を挿入しないと判断するようにしてもよい。
また、判断モジュール150は、カウントモジュール140によって、カタカナによる表記を翻訳結果とする翻訳処理を行うと判断した場合は、カウントモジュール140によって計数されたカタカナ文字の文字数の少ない方が第2の文字列である場合は、第1の行の行末に空白文字を挿入すると判断するようにしてもよい。
The determination module 150 is connected to the count module 140. The determination module 150 determines whether to insert a blank character at the end of the first line by comparing the number of characters counted by the count module 140.
When the determination module 150 determines that the count module 140 performs a translation process using the katakana notation as a translation result, the smaller number of katakana characters counted by the count module 140 is the first character string. In this case, it may be determined that no blank character is inserted at the end of the first line.
If the determination module 150 determines that the count module 140 performs a translation process using the katakana notation as a translation result, the second character string has a smaller number of katakana characters counted by the count module 140. In this case, it may be determined that a blank character is inserted at the end of the first line.

判断モジュール150は、カウントモジュール140によって、カタカナによる表記を翻訳結果とする翻訳処理を行うと判断しなかった場合は、カウントモジュール140によって計数された文字数の多い方が第1の文字列である場合は、第1の行の行末に空白文字を挿入しないと判断するようにしてもよい。
また、判断モジュール150は、カウントモジュール140によって、カタカナによる表記を翻訳結果とする翻訳処理を行うと判断しなかった場合は、カウントモジュール140によって計数された文字数の多い方が第2の文字列である場合は、第1の行の行末に空白文字を挿入すると判断するようにしてもよい。
If the determination module 150 does not determine that the count module 140 performs a translation process using the katakana notation as a translation result, the case where the number of characters counted by the count module 140 is the first character string May be determined not to insert a blank character at the end of the first line.
In addition, when the determination module 150 does not determine that the count module 140 performs the translation process using the katakana notation as the translation result, the second character string has the larger number of characters counted by the count module 140. In some cases, it may be determined that a blank character is inserted at the end of the first line.

判断モジュール150は、カウントモジュール140によって、翻訳結果を出力しない翻訳処理を行うと判断した場合は、カウントモジュール140によって計数された文字数の多い方が第1の文字列である場合は、第1の行の行末に空白文字を挿入しないと判断するようにしてもよい。
また、判断モジュール150は、カウントモジュール140によって、翻訳結果を出力しない翻訳処理を行うと判断した場合は、カウントモジュール140によって計数された文字数の多い方が第2の文字列である場合は、第1の行の行末に空白文字を挿入すると判断するようにしてもよい。
When the determination module 150 determines that the count module 140 performs a translation process that does not output the translation result, the first module has the first character string when the number of characters counted by the count module 140 is the first character string. It may be determined that a blank character is not inserted at the end of the line.
Further, when the determination module 150 determines that the count module 140 performs a translation process that does not output the translation result, the determination module 150 determines that the number of characters counted by the count module 140 is the second character string. It may be determined that a blank character is inserted at the end of one line.

判断モジュール150は、カウントモジュール140によって、翻訳結果を出力しない翻訳処理を行うと判断しなかった場合は、カウントモジュール140によって計数されたカタカナ文字の文字数の少ない方が第1の文字列である場合は、第1の行の行末に空白文字を挿入しないと判断するようにしてもよい。
また、判断モジュール150は、カウントモジュール140によって、翻訳結果を出力しない翻訳処理を行うと判断しなかった場合は、カウントモジュール140によって計数されたカタカナ文字の文字数の少ない方が第2の文字列である場合は、第1の行の行末に空白文字を挿入すると判断するようにしてもよい。
If the determination module 150 does not determine that the count module 140 performs a translation process that does not output the translation result, the smaller number of katakana characters counted by the count module 140 is the first character string. May be determined not to insert a blank character at the end of the first line.
Also, if the determination module 150 does not determine that the count module 140 performs a translation process that does not output the translation result, the second character string has the smaller number of katakana characters counted by the count module 140. In some cases, it may be determined that a blank character is inserted at the end of the first line.

図2は、本実施の形態による処理例を示すフローチャートである。
ステップS202では、受付モジュール110が、行毎に文字列を保存する。
ステップS204では、文字列作成モジュール120が、行の境の数だけ空白の有無の組み合わせを作成する。
ステップS206では、文字列作成モジュール120が、組み合わせに基づいて空白を挿入してつなげた文章を作成する。
ステップS208では、翻訳モジュール130が、組み合わせた文章に対して翻訳を実行する。
ステップS210では、カウントモジュール140が、翻訳モジュール130がカタカナで発音を出すタイプであるか否かを判断し、カタカナで発音を出すタイプである場合はステップS212へ進み、それ以外の場合はステップS218へ進む。
FIG. 2 is a flowchart showing an example of processing according to this embodiment.
In step S202, the reception module 110 stores a character string for each line.
In step S204, the character string creation module 120 creates a combination of the presence or absence of blanks as many as the number of line boundaries.
In step S206, the character string creation module 120 creates a sentence in which a blank is inserted and connected based on the combination.
In step S208, the translation module 130 performs translation on the combined text.
In step S210, the count module 140 determines whether or not the translation module 130 is a type that produces pronunciation in katakana. If it is the type that produces pronunciation in katakana, the process proceeds to step S212. Otherwise, step S218 is performed. Proceed to

ステップS212では、カウントモジュール140が、翻訳結果のカタカナの文字数をカウントする。
ステップS214では、判断モジュール150が、対象文について、カウントが少ない組み合わせを採用する。つまり、カウントが少ない組み合わせ(文字列)が、第1の文字列(空白文字の挿入なし)であれば、行末に空白文字を挿入しないと判断する。カウントが少ない組み合わせ(文字列)が、第2の文字列(空白文字の挿入あり)であれば、行末に空白文字を挿入すると判断する。
ステップS216では、その文書内にある行についての処理が終了したか否かを判断し、終了した場合は処理を終了し(ステップS299)、それ以外の場合はステップS212へ戻る。
In step S212, the count module 140 counts the number of katakana characters in the translation result.
In step S214, the determination module 150 employs a combination having a small count for the target sentence. That is, if the combination (character string) with a small count is the first character string (no blank character is inserted), it is determined that no blank character is inserted at the end of the line. If the combination (character string) with a small count is the second character string (with insertion of a blank character), it is determined that a blank character is inserted at the end of the line.
In step S216, it is determined whether or not the process for the line in the document has been completed. If completed, the process is terminated (step S299). Otherwise, the process returns to step S212.

ステップS218では、カウントモジュール140が、翻訳結果の文字数をカウントする。
ステップS220では、判断モジュール150が、対象文について、カウントが多い組み合わせを採用する。つまり、カウントが多い組み合わせ(文字列)が、第1の文字列(空白文字の挿入なし)であれば、行末に空白文字を挿入しないと判断する。カウントが多い組み合わせ(文字列)が、第2の文字列(空白文字の挿入あり)であれば、行末に空白文字を挿入すると判断する。
ステップS222では、その文書内にある行についての処理が終了したか否かを判断し、終了した場合は処理を終了し(ステップS299)、それ以外の場合はステップS218へ戻る。
In step S218, the count module 140 counts the number of characters of the translation result.
In step S220, the determination module 150 employs a combination having a large count for the target sentence. That is, if the combination (character string) with a large count is the first character string (no blank character is inserted), it is determined that no blank character is inserted at the end of the line. If the combination (character string) with a large count is the second character string (with insertion of a blank character), it is determined that a blank character is inserted at the end of the line.
In step S222, it is determined whether or not the process for the line in the document has been completed. If completed, the process is terminated (step S299). Otherwise, the process returns to step S218.

なお、ステップS210の処理を行わずに、ステップS212〜ステップS216の処理、又はステップS218〜ステップS222の処理のいずれかの一方を行うようにしてもよい。
また、ステップS210の処理の代わりに、カウントモジュール140が、翻訳モジュール130が文字列を削除するタイプであるか否かを判断し、文字列を削除するタイプである場合はステップS218へ進み、それ以外の場合はステップS212へ進むようにしてもよい。
In addition, you may make it perform any one of the process of step S212-step S216, or the process of step S218-step S222, without performing the process of step S210.
Instead of the process of step S210, the count module 140 determines whether or not the translation module 130 is a type that deletes a character string. If the type is a type that deletes a character string, the process proceeds to step S218. Otherwise, the process may proceed to step S212.

図3は、本実施の形態(文字列作成モジュール120、ステップS204、ステップS206)による処理例を示す説明図である。
受付モジュール110が受け付けた文書に、行310、行320、行330、行340、行350の5つの行があるとする。
図3(a)の例に示すように、対象行ペア315内の行310、行320のペアで、空白文字を挿入せずに接続した文字列と空白文字を挿入して接続した文字列を作成する。同様に、図3(b)の例に示すように、対象行ペア325内の行320、行330のペア、図3(c)の例に示すように、対象行ペア335内の行330、行340のペア、図3(d)の例に示すように、対象行ペア345内の行340、行350のペアで、空白文字を挿入せずに接続した文字列と空白文字を挿入して接続した文字列を作成する。そして、行のペアで順に空白を入れるべきか否かを判断する。
FIG. 3 is an explanatory diagram showing a processing example according to the present embodiment (character string creation module 120, step S204, step S206).
It is assumed that the document received by the receiving module 110 includes five lines: a line 310, a line 320, a line 330, a line 340, and a line 350.
As shown in the example of FIG. 3A, a character string connected without inserting a blank character and a character string connected by inserting a blank character in a pair of the row 310 and the row 320 in the target row pair 315 create. Similarly, as shown in the example of FIG. 3B, a pair of the row 320 and the row 330 in the target row pair 325, and as shown in the example of FIG. 3C, the row 330 in the target row pair 335, As shown in the example of FIG. 3D, a pair of lines 340, a pair of lines 340 and 350 in the target line pair 345 is inserted without inserting a blank character and a blank character. Create a connected string. Then, it is determined whether or not blanks should be inserted in order in pairs of lines.

図4は、本実施の形態(文字列作成モジュール120、ステップS204、ステップS206)による処理例を示す説明図である。接続対象の文字列に対して前後の文字列(gram)を含めた単位を翻訳対象として、空白を入れるべきか否かを判断するものである。
受付モジュール110が受け付けた文書に、3つの行があるとする。各行には、文字列412〜418、文字列422〜428、文字列432〜438がある。
図4(a)の例に示すように、対象文字列組420内の文字列418と文字列422の間に空白文字を挿入せずに接続した文字列と空白文字を挿入して接続した文字列を作成し、文字列416、文字列418と文字列422を接続した文字列、文字列424を翻訳対象とし、文字列416、文字列418と文字列422に空白文字を挿入して接続した文字列、文字列424を翻訳対象とする。もちろんのことながら、各単語(例えば、文字列416と文字列418)の間に空白文字を挿入する。同様に、図4(b)の例に示すように、対象文字列組430内の文字列428と文字列432の間に空白文字を挿入せずに接続した文字列と空白文字を挿入して接続した文字列を作成し、文字列426、文字列428と文字列432を接続した文字列、文字列434を翻訳対象とし、文字列426、文字列428と文字列432に空白文字を挿入して接続した文字列、文字列434を翻訳対象とする。そして、これらの文字列で順に空白を入れるべきか否かを判断する。図3の例に比べると、2行分の全体を翻訳対象とするよりも、翻訳対象とする文字列が減ることになる。
FIG. 4 is an explanatory diagram showing a processing example according to the present exemplary embodiment (character string creation module 120, step S204, step S206). It is determined whether or not a blank should be inserted with a unit including a character string (gram) before and after the character string to be connected as a translation target.
It is assumed that the document received by the receiving module 110 has three lines. Each line includes character strings 412 to 418, character strings 422 to 428, and character strings 432 to 438.
As shown in the example of FIG. 4A, a character string connected without inserting a blank character between the character string 418 and the character string 422 in the target character string set 420 and a character connected by inserting a blank character. A string is created, a character string 416, a character string obtained by connecting the character string 418 and the character string 422, and a character string 424 as a translation target. A blank character is inserted into the character string 416, the character string 418, and the character string 422 and connected. A character string and a character string 424 are to be translated. Of course, a blank character is inserted between each word (for example, character string 416 and character string 418). Similarly, as shown in the example of FIG. 4B, by inserting a connected character string and a blank character between the character string 428 and the character string 432 in the target character string set 430 without inserting a blank character. A connected character string is created, a character string 426, a character string obtained by connecting the character string 428 and the character string 432, and a character string 434 are translated, and a blank character is inserted into the character string 426, the character string 428, and the character string 432. The character string and the character string 434 connected in this manner are to be translated. Then, it is determined whether or not blanks should be put in order in these character strings. Compared with the example of FIG. 3, the character string to be translated is reduced rather than the entire two lines being translated.

図5は、本実施の形態(文字列作成モジュール120、ステップS204、ステップS206)による処理例を示す説明図である。接続対象の文字列に対して前後の文字列(gram)を含めた単位を翻訳対象として、空白を入れるべきか否かを判断するものである。
受付モジュール110が受け付けた文書に、3つの行があるとする。各行には、文字列512〜518、文字列522〜528、文字列532〜538がある。
図5(a)の例に示すように、対象文字列組520内の文字列518と文字列522の間に空白文字を挿入せずに接続した文字列と空白文字を挿入して接続した文字列を作成し、文字列514、文字列516、文字列518と文字列522を接続した文字列、文字列524、文字列526を翻訳対象とし、文字列514、文字列516、文字列518と文字列522に空白文字を挿入して接続した文字列、文字列524、文字列526を翻訳対象とする。もちろんのことながら、各単語(例えば、文字列514と文字列516、文字列516と文字列518、文字列522と文字列524、文字列524と文字列526)の間に空白文字を挿入する。同様に、図5(b)の例に示すように、対象文字列組530内の文字列528と文字列532の間に空白文字を挿入せずに接続した文字列と空白文字を挿入して接続した文字列を作成し、文字列524、文字列526、文字列528と文字列532を接続した文字列、文字列534、文字列536を翻訳対象とし、文字列524、文字列526、文字列528と文字列532に空白文字を挿入して接続した文字列、文字列534、文字列536を翻訳対象とする。そして、これらの文字列で順に空白を入れるべきか否かを判断する。図3の例に比べると、2行分の全体を翻訳対象とするよりも、翻訳対象とする文字列が減ることになる。図4の例に比べると、翻訳対象が増えることにより、翻訳の精度を上げることになる。
FIG. 5 is an explanatory diagram showing a processing example according to the present exemplary embodiment (character string creation module 120, step S204, step S206). It is determined whether or not a blank should be inserted with a unit including a character string (gram) before and after the character string to be connected as a translation target.
It is assumed that the document received by the receiving module 110 has three lines. Each row includes character strings 512 to 518, character strings 522 to 528, and character strings 532 to 538.
As shown in the example of FIG. 5A, a character string connected without inserting a blank character between the character string 518 and the character string 522 in the target character string set 520 and a character connected by inserting a blank character. A character string 514, a character string 516, a character string obtained by connecting the character string 518 and the character string 522, a character string 524, and a character string 526 are translated, and the character string 514, the character string 516, the character string 518, A character string, a character string 524, and a character string 526 connected by inserting a blank character into the character string 522 are set as translation targets. Of course, a blank character is inserted between each word (for example, character string 514 and character string 516, character string 516 and character string 518, character string 522 and character string 524, character string 524 and character string 526). . Similarly, as shown in the example of FIG. 5B, by inserting a connected character string and a blank character between the character string 528 and the character string 532 in the target character string set 530 without inserting a blank character. A connected character string is created, a character string 524, a character string 526, a character string obtained by connecting the character string 528 and the character string 532, a character string 534, and a character string 536 as translation targets. A character string, a character string 534, and a character string 536 connected by inserting blank characters into the column 528 and the character string 532 are to be translated. Then, it is determined whether or not blanks should be put in order in these character strings. Compared with the example of FIG. 3, the character string to be translated is reduced rather than the entire two lines being translated. Compared with the example of FIG. 4, the translation accuracy increases as the number of translation objects increases.

なお、前述の例では前後1つの文字列、前後2つの文字列を含めて翻訳対象としたが、3以上の文字列を含めて翻訳対象としてもよいし、前後で異なる数の文字列を含めるようにしてもよい。
また、前後の文字列を含めずに、空白文字を挿入しないで接続した文字列(図5の例では文字列518と文字列522の接続文字列)と、空白文字を挿入して接続した文字列(図5の例では文字列518と文字列522との間に空白文字を挿入した接続文字列)を翻訳対象として、空白を入れるべきか否かを判断するようにしてもよい。
In the above example, one character string before and after, and two character strings before and after are included in the translation target. However, three or more character strings may be included in the translation target, and different numbers of character strings may be included before and after. You may do it.
In addition, the character string connected without inserting the blank character without including the preceding and following character strings (in the example of FIG. 5, the connection character string of the character string 518 and the character string 522), and the character connected by inserting the blank character It may be determined whether or not a blank should be inserted with a column (a connected character string in which a blank character is inserted between the character string 518 and the character string 522 in the example of FIG. 5) as a translation target.

図6は、本実施の形態が処理対象とする文字情報テーブル600のデータ構造例を示す説明図である。
受付モジュール110が文字情報テーブル600を受け付ける。文字情報テーブル600は、文書ID欄610、行数欄612を有している。文書ID欄610は、その文書を一意に識別する情報を記憶している。行数欄612は、その文書内に含まれている行の数を記憶している。行数欄612は、行数分の行ID欄620、文字数欄622の組を有している。行ID欄620は、その行を一意に識別する情報を記憶している。文字数欄622は、その行内の文字数を記憶している。文字数欄622は、文字数分の左上X座標欄630、左上Y座標欄632、右下X座標欄634、右下Y座標欄636、文字コード欄638の組を有している。左上X座標欄630は、その文字が描画されている矩形の左上のX座標を記憶している。左上Y座標欄632は、その文字が描画されている矩形の左上のY座標を記憶している。右下X座標欄634は、その文字が描画されている矩形の右下のX座標を記憶している。右下Y座標欄636は、その文字が描画されている矩形の右下のY座標を記憶している。文字コード欄638は、その文字の文字コードを記憶している。なお、空白文字であるか否かは、文字コードで判断してもよいし、文字間の距離(対象としている文字の右下Y座標と次の文字の左上X座標との差分)が予め定められた閾値以上である場合は空白文字があると判断してもよい。しかし、行末では、文字間の距離を用いた空白文字があるか否かの判断ができないので、本実施の形態による処理を行う。
なお、文字列作成モジュール120は、文字情報テーブル600から文字列を抽出し、行末に空白文字を挿入した文字列と空白文字を挿入しないで接続した文字列を作成する。
FIG. 6 is an explanatory diagram showing an example of the data structure of the character information table 600 to be processed by this embodiment.
The reception module 110 receives the character information table 600. The character information table 600 has a document ID column 610 and a line number column 612. The document ID column 610 stores information for uniquely identifying the document. The line number column 612 stores the number of lines included in the document. The line number column 612 has a set of line ID columns 620 and character number columns 622 corresponding to the number of lines. The row ID column 620 stores information that uniquely identifies the row. The character number column 622 stores the number of characters in the line. The number-of-characters column 622 includes a set of an upper left X coordinate field 630, an upper left Y coordinate field 632, a lower right X coordinate field 634, a lower right Y coordinate field 636, and a character code field 638 corresponding to the number of characters. The upper left X coordinate field 630 stores the upper left X coordinate of the rectangle in which the character is drawn. The upper left Y coordinate field 632 stores the upper left Y coordinate of the rectangle in which the character is drawn. The lower right X coordinate field 634 stores the lower right X coordinate of the rectangle in which the character is drawn. The lower right Y coordinate field 636 stores the lower right Y coordinate of the rectangle in which the character is drawn. The character code column 638 stores the character code of the character. Whether the character is a blank character may be determined by a character code, and the distance between characters (difference between the lower right Y coordinate of the target character and the upper left X coordinate of the next character) is determined in advance. If it is equal to or greater than the threshold value, it may be determined that there is a blank character. However, at the end of the line, since it cannot be determined whether there is a blank character using the distance between characters, the processing according to this embodiment is performed.
The character string creation module 120 extracts a character string from the character information table 600, and creates a character string in which a blank character is inserted at the end of a line and a connected character string without inserting a blank character.

図7は、本実施の形態(翻訳モジュール130)による処理例を示す説明図である。
この例における翻訳モジュール130は、表音文字の文字列を翻訳できなかった場合に、カタカナで発音を出すタイプである。図7(a)の例に示す翻訳結果と図7(b)の例に示す翻訳結果を出力した場合、カタカナ文字の文字数が少ない方である図7(b)の例に示す翻訳結果を採用するようにする。つまり、図7(b)の例のようになった対象文字列が、空白を挿入した文字列であれば、行末に空白を挿入すると判断され、空白を挿入しないで接続した文字列であれば、行末に空白を挿入しないと判断される。
FIG. 7 is an explanatory diagram showing a processing example according to the present exemplary embodiment (translation module 130).
The translation module 130 in this example is a type that produces pronunciation in katakana when the character string of the phonetic character cannot be translated. When the translation result shown in the example of FIG. 7 (a) and the translation result shown in the example of FIG. 7 (b) are output, the translation result shown in the example of FIG. 7 (b) having the smaller number of katakana characters is adopted. To do. That is, if the target character string as shown in the example of FIG. 7B is a character string with a blank inserted, it is determined that a blank is inserted at the end of the line, and if it is a character string connected without inserting a blank. It is determined that no blank is inserted at the end of the line.

図8は、本実施の形態(翻訳モジュール130)による処理例を示す説明図である。
この例は、翻訳モジュール130が、表音文字の文字列を翻訳できなかった場合に、その翻訳結果を出力しないタイプである。図8(a)の例に示す翻訳結果と図8(b)の例に示す翻訳結果を出力した場合、文字数が多い方である図8(b)の例に示す翻訳結果を採用するようにする。つまり、図8(b)の例のようになった対象文字列が、空白を挿入した文字列であれば、行末に空白を挿入すると判断され、空白を挿入しないで接続した文字列であれば、行末に空白を挿入しないと判断される。
FIG. 8 is an explanatory diagram showing a processing example according to the present exemplary embodiment (translation module 130).
In this example, the translation module 130 does not output the translation result when the phonetic character string cannot be translated. When the translation result shown in the example of FIG. 8A and the translation result shown in the example of FIG. 8B are output, the translation result shown in the example of FIG. 8B having the larger number of characters is adopted. To do. That is, if the target character string as shown in the example of FIG. 8B is a character string with a blank inserted, it is determined that a blank is inserted at the end of the line, and if it is a character string connected without inserting a blank. It is determined that no blank is inserted at the end of the line.

図9を参照して、本実施の形態の情報処理装置のハードウェア構成例について説明する。図9に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部917と、プリンタなどのデータ出力部918を備えたハードウェア構成例を示している。   A hardware configuration example of the information processing apparatus according to the present embodiment will be described with reference to FIG. The configuration illustrated in FIG. 9 is configured by, for example, a personal computer (PC), and illustrates a hardware configuration example including a data reading unit 917 such as a scanner and a data output unit 918 such as a printer.

CPU(Central Processing Unit)901は、前述の実施の形態において説明した各種のモジュール、すなわち、受付モジュール110、文字列作成モジュール120、翻訳モジュール130、カウントモジュール140、判断モジュール150等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。   A CPU (Central Processing Unit) 901 executes various modules described in the above-described embodiments, that is, the modules such as the reception module 110, the character string creation module 120, the translation module 130, the count module 140, and the determination module 150. It is a control part which performs the process according to the computer program which described the sequence.

ROM(Read Only Memory)902は、CPU901が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)903は、CPU901の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス904により相互に接続されている。   A ROM (Read Only Memory) 902 stores programs used by the CPU 901, operation parameters, and the like. A RAM (Random Access Memory) 903 stores programs used in the execution of the CPU 901, parameters that change as appropriate during the execution, and the like. These are connected to each other by a host bus 904 including a CPU bus.

ホストバス904は、ブリッジ905を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス906に接続されている。   The host bus 904 is connected to an external bus 906 such as a PCI (Peripheral Component Interconnect / Interface) bus via a bridge 905.

キーボード908、マウス等のポインティングデバイス909は、操作者により操作される入力デバイスである。ディスプレイ910は、液晶表示装置又はCRT(Cathode Ray Tube)などがあり、各種情報をテキストやイメージ情報として表示する。   A keyboard 908 and a pointing device 909 such as a mouse are input devices operated by an operator. The display 910 includes a liquid crystal display device or a CRT (Cathode Ray Tube), and displays various types of information as text or image information.

HDD(Hard Disk Drive)911は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU901によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、対象とする文書、翻訳結果などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。   An HDD (Hard Disk Drive) 911 includes a hard disk, drives the hard disk, and records or reproduces a program executed by the CPU 901 and information. The hard disk stores target documents, translation results, and the like. Further, various computer programs such as various other data processing programs are stored.

ドライブ912は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体913に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース907、外部バス906、ブリッジ905、及びホストバス904を介して接続されているRAM903に供給する。リムーバブル記録媒体913も、ハードディスクと同様のデータ記録領域として利用可能である。   The drive 912 reads out data or a program recorded in a removable recording medium 913 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory, and the data or program is read out from the interface 907 and the external bus 906. , To the RAM 903 connected via the bridge 905 and the host bus 904. The removable recording medium 913 can also be used as a data recording area similar to a hard disk.

接続ポート914は、外部接続機器915を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート914は、インタフェース907、及び外部バス906、ブリッジ905、ホストバス904等を介してCPU901等に接続されている。通信部916は、通信回線に接続され、外部とのデータ通信処理を実行する。データ読み取り部917は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部918は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。   The connection port 914 is a port for connecting the external connection device 915 and has a connection unit such as USB or IEEE1394. The connection port 914 is connected to the CPU 901 and the like via the interface 907, the external bus 906, the bridge 905, the host bus 904, and the like. The communication unit 916 is connected to a communication line and executes data communication processing with the outside. The data reading unit 917 is a scanner, for example, and executes document reading processing. The data output unit 918 is, for example, a printer, and executes document data output processing.

なお、図9に示す情報処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図9に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図9に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。   Note that the hardware configuration of the information processing apparatus illustrated in FIG. 9 illustrates one configuration example, and the present embodiment is not limited to the configuration illustrated in FIG. 9, and the modules described in the present embodiment are executed. Any configuration is possible. For example, some modules may be configured with dedicated hardware (for example, Application Specific Integrated Circuit (ASIC), etc.), and some modules are in an external system and connected via a communication line In addition, a plurality of systems shown in FIG. 9 may be connected to each other via communication lines so as to cooperate with each other. Further, it may be incorporated in a copying machine, a fax machine, a scanner, a printer, a multifunction machine (an image processing apparatus having any two or more functions of a scanner, a printer, a copying machine, a fax machine, etc.).

前述の実施の形態においては、左から右へと進む横書きを主な例として説明したが、上から下へ進む縦書きを対象としてもよいし、右から左へと進む横書きを対象としてもよい。また、主に韓国語を対象とした例で説明したが、行末に空白があるか否かによって意味が異なる言語であれば、韓国語以外の言語であってもよい。   In the above-described embodiment, horizontal writing that proceeds from left to right has been described as a main example. However, vertical writing that proceeds from top to bottom may be targeted, or horizontal writing that proceeds from right to left may be targeted. . Moreover, although the example mainly targeting Korean has been described, a language other than Korean may be used as long as the language has a different meaning depending on whether there is a space at the end of the line.

なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
The program described above may be provided by being stored in a recording medium, or the program may be provided by communication means. In that case, for example, the above-described program may be regarded as an invention of a “computer-readable recording medium recording the program”.
The “computer-readable recording medium on which a program is recorded” refers to a computer-readable recording medium on which a program is recorded, which is used for program installation, execution, program distribution, and the like.
The recording medium is, for example, a digital versatile disc (DVD), which is a standard established by the DVD Forum, such as “DVD-R, DVD-RW, DVD-RAM,” and DVD + RW. Standard “DVD + R, DVD + RW, etc.”, compact disc (CD), read-only memory (CD-ROM), CD recordable (CD-R), CD rewritable (CD-RW), Blu-ray disc ( Blu-ray Disc (registered trademark), magneto-optical disk (MO), flexible disk (FD), magnetic tape, hard disk, read-only memory (ROM), electrically erasable and rewritable read-only memory (EEPROM (registered trademark)) )), Flash memory, Random access memory (RAM) SD (Secure Digital) memory card and the like.
The program or a part of the program may be recorded on the recording medium for storage or distribution. Also, by communication, for example, a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), a wired network used for the Internet, an intranet, an extranet, etc., or wireless communication It may be transmitted using a transmission medium such as a network or a combination of these, or may be carried on a carrier wave.
Furthermore, the program may be a part of another program, or may be recorded on a recording medium together with a separate program. Moreover, it may be divided and recorded on a plurality of recording media. Further, it may be recorded in any manner as long as it can be restored, such as compression or encryption.

110…受付モジュール
120…文字列作成モジュール
130…翻訳モジュール
140…カウントモジュール
150…判断モジュール
110 ... Reception module 120 ... Character string creation module 130 ... Translation module 140 ... Count module 150 ... Judgment module

Claims (12)

表音文字によって表された文書内の第1の行の行末にある1以上の文字列と該第1の行に続く第2の行の先頭にある1以上の文字列を接続した第1の文字列と、該第1の行の行末にある1以上の文字列と該第2の行の先頭にある文字列の間に空白文字を挿入して接続した第2の文字列を作成する文字列作成手段と、
前記文字列作成手段によって作成された第1の文字列と第2の文字列をそれぞれ日本語に翻訳する翻訳手段と、
前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数すること、又は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数する計数手段と、
前記計数手段によって計数されたそれぞれの文字数を比較することによって、前記第1の行の行末に空白文字を挿入するか否かを判断する第1の判断手段
を具備し、
前記翻訳手段は、表音文字の文字列を翻訳できなかった場合、該文字列の表音を示すカタカナによる表記を翻訳結果とする翻訳処理を行い、
前記計数手段は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数し、
前記第1の判断手段は、前記計数手段によって計数されたカタカナ文字の文字数の少ない方が前記第1の文字列である場合は、前記第1の行の行末に空白文字を挿入しないと判断する
ことを特徴とする情報処理装置。
A first connected with one or more character strings at the end of the first line in the document represented by phonetic characters and one or more character strings at the beginning of the second line following the first line A character that creates a second character string in which a blank character is inserted between a character string and one or more character strings at the end of the first line and the character string at the beginning of the second line Column creation means;
Translation means for translating the first character string and the second character string created by the character string creating means into Japanese, respectively;
Counting the number of katakana characters in the translation result of the first character string and the second character string by the translation unit, respectively, or the translation result of the first character string and the second character string by the translation unit Counting means for counting the number of characters, respectively,
A first determination means for determining whether or not to insert a blank character at the end of the first line by comparing the number of characters counted by the counting means ;
When the translation means cannot translate the phonetic character string, the translation means performs a translation process using the katakana notation indicating the phonetic character as a translation result,
The counting means counts the number of katakana characters in the translation result of the first character string and the second character string by the translation means,
The first determining means determines that no blank character is inserted at the end of the first line when the smaller number of katakana characters counted by the counting means is the first character string. An information processing apparatus characterized by that.
前記第1の判断手段は、前記計数手段によって計数されたカタカナ文字の文字数の少ない方が前記第2の文字列である場合は、前記第1の行の行末に空白文字を挿入すると判断する
ことを特徴とする請求項に記載の情報処理装置。
The first determining means determines that a blank character is inserted at the end of the first line when the smaller number of katakana characters counted by the counting means is the second character string. The information processing apparatus according to claim 1 .
表音文字によって表された文書内の第1の行の行末にある1以上の文字列と該第1の行に続く第2の行の先頭にある1以上の文字列を接続した第1の文字列と、該第1の行の行末にある1以上の文字列と該第2の行の先頭にある文字列の間に空白文字を挿入して接続した第2の文字列を作成する文字列作成手段と、
前記文字列作成手段によって作成された第1の文字列と第2の文字列をそれぞれ日本語に翻訳する翻訳手段と、
前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数すること、又は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数する計数手段と、
前記計数手段によって計数されたそれぞれの文字数を比較することによって、前記第1の行の行末に空白文字を挿入するか否かを判断する第1の判断手段
を具備し、
前記翻訳手段は、表音文字の文字列を翻訳できなかった場合、翻訳結果を出力しない翻訳処理を行い、
前記計数手段は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数し、
前記第1の判断手段は、前記計数手段によって計数された文字数の多い方が前記第1の文字列である場合は、前記第1の行の行末に空白文字を挿入しないと判断する
ことを特徴とする情報処理装置。
A first connected with one or more character strings at the end of the first line in the document represented by phonetic characters and one or more character strings at the beginning of the second line following the first line A character that creates a second character string in which a blank character is inserted between a character string and one or more character strings at the end of the first line and the character string at the beginning of the second line Column creation means;
Translation means for translating the first character string and the second character string created by the character string creating means into Japanese, respectively;
Counting the number of katakana characters in the translation result of the first character string and the second character string by the translation unit, respectively, or the translation result of the first character string and the second character string by the translation unit Counting means for counting the number of characters, respectively,
A first determination means for determining whether or not to insert a blank character at the end of the first line by comparing the number of characters counted by the counting means ;
The translation means performs a translation process that does not output the translation result when the character string of the phonetic character cannot be translated,
The counting means, the number of characters is a translation result of the first character string and second character string by said translation means counting respectively,
The first determining means determines that a blank character is not inserted at the end of the first line when the larger number of characters counted by the counting means is the first character string. Information processing apparatus.
前記第1の判断手段は、前記計数手段によって計数された文字数の多い方が前記第2の文字列である場合は、前記第1の行の行末に空白文字を挿入すると判断する
ことを特徴とする請求項に記載の情報処理装置。
The first determining means determines that a blank character is inserted at the end of the first line when the larger number of characters counted by the counting means is the second character string. The information processing apparatus according to claim 3 .
韓国語の表音文字によって表された文書内の第1の行の行末にある1以上の文字列と該第1の行に続く第2の行の先頭にある1以上の文字列を接続した第1の文字列と、該第1の行の行末にある1以上の文字列と該第2の行の先頭にある文字列の間に空白文字を挿入して接続した第2の文字列を作成する文字列作成手段と、
前記文字列作成手段によって作成された第1の文字列と第2の文字列をそれぞれ日本語に翻訳する翻訳手段と、
前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数すること、又は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数する計数手段と、
前記計数手段によって計数されたそれぞれの文字数を比較することによって、前記第1の行の行末に空白文字を挿入するか否かを判断する第1の判断手段
を具備し、
前記翻訳手段は、表音文字の文字列を翻訳できなかった場合、該文字列の翻訳結果を出力しない翻訳処理を行い、
前記計数手段は前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数し、
前記第1の判断手段は、前記計数手段によって計数された文字数の多い方が前記第1の文字列である場合は、前記第1の行の行末に空白文字を挿入しないと判断する
ことを特徴とする情報処理装置。
One or more character strings at the end of the first line in a document represented by Korean phonetic characters are connected to one or more character strings at the beginning of the second line following the first line. A second character string connected by inserting a blank character between a first character string, one or more character strings at the end of the first line, and a character string at the beginning of the second line; A character string creation means to create;
Translation means for translating the first character string and the second character string created by the character string creating means into Japanese, respectively;
Counting the number of katakana characters in the translation result of the first character string and the second character string by the translation unit, respectively, or the translation result of the first character string and the second character string by the translation unit Counting means for counting the number of characters, respectively,
A first determination means for determining whether or not to insert a blank character at the end of the first line by comparing the number of characters counted by the counting means ;
When the translation unit cannot translate the phonetic character string, it performs a translation process that does not output the translation result of the character string,
The counting means, the number of characters is a translation result of the first character string and second character string by said translation means counting respectively,
The first determining means determines that a blank character is not inserted at the end of the first line when the larger number of characters counted by the counting means is the first character string. Information processing apparatus.
前記第1の判断手段は、前記計数手段によって計数された文字数の多い方が前記第2の文字列である場合は、前記第1の行の行末に空白文字を挿入すると判断する
ことを特徴とする請求項に記載の情報処理装置。
The first determining means determines that a blank character is inserted at the end of the first line when the larger number of characters counted by the counting means is the second character string. The information processing apparatus according to claim 5 .
韓国語の表音文字によって表された文書内の第1の行の行末にある1以上の文字列と該第1の行に続く第2の行の先頭にある1以上の文字列を接続した第1の文字列と、該第1の行の行末にある1以上の文字列と該第2の行の先頭にある文字列の間に空白文字を挿入して接続した第2の文字列を作成する文字列作成手段と、
前記文字列作成手段によって作成された第1の文字列と第2の文字列をそれぞれ日本語に翻訳する翻訳手段と、
前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数すること、又は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数する計数手段と、
前記計数手段によって計数されたそれぞれの文字数を比較することによって、前記第1の行の行末に空白文字を挿入するか否かを判断する第1の判断手段
を具備し、
前記翻訳手段は、表音文字の文字列を翻訳できなかった場合、該文字列の表音を示すカタカナによる表記を翻訳結果とする翻訳処理を行い、
前記計数手段は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数し、
前記第1の判断手段は、前記計数手段によって計数されたカタカナ文字の文字数の少ない方が前記第1の文字列である場合は、前記第1の行の行末に空白文字を挿入しないと判断する
ことを特徴とする情報処理装置。
One or more character strings at the end of the first line in a document represented by Korean phonetic characters are connected to one or more character strings at the beginning of the second line following the first line. A second character string connected by inserting a blank character between a first character string, one or more character strings at the end of the first line, and a character string at the beginning of the second line; A character string creation means to create;
Translation means for translating the first character string and the second character string created by the character string creating means into Japanese, respectively;
Counting the number of katakana characters in the translation result of the first character string and the second character string by the translation unit, respectively, or the translation result of the first character string and the second character string by the translation unit Counting means for counting the number of characters, respectively,
A first determination means for determining whether or not to insert a blank character at the end of the first line by comparing the number of characters counted by the counting means ;
When the translation means cannot translate the phonetic character string, the translation means performs a translation process using the katakana notation indicating the phonetic character as a translation result,
The counting means, the number of katakana characters in the translation means first string and second character string translation result by counting respectively,
The first determining means determines that no blank character is inserted at the end of the first line when the smaller number of katakana characters counted by the counting means is the first character string. An information processing apparatus characterized by that.
前記第1の判断手段は、前記計数手段によって計数されたカタカナ文字の文字数の少ない方が前記第2の文字列である場合は、前記第1の行の行末に空白文字を挿入すると判断する
ことを特徴とする請求項記載の情報処理装置。
The first determining means determines that a blank character is inserted at the end of the first line when the smaller number of katakana characters counted by the counting means is the second character string. The information processing apparatus according to claim 7 .
コンピュータを、
表音文字によって表された文書内の第1の行の行末にある1以上の文字列と該第1の行に続く第2の行の先頭にある1以上の文字列を接続した第1の文字列と、該第1の行の行末にある1以上の文字列と該第2の行の先頭にある文字列の間に空白文字を挿入して接続した第2の文字列を作成する文字列作成手段と、
前記文字列作成手段によって作成された第1の文字列と第2の文字列をそれぞれ日本語に翻訳する翻訳手段と、
前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数すること、又は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数する計数手段と、
前記計数手段によって計数されたそれぞれの文字数を比較することによって、前記第1の行の行末に空白文字を挿入するか否かを判断する第1の判断手段
として機能させ
前記翻訳手段は、表音文字の文字列を翻訳できなかった場合、該文字列の表音を示すカタカナによる表記を翻訳結果とする翻訳処理を行い、
前記計数手段は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数し、
前記第1の判断手段は、前記計数手段によって計数されたカタカナ文字の文字数の少ない方が前記第1の文字列である場合は、前記第1の行の行末に空白文字を挿入しないと判断する
ことを特徴とする情報処理プログラム。
Computer
A first connected with one or more character strings at the end of the first line in the document represented by phonetic characters and one or more character strings at the beginning of the second line following the first line A character that creates a second character string in which a blank character is inserted between a character string and one or more character strings at the end of the first line and the character string at the beginning of the second line Column creation means;
Translation means for translating the first character string and the second character string created by the character string creating means into Japanese, respectively;
Counting the number of katakana characters in the translation result of the first character string and the second character string by the translation unit, respectively, or the translation result of the first character string and the second character string by the translation unit Counting means for counting the number of characters, respectively,
By comparing the number of characters counted by the counting means to function as a first judging means for judging whether to insert a blank character at the end of the first line ;
When the translation means cannot translate the phonetic character string, the translation means performs a translation process using the katakana notation indicating the phonetic character as a translation result,
The counting means counts the number of katakana characters in the translation result of the first character string and the second character string by the translation means,
The first determining means determines that no blank character is inserted at the end of the first line when the smaller number of katakana characters counted by the counting means is the first character string.
An information processing program characterized by that .
コンピュータを、
表音文字によって表された文書内の第1の行の行末にある1以上の文字列と該第1の行に続く第2の行の先頭にある1以上の文字列を接続した第1の文字列と、該第1の行の行末にある1以上の文字列と該第2の行の先頭にある文字列の間に空白文字を挿入して接続した第2の文字列を作成する文字列作成手段と、
前記文字列作成手段によって作成された第1の文字列と第2の文字列をそれぞれ日本語に翻訳する翻訳手段と、
前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数すること、又は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数する計数手段と、
前記計数手段によって計数されたそれぞれの文字数を比較することによって、前記第1の行の行末に空白文字を挿入するか否かを判断する第1の判断手段
として機能させ
前記翻訳手段は、表音文字の文字列を翻訳できなかった場合、翻訳結果を出力しない翻訳処理を行い、
前記計数手段は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数し、
前記第1の判断手段は、前記計数手段によって計数された文字数の多い方が前記第1の文字列である場合は、前記第1の行の行末に空白文字を挿入しないと判断する
ことを特徴とする情報処理プログラム。
Computer
A first connected with one or more character strings at the end of the first line in the document represented by phonetic characters and one or more character strings at the beginning of the second line following the first line A character that creates a second character string in which a blank character is inserted between a character string and one or more character strings at the end of the first line and the character string at the beginning of the second line Column creation means;
Translation means for translating the first character string and the second character string created by the character string creating means into Japanese, respectively;
Counting the number of katakana characters in the translation result of the first character string and the second character string by the translation unit, respectively, or the translation result of the first character string and the second character string by the translation unit Counting means for counting the number of characters, respectively,
By comparing the number of characters counted by the counting means to function as a first judging means for judging whether to insert a blank character at the end of the first line ;
The translation means performs a translation process that does not output the translation result when the character string of the phonetic character cannot be translated,
The counting means, the number of characters is a translation result of the first character string and second character string by said translation means counting respectively,
The first determining means determines that a blank character is not inserted at the end of the first line when the number of characters counted by the counting means is the first character string.
An information processing program characterized by that .
コンピュータを、
韓国語の表音文字によって表された文書内の第1の行の行末にある1以上の文字列と該第1の行に続く第2の行の先頭にある1以上の文字列を接続した第1の文字列と、該第1の行の行末にある1以上の文字列と該第2の行の先頭にある文字列の間に空白文字を挿入して接続した第2の文字列を作成する文字列作成手段と、
前記文字列作成手段によって作成された第1の文字列と第2の文字列をそれぞれ日本語に翻訳する翻訳手段と、
前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数すること、又は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数する計数手段と、
前記計数手段によって計数されたそれぞれの文字数を比較することによって、前記第1の行の行末に空白文字を挿入するか否かを判断する第1の判断手段
として機能させ
前記翻訳手段は、表音文字の文字列を翻訳できなかった場合、該文字列の翻訳結果を出力しない翻訳処理を行い、
前記計数手段は前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数し、
前記第1の判断手段は、前記計数手段によって計数された文字数の多い方が前記第1の文字列である場合は、前記第1の行の行末に空白文字を挿入しないと判断する
ことを特徴とする情報処理プログラム。
Computer
One or more character strings at the end of the first line in a document represented by Korean phonetic characters are connected to one or more character strings at the beginning of the second line following the first line. A second character string connected by inserting a blank character between a first character string, one or more character strings at the end of the first line, and a character string at the beginning of the second line; A character string creation means to create;
Translation means for translating the first character string and the second character string created by the character string creating means into Japanese, respectively;
Counting the number of katakana characters in the translation result of the first character string and the second character string by the translation unit, respectively, or the translation result of the first character string and the second character string by the translation unit Counting means for counting the number of characters, respectively,
By comparing the number of characters counted by the counting means to function as a first judging means for judging whether to insert a blank character at the end of the first line ;
When the translation unit cannot translate the phonetic character string, it performs a translation process that does not output the translation result of the character string,
The counting means, the number of characters is a translation result of the first character string and second character string by said translation means counting respectively,
The first determining means determines that a blank character is not inserted at the end of the first line when the number of characters counted by the counting means is the first character string.
An information processing program characterized by that .
コンピュータを、
韓国語の表音文字によって表された文書内の第1の行の行末にある1以上の文字列と該第1の行に続く第2の行の先頭にある1以上の文字列を接続した第1の文字列と、該第1の行の行末にある1以上の文字列と該第2の行の先頭にある文字列の間に空白文字を挿入して接続した第2の文字列を作成する文字列作成手段と、
前記文字列作成手段によって作成された第1の文字列と第2の文字列をそれぞれ日本語に翻訳する翻訳手段と、
前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数すること、又は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果である文字数をそれぞれ計数する計数手段と、
前記計数手段によって計数されたそれぞれの文字数を比較することによって、前記第1の行の行末に空白文字を挿入するか否かを判断する第1の判断手段
として機能させ
前記翻訳手段は、表音文字の文字列を翻訳できなかった場合、該文字列の表音を示すカタカナによる表記を翻訳結果とする翻訳処理を行い、
前記計数手段は、前記翻訳手段による第1の文字列と第2の文字列の翻訳結果内のカタカナ文字の文字数をそれぞれ計数し、
前記第1の判断手段は、前記計数手段によって計数されたカタカナ文字の文字数の少ない方が前記第1の文字列である場合は、前記第1の行の行末に空白文字を挿入しないと判断する
ことを特徴とする情報処理プログラム。
Computer
One or more character strings at the end of the first line in a document represented by Korean phonetic characters are connected to one or more character strings at the beginning of the second line following the first line. A second character string connected by inserting a blank character between a first character string, one or more character strings at the end of the first line, and a character string at the beginning of the second line; A character string creation means to create;
Translation means for translating the first character string and the second character string created by the character string creating means into Japanese, respectively;
Counting the number of katakana characters in the translation result of the first character string and the second character string by the translation unit, respectively, or the translation result of the first character string and the second character string by the translation unit Counting means for counting the number of characters, respectively,
By comparing the number of characters counted by the counting means to function as a first judging means for judging whether to insert a blank character at the end of the first line ;
When the translation means cannot translate the phonetic character string, the translation means performs a translation process using the katakana notation indicating the phonetic character as a translation result,
The counting means, the number of katakana characters in the translation means first string and second character string translation result by counting respectively,
The first determining means determines that no blank character is inserted at the end of the first line when the smaller number of katakana characters counted by the counting means is the first character string.
An information processing program characterized by that .
JP2012128122A 2012-06-05 2012-06-05 Information processing apparatus and information processing program Expired - Fee Related JP5928714B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012128122A JP5928714B2 (en) 2012-06-05 2012-06-05 Information processing apparatus and information processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012128122A JP5928714B2 (en) 2012-06-05 2012-06-05 Information processing apparatus and information processing program

Publications (2)

Publication Number Publication Date
JP2013254258A JP2013254258A (en) 2013-12-19
JP5928714B2 true JP5928714B2 (en) 2016-06-01

Family

ID=49951732

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012128122A Expired - Fee Related JP5928714B2 (en) 2012-06-05 2012-06-05 Information processing apparatus and information processing program

Country Status (1)

Country Link
JP (1) JP5928714B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6497138B2 (en) * 2015-03-11 2019-04-10 コニカミノルタ株式会社 Document reading apparatus, display control method, and display control program

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0528179A (en) * 1991-07-19 1993-02-05 Matsushita Electric Ind Co Ltd Machine translation device
JPH1027176A (en) * 1996-07-12 1998-01-27 Toshiba Corp Device and method for machine translation
JPH11110386A (en) * 1997-09-30 1999-04-23 Toshiba Corp Information processor having sentence segmenting function and sentence segmenting method

Also Published As

Publication number Publication date
JP2013254258A (en) 2013-12-19

Similar Documents

Publication Publication Date Title
JP4623169B2 (en) Image processing apparatus and image processing program
JP6119952B2 (en) Image processing apparatus and image processing program
JP4626777B2 (en) Information processing apparatus and information processing program
JP6221220B2 (en) Image processing apparatus and image processing program
JP2009251872A (en) Information processing device and information processing program
JP5928714B2 (en) Information processing apparatus and information processing program
JP4780184B2 (en) Image processing apparatus and image processing program
JP5481965B2 (en) Information processing apparatus and information processing program
JP5949248B2 (en) Information processing apparatus and information processing program
JP6201838B2 (en) Information processing apparatus and information processing program
JP6131765B2 (en) Information processing apparatus and information processing program
JP6421568B2 (en) Information processing apparatus and information processing program
JP6187307B2 (en) Image processing apparatus and image processing program
JP6003375B2 (en) Image processing apparatus and image processing program
JP5062076B2 (en) Information processing apparatus and information processing program
JP6281309B2 (en) Image processing apparatus and image processing program
JP4793429B2 (en) Image processing apparatus and image processing program
JP2010039810A (en) Image processor and image processing program
JP2017102526A (en) Information processing device and information processing program
JP6409423B2 (en) Image processing apparatus and image processing program
JP6003677B2 (en) Image processing apparatus and image processing program
JP2010049336A (en) Image processor and image processing program
JP6554804B2 (en) Information processing apparatus and information processing program
JP4973536B2 (en) Image processing apparatus and image processing program
JP2013149014A (en) Information processor and information processing program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150306

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160126

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160308

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160330

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160412

R150 Certificate of patent or registration of utility model

Ref document number: 5928714

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees