JP2014099106A - Information processor, information processing method, and program - Google Patents

Information processor, information processing method, and program Download PDF

Info

Publication number
JP2014099106A
JP2014099106A JP2012251485A JP2012251485A JP2014099106A JP 2014099106 A JP2014099106 A JP 2014099106A JP 2012251485 A JP2012251485 A JP 2012251485A JP 2012251485 A JP2012251485 A JP 2012251485A JP 2014099106 A JP2014099106 A JP 2014099106A
Authority
JP
Japan
Prior art keywords
character string
noun
information processing
classification
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012251485A
Other languages
Japanese (ja)
Other versions
JP6097529B2 (en
Inventor
Qing He
青 何
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zenrin Datacom Co Ltd
Original Assignee
Zenrin Datacom Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zenrin Datacom Co Ltd filed Critical Zenrin Datacom Co Ltd
Priority to JP2012251485A priority Critical patent/JP6097529B2/en
Publication of JP2014099106A publication Critical patent/JP2014099106A/en
Application granted granted Critical
Publication of JP6097529B2 publication Critical patent/JP6097529B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Machine Translation (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an information processor capable of suitably translating text even when a character string having a plurality of meanings is included in the text, an information processing method, and a program.SOLUTION: The information processor includes an input part 101 for receiving inputs of Japanese text and a classification showing a use area in which the Japanese text is used, a special notation discrimination part 103 for discriminating whether to translate the character string included in the Japanese text as a general noun or a proper noun on the basis of the classification, and a general noun translation part 109 and a proper noun translation part 107 for translating the character string on the basis of the meaning of the character string in the case of the general noun and on the basis of vocal sound of the character string in the case of the proper name.

Description

本発明に係るいくつかの態様は、情報処理装置、情報処理方法、及びプログラムに関する。   Some embodiments according to the present invention relate to an information processing apparatus, an information processing method, and a program.

近年、機械翻訳を行う装置が徐々に広まりつつある。ここで、機械翻訳においては、固有名詞か否かを判別することが重要であることが知られている。例えば特許文献1は、固有名詞に関する辞書を予め用意すること無く、固有名詞を翻訳可能な機械翻訳の方法を開示している。   In recent years, apparatuses for machine translation are gradually spreading. Here, it is known that in machine translation, it is important to determine whether or not a proper noun is used. For example, Patent Document 1 discloses a machine translation method capable of translating proper nouns without preparing a dictionary for proper nouns in advance.

特再表2005/091166号公報Japanese National Patent Publication No. 2005/091166

しかしながら、実際には、固有名詞であるか否かを判別することは難しい場合も多い。例えば、「線」という漢字を英語に翻訳することを考えると、「高速道路3号線」であれば、意味を考慮して「線」を「Line」と翻訳すべきであるが、「新幹線」であれば、音韻を元に「Shinkansen」と翻訳すべきである。このような、意味に応じて異なる訳し方をすべき文字列に対してどのように対処すべきかという点を、特許文献1では何ら考慮していない。   However, in practice, it is often difficult to determine whether or not the name is a proper noun. For example, considering the translation of the Chinese character “line” into English, if it is “highway 3”, the “line” should be translated as “Line” in consideration of the meaning, but “shinkansen” If so, it should be translated as “Shinkansen” based on the phoneme. Patent Document 1 does not consider how to deal with such a character string that should be translated differently depending on the meaning.

本発明のいくつかの態様は前述の課題に鑑みてなされたものであり、テキスト中に複数の意味を有する文字列を含む場合であっても、好適に翻訳することのできる情報処理装置、情報処理方法、及びプログラムを提供することを目的の1つとする。   Some aspects of the present invention have been made in view of the above-described problems. An information processing apparatus and information that can be suitably translated even when a text includes a character string having a plurality of meanings. It is an object to provide a processing method and a program.

本発明に係る情報処理装置は、は、日本語テキストと、当該日本語テキストが使用される使用領域を示す分類との入力を受ける入力手段と、前記日本語テキストに含まれる文字列に対して、一般名詞として翻訳すべきか固有名詞として翻訳すべきかを、前記分類に基づいて判別する判別手段と、一般名詞の場合は当該文字列の意味に基づいて、固有名詞の場合には当該文字列の音韻に基づいて文字列を翻訳する翻訳手段とを備える。   An information processing apparatus according to the present invention includes: an input unit that receives input of Japanese text and a classification indicating a use region in which the Japanese text is used; and a character string included in the Japanese text. A discriminating means for discriminating whether to translate as a general noun or as a proper noun based on the classification, based on the meaning of the character string in the case of a general noun, and in the case of a proper noun Translating means for translating a character string based on phonemes.

本発明に係る情報処理方法は、日本語テキストと、当該日本語テキストが使用される使用領域を示す分類との入力を受けるステップと、前記日本語テキストに含まれる文字列に対して、一般名詞として翻訳すべきか固有名詞として翻訳すべきかを、前記分類に基づいて判別するステップと、一般名詞の場合は当該文字列の意味に基づいて、固有名詞の場合には当該文字列の音韻に基づいて文字列を翻訳するステップとを情報処理装置が行う。   An information processing method according to the present invention includes a step of receiving input of Japanese text and a classification indicating a use area where the Japanese text is used, and a general noun for a character string included in the Japanese text. Determining whether to translate as a proper noun or as a proper noun based on the classification, based on the meaning of the character string in the case of a general noun, and on the phoneme of the character string in the case of a proper noun The information processing apparatus performs the step of translating the character string.

本発明に係るプログラムは、日本語テキストと、当該日本語テキストが使用される使用領域を示す分類との入力を受けるステップと、前記日本語テキストに含まれる文字列に対して、一般名詞として翻訳すべきか固有名詞として翻訳すべきかを、前記分類に基づいて判別するステップと、一般名詞の場合は当該文字列の意味に基づいて、固有名詞の場合には当該文字列の音韻に基づいて文字列を翻訳するステップとをコンピュータに実行させるためのプログラムである。   A program according to the present invention includes a step of receiving input of Japanese text and a classification indicating a use area in which the Japanese text is used, and translation as a general noun for a character string included in the Japanese text Determining whether to translate as a proper noun based on the classification, and in the case of a general noun based on the meaning of the character string, and in the case of a proper noun, based on the phoneme of the character string Is a program for causing a computer to execute the step of translating.

尚、本発明において、「部」や「手段」、「装置」、「システム」とは、単に物理的手段を意味するものではなく、その「部」や「手段」、「装置」、「システム」が有する機能をソフトウェアによって実現する場合も含む。また、1つの「部」や「手段」、「装置」、「システム」が有する機能が2つ以上の物理的手段や装置により実現されても、2つ以上の「部」や「手段」、「装置」、「システム」の機能が1つの物理的手段や装置により実現されても良い。   In the present invention, “part”, “means”, “apparatus”, and “system” do not simply mean physical means, but “part”, “means”, “apparatus”, “system”. This includes the case where the functions possessed by "are realized by software. Further, even if the functions of one “unit”, “means”, “apparatus”, and “system” are realized by two or more physical means or devices, two or more “parts” or “means”, The functions of “device” and “system” may be realized by a single physical means or device.

本発明によれば、テキスト中に複数の意味を有する文字列を含む場合であっても、好適に翻訳することのできる情報処理装置、情報処理方法、及びプログラムを提供することができる。   According to the present invention, it is possible to provide an information processing apparatus, an information processing method, and a program that can be suitably translated even when a text includes character strings having a plurality of meanings.

ベクトル地図を説明するための図である。It is a figure for demonstrating a vector map. 実施形態における情報処理装置の処理の具体例を説明するための図である。It is a figure for demonstrating the specific example of the process of the information processing apparatus in embodiment. 実施形態に係る情報処理装置の構成を示す図である。It is a figure which shows the structure of the information processing apparatus which concerns on embodiment. 図3に示す特殊表記文字列データベースの具体例を示す図である。It is a figure which shows the specific example of the special description character string database shown in FIG. 図3に示す情報処理装置の処理の流れを説明するためのフローチャートである。4 is a flowchart for explaining a flow of processing of the information processing apparatus illustrated in FIG. 3. 図3に示す情報処理装置を実装可能なハードウェアの構成を示すブロック図である。It is a block diagram which shows the structure of the hardware which can mount the information processing apparatus shown in FIG.

以下に本発明の実施形態を説明する。以下の説明及び参照する図面の記載において、同一又は類似の構成には、それぞれ同一又は類似の符号が付されている。   Embodiments of the present invention will be described below. In the following description and the description of the drawings to be referred to, the same or similar components are denoted by the same or similar reference numerals.

(実施形態)
図1乃至図6は、実施形態を説明するための図である。以下、これらの図を参照しながら、以下の流れに沿って実施形態を説明する。まず「1」で実施形態に係る情報処理装置が行う処理の概要を説明する。その上で、「2」で情報処理装置のシステム構成を、「3」で処理の流れを説明する。「4」は、システムを実装可能なハードウェア構成の具体例を示す。最後に、「5」以降で、本実施形態に係る効果などを説明する。
(Embodiment)
1 to 6 are diagrams for explaining the embodiment. Hereinafter, embodiments will be described along the following flow with reference to these drawings. First, an outline of processing performed by the information processing apparatus according to the embodiment is described as “1”. Then, “2” describes the system configuration of the information processing apparatus, and “3” describes the processing flow. “4” indicates a specific example of a hardware configuration capable of mounting the system. Finally, the effects and the like according to the present embodiment will be described after “5”.

(1 概要)
(1.1 ベクトル地図)
本実施形態に係る情報処理装置は、日本語テキストの入力を受け、当該日本語テキストを他の言語の表記に変換(翻訳)する装置である。ここで、情報処理装置が処理対象とする日本語テキストとしては種々考えることができるが、以下では、地図、特にベクトル地図に関するテキストであるものとして説明する。
(1 Overview)
(1.1 Vector map)
The information processing apparatus according to the present embodiment is an apparatus that receives input of Japanese text and converts (translates) the Japanese text into a notation of another language. Here, various Japanese texts to be processed by the information processing apparatus can be considered, but in the following, description will be made assuming that the text is related to a map, particularly a vector map.

ここで、ベクトル地図は、近年、例えばインターネットを介して地図を電子的に提供する地図提供サービスで近年広く利用されている技術である。このようなサービスで提供される地図情報には、地名(例えば、道路名、山、川、海、市町村、地区などの名称も含む)や施設名(店舗名、公演名、駅名等を含む)を示す注記や住所、電話番号等のテキスト情報が含まれることが多い。更に、近年のグローバル化の伸展に伴い、地図を提示する際に、このようなテキスト情報を多言語表示に対応させるニーズが高まっているため、本実施形態に係る情報処理装置は、このようなニーズに応えるために、テキスト情報を翻訳する機能を有する。   Here, the vector map is a technology that has been widely used in recent years in a map providing service that provides a map electronically, for example, via the Internet. Map information provided by such services includes place names (including names of roads, mountains, rivers, seas, municipalities, districts, etc.) and facility names (including store names, performance names, station names, etc.) In many cases, text information such as a note, an address, a telephone number, and the like is included. Furthermore, with the recent expansion of globalization, when presenting a map, there is an increasing need for such text information to be compatible with multilingual display. Therefore, the information processing apparatus according to the present embodiment is It has a function to translate text information to meet the needs.

なお、以下の例では、日本語テキスト情報を英語に翻訳する場合を例に説明するが、翻訳対象の言語は英語に限られるものではなく、中国語や韓国語等のその他の言語へ翻訳するようにしても良い。   In the following example, Japanese text information is translated into English as an example. However, the translation target language is not limited to English, and it is translated into other languages such as Chinese and Korean. You may do it.

まず、図1を参照しながら、ベクトル地図情報に関して簡単に説明する。図1は、ベクトル地図の構成の具体例を説明するための図である。ベクトル地図情報は、複数のレイヤに関する情報を有しており、ベクトル地図情報に基づいて地図を表示する際には、各レイヤの座標を合わせた上で、各レイヤの画像を重ねることにより1枚の地図情報を作成することになる。例えば図1の例は、道路注記レイヤL1a、道路画像レイヤL1b、施設注記レイヤL2a、施設画像レイヤL2bを含む多数のレイヤが重なって1枚の地図画像を生成することを示している。   First, the vector map information will be briefly described with reference to FIG. FIG. 1 is a diagram for explaining a specific example of the configuration of a vector map. The vector map information has information about a plurality of layers. When displaying a map based on the vector map information, the coordinates of the layers are combined and one image is superimposed on each other. Map information will be created. For example, the example of FIG. 1 shows that a number of layers including a road note layer L1a, a road image layer L1b, a facility note layer L2a, and a facility image layer L2b are overlapped to generate one map image.

図1の例では、道路注記レイヤL1aと道路画像レイヤL1bとで道路に係る地図を、施設注記レイヤL2aと施設画像レイヤL2bとで施設に係る地図を構成するようになっている。このうち、道路画像レイヤL1b及び施設画像レイヤL2b(以下、総称して画像レイヤLbとも呼ぶ。)は、道路や施設の位置や形状等を画像として表示するためのレイヤである。   In the example of FIG. 1, a road map is constituted by the road note layer L1a and the road image layer L1b, and a map related to the facility is constituted by the facility note layer L2a and the facility image layer L2b. Among these, the road image layer L1b and the facility image layer L2b (hereinafter also collectively referred to as an image layer Lb) are layers for displaying the positions and shapes of roads and facilities as images.

道路注記レイヤL1a及び施設注記レイヤL2a(以下、総称して注記レイヤLaとも呼ぶ。)は、注記に関するテキスト情報を表示するためのものである。図1の例では、道路注記レイヤL1a上には、道路に係る注記を示すテキスト情報「高速3号線」が、施設注記レイヤL2a上には、施設に係る注記を示すテキスト情報「呉服町郵便局」が、それぞれ配置されている。このように、注記レイヤLaを構成するための情報には、それぞれの注記を示すテキスト情報と、その注記が配置される領域の座標及びその大きさに関する情報が含まれる。更に、道路に関する注記は道路注記レイヤL1aに、施設に関する注記は施設注記レイヤL2aにそれぞれ含まれるため、それぞれの注記に係るテキスト情報が、どのレイヤに属するものであるかを調べれば、その注記が道路に関するものなのか、施設に関するものなのか、といったテキスト情報の使用領域(分類)を知ることが可能となる。
この他、ベクトル地図情報には、地図上に直接的に記載される情報の他、住所や電話番号といった各種情報を含めることも可能である。
The road note layer L1a and the facility note layer L2a (hereinafter collectively referred to as the note layer La) are for displaying text information related to the note. In the example of FIG. 1, text information “High Speed Line 3” indicating a road related note is displayed on the road note layer L1a, and text information “Kuregicho Post Office” indicating a facility related note is displayed on the facility note layer L2a. Are arranged respectively. As described above, the information for configuring the annotation layer La includes text information indicating each annotation, and information on the coordinates and size of an area where the annotation is arranged. Furthermore, road notes are included in the road note layer L1a and facilities notes are included in the facility note layer L2a. Therefore, if the text information related to each note belongs to which layer, the notes are It is possible to know the use area (classification) of text information such as whether it is related to a road or a facility.
In addition, the vector map information may include various information such as an address and a telephone number in addition to information directly described on the map.

(1.2 翻訳の具体例)
本実施形態に係る情報処理装置は、前述のとおりベクトル地図情報に含まれる各種テキスト情報を翻訳する機能を有し、その翻訳の際に、テキスト情報が使用される領域(分類)に応じて、好適に翻訳を行う。以下、この手法を図2を参照しながら説明する。図2は、本実施形態に係る情報処理装置が行う翻訳手法の概要を説明するための図である。
図2(a)は、文字列「線」が含まれるテキスト情報である「新幹線」「高速3号線」「新潟新幹線」の翻訳方法を示す図である。
(1.2 Specific examples of translation)
The information processing apparatus according to the present embodiment has a function of translating various text information included in the vector map information as described above, and according to the region (classification) in which the text information is used during the translation, Translation is preferably performed. Hereinafter, this method will be described with reference to FIG. FIG. 2 is a diagram for explaining an outline of the translation technique performed by the information processing apparatus according to the present embodiment.
FIG. 2A is a diagram illustrating a translation method of “Shinkansen”, “High Speed Line 3”, and “Niigata Shinkansen”, which are text information including the character string “line”.

ここで、「新宿線」「高速3号線」「新潟新幹線」は、それぞれ「路線」「道路」「高速鉄道」のレイヤに含まれているものとする。すなわち、テキスト情報「新宿線」「高速3号線」「新潟新幹線」の分類は、それぞれ「路線」「道路」「高速鉄道」となる。   Here, it is assumed that “Shinjuku Line”, “High Speed Line 3”, and “Niigata Shinkansen” are included in the layers of “Route”, “Road”, and “High Speed Rail”, respectively. That is, the classifications of the text information “Shinjuku Line”, “High Speed Line 3”, and “Niigata Shinkansen” are “Route”, “Road”, and “High Speed Railway”, respectively.

このとき、「新宿線」の「線」は鉄道路線であることを、「高速3号線」の「線」は道路の路線を示すものであるため、一般名詞として、意味に基づいて翻訳すべきである。そこで図2(a)の例では、「線」が分類「路線」又は「道路」に使用されている場合には、「Line」として翻訳されている。   At this time, the “Line” of “Shinjuku Line” is a railway line, and the “Line” of “High Speed Line 3” indicates the route of the road. It is. Therefore, in the example of FIG. 2A, when “line” is used for the classification “route” or “road”, it is translated as “Line”.

一方、「新潟新幹線」の場合には、路線や道路ではなく、固有名詞として使用されているため、音韻に基づいて翻訳する方が好ましい。そこで図2(a)の例では、分類「路線」又は「道路」以外の分類に紐付けられた「新潟新幹線」に関しては、「NiigataShinkansen」として、音韻に基づいて翻訳されている。   On the other hand, in the case of “Niigata Shinkansen”, since it is used as a proper noun rather than a route or road, it is preferable to translate based on phoneme. Therefore, in the example of FIG. 2A, “Niigata Shinkansen” linked to a classification other than the classification “route” or “road” is translated as “NiigaShinkansen” based on phoneme.

同様に図2(b)は、文字列「呉服」が含まれるテキスト情報である「日本屋呉服店」「呉服町郵便局」の翻訳方法を示す図である。
ここで、「日本屋呉服店」「呉服町郵便局」は、それぞれ「店名」「郵便局」の分類が対応付けられているものとする。このときには、「日本屋呉服店」の「呉服」は和服の店を示すものであるため、一般名詞として、意味に基づいて翻訳すべきである。そこで図2(b)の例では、分類「店名」に紐付けられている「呉服店」は「KimonoShop」として翻訳されている。
Similarly, FIG. 2B is a diagram illustrating a translation method of “Nihonya Kimono Store” and “Kuretsucho Post Office”, which are text information including the character string “Kofuku”.
Here, it is assumed that “Nihonya kimono store” and “Kuregicho post office” are associated with the classifications of “store name” and “post office”, respectively. At this time, “Kyufu” in “Nihonya kimono store” indicates a store of Japanese clothes, so it should be translated as a general noun based on the meaning. Therefore, in the example of FIG. 2B, “clothes store” associated with the classification “store name” is translated as “KimonoShop”.

一方、「呉服町郵便局」に含まれる「呉服」は「呉服町」という地名の一部を構成する固有名詞であると考えられるため、音韻に基づいて翻訳すべきである。そこで図2(b)の例では、分類「郵便局」に紐付けられている「呉服町」は「Gofukucho」と翻訳されている。   On the other hand, “Kuregi” included in “Kuretsucho Post Office” is considered to be a proper noun that constitutes a part of the place name “Kuretsucho”, and should be translated based on phoneme. Therefore, in the example of FIG. 2B, “Kofukucho” associated with the classification “post office” is translated as “Gofukucho”.

このように、本実施形態に係る情報処理装置は、それぞれの日本語テキストがどのような領域(分類)で使用されているかに応じて、そのテキストに含まれる文字列を、一般名詞として意味に基づいて翻訳するか、固有名詞として音韻に基づいて翻訳するかを切り換えるようにしている。   As described above, the information processing apparatus according to the present embodiment makes the meaning of the character string included in the text as a general noun depending on in which region (classification) each Japanese text is used. Whether to translate based on phonology as a proper noun is switched.

(2 システム概要)
図3は、本実施形態に係る情報処理装置100の概略構成を示す図である。情報処理装置100は、前述のとおり、日本語テキストを他の言語へと変換する機能を有する装置であり、例えば、パーソナルコンピュータやサーバ等として実現することができる。また、情報処理装置100が日本語から他言語に表記を変換するデータとしては、前述の通り、ベクトル地図情報に含まれる地名、住所、店舗名、駅名、道路名、施設名といった情報が考えられる。
(2 System overview)
FIG. 3 is a diagram illustrating a schematic configuration of the information processing apparatus 100 according to the present embodiment. As described above, the information processing apparatus 100 is an apparatus having a function of converting Japanese text into another language, and can be realized as, for example, a personal computer or a server. Further, as the data that the information processing apparatus 100 converts from Japanese to another language, as described above, information such as a place name, an address, a store name, a station name, a road name, and a facility name included in the vector map information can be considered. .

図3に示すように、情報処理装置100は、入力部101、特殊表記判別部103、特殊表記文字列データベース(DB)105、固有名詞翻訳部107、一般名詞翻訳部109、及び出力部111を含む。   As illustrated in FIG. 3, the information processing apparatus 100 includes an input unit 101, a special notation determination unit 103, a special notation character string database (DB) 105, a proper noun translation unit 107, a general noun translation unit 109, and an output unit 111. Including.

入力部101は、日本語テキストと、当該日本語テキストが使用される使用領域を示す分類情報との入力を受ける。なお、この入力方法は種々考えられるが、例えば、HDD(Hard Disk Drive Memory)やフラッシュメモリ等の記憶媒体に記憶されているベクトル地図情報から関連する情報を読み込むことが考えられる。   The input unit 101 receives input of Japanese text and classification information indicating a use area where the Japanese text is used. Various input methods can be considered. For example, it is possible to read related information from vector map information stored in a storage medium such as an HDD (Hard Disk Drive Memory) or a flash memory.

特殊表記判別部103は、特殊表記文字列DB105を参照することにより、入力部101により入力された文字列に、特殊表記文字列が含まれるか否かを判別する。なおここで特殊表記文字列とは、一般名詞として翻訳すべき場合(すなわち、文字列の意味に基づいて翻訳すべき場合)と、固有名詞として翻訳すべき場合(すなわち、文字列の音韻に基づいて翻訳すべきか)とがある文字列をいうものとする。   The special notation determining unit 103 refers to the special notation character string DB 105 to determine whether or not the character string input by the input unit 101 includes a special notation character string. Note that the special notation character string here refers to a case where it should be translated as a general noun (that is, a case where it should be translated based on the meaning of the character string) and a case where it should be translated as a proper noun (ie, based on the phoneme of the character string). And should be translated).

特殊表記文字列DB105は、特殊表記文字列と、その使用される分類との関係を示す辞書である。図4に、特殊表記文字列DB105の具体例を示す。図4の特殊表記文字列DB105では、一般名詞となりうる文字列の表記と、当該文字列が一般名詞となる場合の分類とが対応付けられている。例えば、文字列「線」の場合には、分類「道路」若しくは「路線名」で使用されている場合には一般名詞と考えることができ、他の分類で使用されている場合には固有名詞として使用されていると考えることができる。同様に、文字列「呉服」は分類「店名」で使用されている場合には一般名詞として考えることができ、他の分類で使用されている場合には、固有名詞として使用されていると考えることができる。   The special notation character string DB 105 is a dictionary indicating the relationship between the special notation character string and the classification used. FIG. 4 shows a specific example of the special notation character string DB 105. In the special notation character string DB 105 of FIG. 4, the notation of a character string that can be a general noun is associated with the classification when the character string is a general noun. For example, in the case of the character string “line”, it can be considered as a general noun when it is used in the classification “road” or “route name”, and it is a proper noun when it is used in other classifications. Can be considered as used. Similarly, the character string “clothes” can be considered as a general noun when used in the category “store name”, and is considered as a proper noun when used in other categories. be able to.

固有名詞翻訳部107は、図示しない辞書等を使用して、主に音韻に基づいて表記を変換(翻訳)する。特殊表記判別部103により一般名詞ではないと判断された文字列は、全て固有名詞翻訳部107が翻訳する。例えば文字列「線」や「呉服」が固有名詞として使用されていると判別できる場合であって英語(アルファベット表記)に変換する場合には、特殊表記判別部103は、それぞれの文字列を「Sen」「Gofuku」に変換する。ベクトル地図情報に含まれる各種テキスト情報を翻訳する場合であれば、翻訳すべきテキストに含まれる文字列の多くが固有名詞となるため、それらは全て固有名詞翻訳部107によって音韻に基づいて翻訳される。   The proper noun translation unit 107 converts (translates) the notation mainly based on phonemes using a dictionary or the like (not shown). The proper noun translation unit 107 translates all character strings that are determined not to be general nouns by the special notation determination unit 103. For example, when it can be determined that the character strings “line” and “clothes” are used as proper nouns and converted to English (alphabetic notation), the special notation determination unit 103 sets each character string to “ “Sen” and “Gofuku”. When translating various text information included in vector map information, since many character strings included in the text to be translated become proper nouns, they are all translated by the proper noun translation unit 107 based on phonemes. The

一般名詞翻訳部109は、図示しない辞書等を使用して、主に文字列の意味に基づいて表記を変換(翻訳)する。特殊表記判別部103により一般名詞として判断された文字列は、一般名詞翻訳部109が翻訳する。前述のとおり、文字列「線」が分類「道路」に使用された場合や、文字列「呉服」が分類「店名」に使用された場合等は、それぞれ一般名詞として使用されていると考えることができるため、「Line」や「Kimono」等と翻訳することができる。   The general noun translation unit 109 converts (translates) the notation mainly based on the meaning of the character string using a dictionary or the like (not shown). A character string determined as a general noun by the special notation determination unit 103 is translated by a general noun translation unit 109. As mentioned above, when the character string “line” is used for the classification “road”, or when the character string “clothes” is used for the classification “store name”, it is considered that each is used as a general noun. Therefore, it can be translated as “Line” or “Kimono”.

出力部111は、入力部101から入力された日本語テキストに含まれる文字列を固有名詞翻訳部107及び一般名詞翻訳部109がそれぞれ翻訳した結果を併せることにより翻訳結果のテキストを生成し、これを出力する。この出力結果は、ベクトル地図情報により作成されるベクトル地図を英語や中国語等の日本語以外の言語に対応させる際のデータとして使用することができる。   The output unit 111 generates a translation result text by combining the results of translation of the character strings included in the Japanese text input from the input unit 101 by the proper noun translation unit 107 and the general noun translation unit 109, respectively. Is output. This output result can be used as data when a vector map created from the vector map information is made to correspond to a language other than Japanese such as English or Chinese.

(3 処理の流れ)
以下、図5を参照しながら、情報処理装置100の処理の流れを説明する。図5は、情報処理装置100における翻訳処理の流れを示すフローチャートである。
(3 Process flow)
Hereinafter, the processing flow of the information processing apparatus 100 will be described with reference to FIG. FIG. 5 is a flowchart showing the flow of translation processing in the information processing apparatus 100.

ここで、後述の各処理ステップは、処理内容に矛盾を生じない範囲で、任意に順番を変更して若しくは並列に実行することができ、また、各処理ステップ間に他のステップを追加しても良い。更に、便宜上1つのステップとして記載されているステップは複数のステップに分けて実行することもでき、便宜上複数に分けて記載されているステップを1ステップとして実行することもできる。   Here, each processing step, which will be described later, can be executed in any order or in parallel as long as there is no contradiction in processing contents, and other steps are added between the processing steps. Also good. Further, a step described as a single step for convenience can be executed by being divided into a plurality of steps, and a step described as being divided into a plurality of steps for convenience can be executed as one step.

まず、入力部101は、使用されている分類付きの日本語テキストの入力を受ける(S501)。特殊表記判別部103は、入力された日本語テキストに含まれる文字列が、特殊表記文字列であるか否かを判別する(S505)。この判別方法としては、例えば、判別対象の文字列が特殊表記文字列DB105に含まれているか否かを判別し、もし含まれていれば、当該文字列が特殊表記文字列であると判別することが考えられる。   First, the input unit 101 receives input of Japanese text with classification used (S501). The special notation determining unit 103 determines whether or not the character string included in the input Japanese text is a special notation character string (S505). As this determination method, for example, it is determined whether or not the character string to be determined is included in the special notation character string DB 105, and if it is included, it is determined that the character string is a special notation character string. It is possible.

もし、対象文字列が特殊表記文字列であれば(S505のYes)、特殊表記判別部103は、その文字列(テキスト)が使用されている分類を判別する(S507)。その分類が、特殊表記文字列DB105上でその文字列が一般名詞として使用される分類として設定されているものと一致すれば(S507のYes)、特殊表記判別部103は、当該文字列を一般名詞として使用されているものと判別する。   If the target character string is a special notation character string (Yes in S505), the special notation determination unit 103 determines a classification in which the character string (text) is used (S507). If the classification matches that set as a classification in which the character string is used as a general noun on the special notation character string DB 105 (Yes in S507), the special notation determination unit 103 sets the character string as a general character. It is determined that it is used as a noun.

特殊表記判別部103により特殊表記文字列と判別された文字列に対しては、一般名詞翻訳部109が、主に当該文字列の意味に基づいて表記を変換(翻訳)する(S509)。一方、特殊表記判別部103により特殊表記文字列ではないと判別された文字列に対しては(S505のNo及びS507のNo)、固有名詞翻訳部107は、主にこの文字列の音韻(読み仮名)に基づいて表記を変換(翻訳)する(S511)。   For the character string determined as the special notation character string by the special notation determination unit 103, the general noun translation unit 109 converts (translates) the notation mainly based on the meaning of the character string (S509). On the other hand, for a character string that is determined not to be a special notation character string by the special notation determination unit 103 (No in S505 and No in S507), the proper noun translation unit 107 mainly uses the phoneme (reading) of this character string. The notation is converted (translated) based on the kana (S511).

日本語テキストに含まれていた全ての文字列についての翻訳が終了すれば、出力部111は固有名詞翻訳部107及び一般名詞翻訳部109による翻訳結果を併せて、翻訳文字列を出力する(S513)。   When the translation for all the character strings included in the Japanese text is completed, the output unit 111 outputs the translated character string together with the translation results by the proper noun translation unit 107 and the general noun translation unit 109 (S513). ).

(4 ハードウェア構成)
以下、図6を参照しながら、上述してきた情報処理装置100をコンピュータにより実現する場合のハードウェア構成の一例を説明する。なお、情報処理装置100の機能は、ネットワークを介して複数の装置に分けて実現することも可能である。
(4 hardware configuration)
Hereinafter, an example of a hardware configuration when the information processing apparatus 100 described above is realized by a computer will be described with reference to FIG. Note that the functions of the information processing apparatus 100 can be realized by being divided into a plurality of apparatuses via a network.

図6に示すように、情報処理装置100は、プロセッサ601、メモリ603、記憶装置605、入力インタフェース(I/F)607、データI/F609、通信I/F611、及び表示装置613を含む。   As illustrated in FIG. 6, the information processing apparatus 100 includes a processor 601, a memory 603, a storage device 605, an input interface (I / F) 607, a data I / F 609, a communication I / F 611, and a display device 613.

プロセッサ601は、メモリ603に記憶されているプログラムを実行することにより情報処理装置100における様々な処理を制御する。例えば、図3で説明した入力部101、特殊表記判別部103、固有名詞翻訳部107、一般名詞翻訳部109及び出力部111は、メモリ603に一時記憶された上で、主にプロセッサ601上で動作するプログラムとして実現可能である。   The processor 601 controls various processes in the information processing apparatus 100 by executing a program stored in the memory 603. For example, the input unit 101, special notation discriminating unit 103, proper noun translation unit 107, general noun translation unit 109, and output unit 111 described in FIG. 3 are temporarily stored in the memory 603 and mainly on the processor 601. It can be realized as an operating program.

メモリ603は、例えばRAM(Random Access Memory)等の記憶媒体である。メモリ603は、プロセッサ601によって実行されるプログラムのプログラムコードや、プログラムの実行時に必要となるデータを一時的に記憶する。例えば、メモリ603の記憶領域には、プログラム実行時に必要となるスタック領域が確保される。   The memory 603 is a storage medium such as a RAM (Random Access Memory). The memory 603 temporarily stores a program code of a program executed by the processor 601 and data necessary for executing the program. For example, in the storage area of the memory 603, a stack area necessary for program execution is secured.

記憶装置605は、例えばハードディスクやフラッシュメモリ等の不揮発性の記憶媒体である。記憶装置605は、オペレーティングシステムや、入力部101、特殊表記判別部103、固有名詞翻訳部107、一般名詞翻訳部109及び出力部111を実現するための各種プログラムや、特化表記文字列データベース105や、固有名詞翻訳部107や一般名詞翻訳部109が翻訳時に使用する辞書データ等の各種データを記憶する。その他、入力対象のベクトル地図情報や、翻訳結果として出力するデータは、記憶装置605に少なくとも一時的に記憶することができる。記憶装置605に記憶されているプログラムやデータは、必要に応じてメモリ603にロードされることにより、プロセッサ601から参照される。   The storage device 605 is a non-volatile storage medium such as a hard disk or a flash memory. The storage device 605 includes various programs for realizing the operating system, the input unit 101, the special notation determination unit 103, the proper noun translation unit 107, the general noun translation unit 109, and the output unit 111, and the specialized notation character string database 105. In addition, various data such as dictionary data used by the proper noun translation unit 107 and the general noun translation unit 109 during translation are stored. In addition, the vector map information to be input and the data to be output as the translation result can be stored at least temporarily in the storage device 605. Programs and data stored in the storage device 605 are referred to by the processor 601 by being loaded into the memory 603 as necessary.

入力I/F607は、ユーザからの入力を受け付けるためのデバイスである。入力I/F607の具体例としては、キーボードやマウス、タッチパネル、各種センサ等が挙げられる。入力I/F607は、例えばUSB(Universal Serial Bus)等のインタフェースを介して情報処理装置100に接続されても良い。   The input I / F 607 is a device for receiving input from the user. Specific examples of the input I / F 607 include a keyboard, a mouse, a touch panel, and various sensors. The input I / F 607 may be connected to the information processing apparatus 100 via an interface such as a USB (Universal Serial Bus).

データI/F609は、情報処理装置100の外部からデータを入力するためのデバイスである。データI/F609の具体例としては、各種記憶媒体に記憶されているデータを読み取るためのドライブ装置等がある。データI/F609は、情報処理装置100の外部に設けられることも考えられる。その場合、データI/F609は、例えばUSB等のインタフェースを介して情報処理装置100へと接続される。   The data I / F 609 is a device for inputting data from outside the information processing apparatus 100. Specific examples of the data I / F 609 include a drive device for reading data stored in various storage media. The data I / F 609 may be provided outside the information processing apparatus 100. In that case, the data I / F 609 is connected to the information processing apparatus 100 via an interface such as a USB.

通信I/F611は、情報処理装置100の外部の装置と有線又は無線によりデータ通信するためのデバイスである。その他、入力対象のベクトル地図情報や、翻訳結果として出力するデータは、前述のデータI/F609や通信I/F611を介して他の情報処理装置との間で入出力することが考えられる。通信I/F611は情報処理装置100の外部に設けられることも考えられる。その場合、通信I/F611は、例えばUSB等のインタフェースを介して情報処理装置100に接続される。   The communication I / F 611 is a device for performing data communication with an external device of the information processing apparatus 100 by wire or wireless. In addition, it is conceivable that vector map information to be input and data to be output as a translation result are input / output from / to other information processing apparatuses via the data I / F 609 and the communication I / F 611 described above. The communication I / F 611 may be provided outside the information processing apparatus 100. In that case, the communication I / F 611 is connected to the information processing apparatus 100 via an interface such as a USB.

表示装置613は、各種情報を表示するためのデバイスである。表示装置613の具体例としては、例えば液晶ディスプレイや有機EL(Electro−Luminescence)ディスプレイ等があげられる。表示装置613は、情報処理装置100の外部に設けられても良い。その場合、表示装置613は、例えばディスプレイケーブル等を介して情報処理装置100に接続される。   The display device 613 is a device for displaying various information. Specific examples of the display device 613 include a liquid crystal display and an organic EL (Electro-Luminescence) display. The display device 613 may be provided outside the information processing apparatus 100. In that case, the display device 613 is connected to the information processing apparatus 100 via, for example, a display cable.

(5 本実施形態の効果)
以上説明したように、本実施形態に係る情報処理装置100は、一般名詞として翻訳すべき意味と、固有名詞として翻訳すべき意味とを持つ文字列をテキスト中に含む場合であっても、その文字列がどのような分類で使用されているのかを調べることにより、好適に翻訳することができる。
(5 Effects of this embodiment)
As described above, even when the information processing apparatus 100 according to the present embodiment includes a character string having a meaning to be translated as a general noun and a meaning to be translated as a proper noun in the text, By examining what classification the character string is used for, it can be suitably translated.

(6 付記事項)
尚、前述の実施形態の構成は、組み合わせたり或いは一部の構成部分を入れ替えたりしてもよい。また、本発明の構成は前述の実施形態のみに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加えてもよい。
(6 Appendix)
Note that the configurations of the above-described embodiments may be combined or some components may be replaced. The configuration of the present invention is not limited to the above-described embodiment, and various modifications may be made without departing from the scope of the present invention.

100・・・情報処理装置、101・・・入力部、103・・・特殊表記判別部、105・・・特化表記文字列データベース、107・・・固有名詞翻訳部、109・・・一般名詞翻訳部、111・・・出力部、601・・・プロセッサ、603・・・メモリ、605・・・記憶装置、607・・・入力インタフェース、609・・・データインタフェース、611・・・通信インタフェース、613・・・表示装置、L1a・・・道路注記レイヤ、L1b・・・道路画像レイヤ、L2a・・・施設注記レイヤ、L2b・・・施設画像レイヤ   DESCRIPTION OF SYMBOLS 100 ... Information processing apparatus, 101 ... Input part, 103 ... Special notation discrimination | determination part, 105 ... Specialized description character string database, 107 ... Proper noun translation part, 109 ... General noun Translation unit, 111 ... output unit, 601 ... processor, 603 ... memory, 605 ... storage device, 607 ... input interface, 609 ... data interface, 611 ... communication interface, 613: Display device, L1a: Road note layer, L1b: Road image layer, L2a: Facility note layer, L2b: Facility image layer

Claims (4)

日本語テキストと、当該日本語テキストが使用される使用領域を示す分類との入力を受ける入力手段と、
前記日本語テキストに含まれる文字列に対して、一般名詞として翻訳すべきか固有名詞として翻訳すべきかを、前記分類に基づいて判別する判別手段と、
一般名詞の場合は当該文字列の意味に基づいて、固有名詞の場合には当該文字列の音韻に基づいて文字列を翻訳する翻訳手段と
を備える情報処理装置。
An input means for receiving input of Japanese text and a classification indicating a use area in which the Japanese text is used;
A discriminating means for discriminating, based on the classification, whether to translate as a general noun or a proper noun for a character string included in the Japanese text,
An information processing apparatus comprising translation means for translating a character string based on the meaning of the character string in the case of a general noun and based on the phoneme of the character string in the case of a proper noun.
前記日本語テキストは、ベクトル地図上に表示される注記の情報を含み、
前記分類は、前記日本語テキストに係る注記が当該ベクトル地図を構成するいずれのレイヤに係るものであるかを示す情報を含む、
請求項1記載の情報処理装置。
The Japanese text includes information of a note displayed on a vector map,
The classification includes information indicating which layer of which the note relating to the Japanese text relates to the vector map,
The information processing apparatus according to claim 1.
日本語テキストと、当該日本語テキストが使用される使用領域を示す分類との入力を受けるステップと、
前記日本語テキストに含まれる文字列に対して、一般名詞として翻訳すべきか固有名詞として翻訳すべきかを、前記分類に基づいて判別するステップと、
一般名詞の場合は当該文字列の意味に基づいて、固有名詞の場合には当該文字列の音韻に基づいて文字列を翻訳するステップと
を情報処理装置が行う情報処理方法。
Receiving input of Japanese text and a classification indicating a use area in which the Japanese text is used;
Determining, based on the classification, whether to translate as a general noun or a proper noun for a character string included in the Japanese text;
An information processing method in which the information processing apparatus performs a step of translating a character string based on the meaning of the character string in the case of a general noun, and in the case of a proper noun based on the phoneme of the character string.
日本語テキストと、当該日本語テキストが使用される使用領域を示す分類との入力を受けるステップと、
前記日本語テキストに含まれる文字列に対して、一般名詞として翻訳すべきか固有名詞として翻訳すべきかを、前記分類に基づいて判別するステップと、
一般名詞の場合は当該文字列の意味に基づいて、固有名詞の場合には当該文字列の音韻に基づいて文字列を翻訳するステップと
をコンピュータに実行させるためのプログラム。
Receiving input of Japanese text and a classification indicating a use area in which the Japanese text is used;
Determining, based on the classification, whether to translate as a general noun or a proper noun for a character string included in the Japanese text;
A program for causing a computer to execute the step of translating a character string based on the meaning of the character string in the case of a general noun, and in the case of a proper noun based on the phoneme of the character string.
JP2012251485A 2012-11-15 2012-11-15 Information processing apparatus, information processing method, and program Active JP6097529B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012251485A JP6097529B2 (en) 2012-11-15 2012-11-15 Information processing apparatus, information processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012251485A JP6097529B2 (en) 2012-11-15 2012-11-15 Information processing apparatus, information processing method, and program

Publications (2)

Publication Number Publication Date
JP2014099106A true JP2014099106A (en) 2014-05-29
JP6097529B2 JP6097529B2 (en) 2017-03-15

Family

ID=50941052

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012251485A Active JP6097529B2 (en) 2012-11-15 2012-11-15 Information processing apparatus, information processing method, and program

Country Status (1)

Country Link
JP (1) JP6097529B2 (en)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57182276A (en) * 1981-05-06 1982-11-10 Canon Inc Interpreter
JPH03222069A (en) * 1990-01-26 1991-10-01 Sharp Corp Machine translation device
JPH07121542A (en) * 1993-10-25 1995-05-12 Brother Ind Ltd Machine translation system
JPH09146950A (en) * 1995-11-27 1997-06-06 Fujitsu Ltd Translation device, dictionary retrieval device, and translating method
JP2004192565A (en) * 2002-12-13 2004-07-08 Internatl Business Mach Corp <Ibm> Translation server, collaboration server, information processor and its machine translation method and program
JP2004280316A (en) * 2003-03-14 2004-10-07 Fuji Xerox Co Ltd Field determination device and language processor
JP2004302882A (en) * 2003-03-31 2004-10-28 Zenrin Co Ltd Method of forming printing data
JP2005520251A (en) * 2002-03-11 2005-07-07 ユニバーシティ・オブ・サザン・カリフォルニア Translate named entities

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57182276A (en) * 1981-05-06 1982-11-10 Canon Inc Interpreter
JPH03222069A (en) * 1990-01-26 1991-10-01 Sharp Corp Machine translation device
JPH07121542A (en) * 1993-10-25 1995-05-12 Brother Ind Ltd Machine translation system
JPH09146950A (en) * 1995-11-27 1997-06-06 Fujitsu Ltd Translation device, dictionary retrieval device, and translating method
JP2005520251A (en) * 2002-03-11 2005-07-07 ユニバーシティ・オブ・サザン・カリフォルニア Translate named entities
JP2004192565A (en) * 2002-12-13 2004-07-08 Internatl Business Mach Corp <Ibm> Translation server, collaboration server, information processor and its machine translation method and program
JP2004280316A (en) * 2003-03-14 2004-10-07 Fuji Xerox Co Ltd Field determination device and language processor
JP2004302882A (en) * 2003-03-31 2004-10-28 Zenrin Co Ltd Method of forming printing data

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
岡崎 彰夫 外3名: "地図情報のコンピュータによる管理と検索", 情報処理学会研究報告, vol. 第90巻第34号, JPN6016030780, 11 May 1990 (1990-05-11), JP, pages 1 - 8, ISSN: 0003481616 *
關 博之 外1名: "テキストの分野に応じた意味を表示する辞典選択システムの評価", 言語処理学会第18回年次大会発表論文集 チュートリアル 本会議 [CD−ROM], JPN6016030781, 31 March 2012 (2012-03-31), JP, pages 613 - 616, ISSN: 0003481617 *

Also Published As

Publication number Publication date
JP6097529B2 (en) 2017-03-15

Similar Documents

Publication Publication Date Title
JP6333745B2 (en) Translation result providing method, translation result providing system, program, and file distribution system
JP6004452B2 (en) Method for selecting learning text for language model, method for learning language model using the learning text, and computer and computer program for executing the same
KR101474854B1 (en) Apparatus and method for selecting a control object by voice recognition
US20140006004A1 (en) Generating localized user interfaces
JP2010146563A (en) Method, apparatus and system for location assisted translation
US20140258817A1 (en) Context-based visualization generation
US10565982B2 (en) Training data optimization in a service computing system for voice enablement of applications
US10553203B2 (en) Training data optimization for voice enablement of applications
CN109710951A (en) Supplementary translation method, apparatus, equipment and storage medium based on translation history
WO2010004612A1 (en) Information processing apparatus, information generating apparatus, information processing method, information generation method, information processing program, information generating program, and recording medium
JP2014146260A (en) Voice input/output database search method, program and device
KR101709693B1 (en) Method for Web toon Language Automatic Translating Using Crowd Sourcing
JP2010134922A (en) Similar word determination method and system
JP6097529B2 (en) Information processing apparatus, information processing method, and program
KR20120045906A (en) Apparatus and method for correcting error of corpus
KR20190062027A (en) Method, apparatus and computer program for providing translation result, method, apparatus and computer program for displaying translation result
KR102243274B1 (en) Device, method and computer program for machine translation of geograohic name
CN108682437B (en) Information processing method, device, medium and computing equipment
JP2014092745A (en) Information processor, information processing method, and program
JP6076285B2 (en) Translation apparatus, translation method, and translation program
JP6021571B2 (en) Information processing apparatus, information processing method, and program
US20170177178A1 (en) E-reader summarization and customized dictionary
JP6626029B2 (en) Information processing apparatus, information processing method and program
JP2018147205A (en) Information processing device and information processing program
JP2007316916A (en) Morphological analysis device, morphological analysis method and morphological analysis program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151027

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160810

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160810

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160909

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170123

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170220

R150 Certificate of patent or registration of utility model

Ref document number: 6097529

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250