JP2018147205A - Information processing device and information processing program - Google Patents

Information processing device and information processing program Download PDF

Info

Publication number
JP2018147205A
JP2018147205A JP2017041259A JP2017041259A JP2018147205A JP 2018147205 A JP2018147205 A JP 2018147205A JP 2017041259 A JP2017041259 A JP 2017041259A JP 2017041259 A JP2017041259 A JP 2017041259A JP 2018147205 A JP2018147205 A JP 2018147205A
Authority
JP
Japan
Prior art keywords
noun
proper noun
user
information processing
proper
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017041259A
Other languages
Japanese (ja)
Other versions
JP6897168B2 (en
Inventor
和哉 田中
Kazuya Tanaka
和哉 田中
優友 田村
Yusuke Tamura
優友 田村
伊藤 康洋
Yasuhiro Ito
康洋 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2017041259A priority Critical patent/JP6897168B2/en
Priority to US15/701,788 priority patent/US20180253417A1/en
Priority to CN201710903912.3A priority patent/CN108536685B/en
Publication of JP2018147205A publication Critical patent/JP2018147205A/en
Application granted granted Critical
Publication of JP6897168B2 publication Critical patent/JP6897168B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/253Grammatical analysis; Style critique
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/274Syntactic or semantic context, e.g. balancing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide an information processing device facilitating a user to understand a sentence that involves a proper noun in comparison with a case in which a proper noun in the sentence is not converted.SOLUTION: An original sentence receiving module 105 of an information processing device receives a sentence that involves at least a proper noun, and a proper noun extracting module 110 extracts the proper noun from this sentence. A user profile extracting module 125 acquires information on a user that utilizes a sentence processed by this information processing device, and a replacing module 135 replaces the proper noun with another noun using the information on the user.SELECTED DRAWING: Figure 1

Description

本発明は、情報処理装置及び情報処理プログラムに関する。   The present invention relates to an information processing apparatus and an information processing program.

特許文献1には、第一言語を第二言語に翻訳する際に、第一言語が国内固有の表現を含む場合でも、第二言語を母国語とする人に翻訳文の意味を伝達させることを課題とし、入力された第一言語を第二言語に翻訳し、得られた翻訳結果を出力するための機械翻訳装置において、翻訳部の訳文生成部は、特定見出し記憶部を参照しつつ、第一言語内に数量程度表現を含むか否かを判定し、また、翻訳辞書部を参照しつつ、第一言語内に当該第一言語の国内特有の固有名詞を含むか否かを判定し、第一言語の1つの文内で数量程度表現及び固有名詞がそれぞれ含まれるとき、訳文生成部は、補足語辞書部を参照しつつ、当該固有名詞に補足情報を付加して翻訳結果を作成し、このように、第一言語の国内特有の固有名詞には補足情報を付加して、第二言語を母国語とする人に翻訳文の意味を伝達させることが開示されている。   In Patent Document 1, when the first language is translated into the second language, the meaning of the translated sentence is communicated to the person whose native language is the second language even if the first language includes domestic-specific expressions. In the machine translation device for translating the input first language into the second language and outputting the obtained translation result, the translation generation unit of the translation unit refers to the specific headline storage unit, Determine whether the first language includes a quantity expression, and determine whether the first language includes proper nouns unique to the first language in the first language while referring to the translation dictionary. When a quantity expression and proper noun are included in one sentence in the first language, the translation generation unit adds a supplementary information to the proper noun and creates a translation result while referring to the supplement word dictionary unit. In this way, supplementary information is added to the country-specific proper nouns of the first language, It has been disclosed that to transmit the meaning of the translation a second language to people whose native language.

特開2004−220416号公報JP 2004-220416 A

理解を容易にするために、比喩として固有名詞が使われることがある。この場合、その固有名詞を知っている者にとっては理解が容易になるが、逆に、その固有名詞を知らない者にとっては理解が困難となってしまう場合がある。
本発明は、文中の固有名詞を変換しない場合に比べて、固有名詞が使われている文が利用者にとって理解しやすくなる情報処理装置及び情報処理装プログラムを提供することを目的としている。
Proper nouns are sometimes used as metaphors to facilitate understanding. In this case, the person who knows the proper noun is easy to understand, but conversely, the person who does not know the proper noun may be difficult to understand.
An object of the present invention is to provide an information processing apparatus and an information processing device program that make it easier for a user to understand a sentence in which a proper noun is used than when a proper noun in a sentence is not converted.

かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、少なくとも固有名詞を含む文を受け付ける受付手段と、本情報処理装置によって処理された文を利用する利用者に関する情報を取得する取得手段と、前記利用者に関する情報を用いて、前記固有名詞を別の名詞に置換する置換手段を有する情報処理装置である。
The gist of the present invention for achieving the object lies in the inventions of the following items.
The invention of claim 1 uses an accepting unit that accepts a sentence including at least a proper noun, an obtaining unit that obtains information about a user who uses a sentence processed by the information processing apparatus, and information about the user. , An information processing apparatus having replacement means for replacing the proper noun with another noun.

請求項2の発明は、前記置換手段は、置換する前記別の名詞を、前記利用者の使用言語にしたがって置換する、請求項1に記載の情報処理装置である。   The invention according to claim 2 is the information processing apparatus according to claim 1, wherein the replacement means replaces the another noun to be replaced in accordance with a language used by the user.

請求項3の発明は、前記受付手段が受付けた文は第1の言語で記載されており、固有名詞が置換された文を、前記第1の言語とは異なっており、かつ前記利用者が用いる言語である第2の言語に翻訳する翻訳手段をさらに有する請求項2に記載の情報処理装置である。   In the invention of claim 3, the sentence accepted by the accepting means is described in the first language, the sentence in which the proper noun is replaced is different from the first language, and the user The information processing apparatus according to claim 2, further comprising translation means for translating into a second language that is a language to be used.

請求項4の発明は、前記置換手段は、固有名詞と名詞と利用者に関する情報とを対応させて記憶している記憶手段を用いて、前記固有名詞を別の名詞に置換する、請求項1に記載の情報処理装置である。   According to a fourth aspect of the present invention, the replacement means replaces the proper noun with another noun using storage means that stores the proper noun, the noun and the information about the user in association with each other. It is an information processing apparatus as described in.

請求項5の発明は、前記置換手段は、固有名詞に類似する名詞に関する情報と、前記利用者に関する情報を比較することによって、前記固有名詞を別の名詞に置換する、請求項1に記載の情報処理装置である。   The invention according to claim 5 is characterized in that the replacement means replaces the proper noun with another noun by comparing information on the noun similar to the proper noun and information on the user. Information processing apparatus.

請求項6の発明は、前記置換手段は、前記名詞を、現在使われている名詞に変更する、請求項4又は5に記載の情報処理装置である。   The invention according to claim 6 is the information processing apparatus according to claim 4 or 5, wherein the replacement means changes the noun to a currently used noun.

請求項7の発明は、前記固有名詞を、固有名詞と該固有名詞に近接する数量表現の組み合わせとする、請求項1から6のいずれか1項に記載の情報処理装置である。   The invention of claim 7 is the information processing apparatus according to any one of claims 1 to 6, wherein the proper noun is a combination of a proper noun and a quantity expression close to the proper noun.

請求項8の発明は、情報処理装置であるコンピュータを、少なくとも固有名詞を含む文を受け付ける受付手段と、前記情報処理装置によって処理された文を利用する利用者に関する情報を取得する取得手段と、前記利用者に関する情報を用いて、前記固有名詞を別の名詞に置換する置換手段として機能させるための情報処理プログラムである。   The invention of claim 8 is a computer that is an information processing device, accepting means for accepting a sentence including at least a proper noun, acquisition means for obtaining information about a user who uses the sentence processed by the information processing apparatus, It is an information processing program for functioning as replacement means for replacing the proper noun with another noun using information on the user.

請求項1の情報処理装置によれば、文中の固有名詞を変換しない場合に比べて、固有名詞が使われている文が利用者にとって理解しやすくなる。   According to the information processing apparatus of claim 1, it is easier for the user to understand a sentence in which the proper noun is used than in the case where the proper noun in the sentence is not converted.

請求項2の情報処理装置によれば、利用者の使用言語にしたがった名詞を選択することができる。   According to the information processing apparatus of the second aspect, it is possible to select a noun according to the language used by the user.

請求項3の情報処理装置によれば、利用者が用いる言語に翻訳することができる。   According to the information processing apparatus of the third aspect, the information can be translated into the language used by the user.

請求項4の情報処理装置によれば、固有名詞と名詞と利用者に関する情報とを対応させて記憶している記憶手段を用いて置換することができる。   According to the information processing apparatus of the fourth aspect, the proper noun, the noun, and the information related to the user can be replaced by using the storage means that stores them in association with each other.

請求項5の情報処理装置によれば、固有名詞に類似する名詞に関する情報と、利用者に関する情報を比較することによって置換することができる。   According to the information processing apparatus of the fifth aspect, it is possible to replace the information by comparing the information on the noun similar to the proper noun and the information on the user.

請求項6の情報処理装置によれば、置換先の名詞を、現在使われている名詞に変更することができる。   According to the information processing apparatus of the sixth aspect, the replacement noun can be changed to the noun currently used.

請求項7の情報処理装置によれば、固有名詞とその固有名詞に近接する数量表現の組み合わせを対象として置換することができる。   According to the information processing apparatus of the seventh aspect, a combination of a proper noun and a quantity expression close to the proper noun can be replaced.

請求項8の情報処理プログラムによれば、文中の固有名詞を変換しない場合に比べて、固有名詞が使われている文が利用者にとって理解しやすくなる。   According to the information processing program of claim 8, the sentence in which the proper noun is used becomes easier for the user to understand than when the proper noun in the sentence is not converted.

第1の実施の形態の構成例についての概念的なモジュール構成図である。It is a conceptual module block diagram about the structural example of 1st Embodiment. 本実施の形態を利用したシステム構成例を示す説明図である。It is explanatory drawing which shows the system configuration example using this Embodiment. 第1の実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by 1st Embodiment. 固有名詞対テーブルのデータ構造例を示す説明図である。It is explanatory drawing which shows the example of a data structure of a proper noun pair table. プロファイルテーブルのデータ構造例を示す説明図である。It is explanatory drawing which shows the data structure example of a profile table. 第1の実施の形態による処理例を示す説明図である。It is explanatory drawing which shows the process example by 1st Embodiment. 属性付固有名詞対テーブルのデータ構造例を示す説明図である。It is explanatory drawing which shows the example of a data structure of a proper noun pair table with an attribute. カテゴリーツリーのデータ構造例を示す説明図である。It is explanatory drawing which shows the data structure example of a category tree. 固有名詞プロファイルテーブルのデータ構造例を示す説明図である。It is explanatory drawing which shows the example of a data structure of a proper noun profile table. 利用者プロファイルテーブルのデータ構造例を示す説明図である。It is explanatory drawing which shows the example of a data structure of a user profile table. 第1の実施の形態による処理例を示す説明図である。It is explanatory drawing which shows the process example by 1st Embodiment. 第2の実施の形態の構成例についての概念的なモジュール構成図である。It is a conceptual module block diagram about the structural example of 2nd Embodiment. 第2の実施の形態による処理例を示す説明図である。It is explanatory drawing which shows the process example by 2nd Embodiment. 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。It is a block diagram which shows the hardware structural example of the computer which implement | achieves this Embodiment.

以下、図面に基づき本発明を実現するにあたっての好適な各種の実施の形態の例を説明する。
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態にしたがって、又はそれまでの状況・状態にしたがって定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。また、「A、B、C」等のように事物を列挙した場合は、断りがない限り例示列挙であり、その1つのみを選んでいる場合(例えば、Aのみ)を含む。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
Hereinafter, examples of various preferred embodiments for realizing the present invention will be described with reference to the drawings.
FIG. 1 is a conceptual module configuration diagram of a configuration example according to the first embodiment.
The module generally refers to components such as software (computer program) and hardware that can be logically separated. Therefore, the module in the present embodiment indicates not only a module in a computer program but also a module in a hardware configuration. Therefore, the present embodiment is a computer program for causing these modules to function (a program for causing a computer to execute each procedure, a program for causing a computer to function as each means, and a function for each computer. This also serves as an explanation of the program and system and method for realizing the above. However, for the sake of explanation, the words “store”, “store”, and equivalents thereof are used. However, when the embodiment is a computer program, these words are stored in a storage device or stored in memory. This means that control is performed so as to be stored in the apparatus. Modules may correspond to functions one-to-one, but in mounting, one module may be configured by one program, or a plurality of modules may be configured by one program, and conversely, one module May be composed of a plurality of programs. The plurality of modules may be executed by one computer, or one module may be executed by a plurality of computers in a distributed or parallel environment. Note that one module may include other modules. Hereinafter, “connection” is used not only for physical connection but also for logical connection (data exchange, instruction, reference relationship between data, etc.). “Predetermined” means that the process is determined before the target process, and not only before the process according to this embodiment starts but also after the process according to this embodiment starts. Also, if it is before the target processing, it is used in accordance with the situation / status at that time or with the intention to be decided according to the status / status up to that point. When there are a plurality of “predetermined values”, they may be different values, or two or more values (of course, including all values) may be the same. In addition, the description of “do B when A” is used to mean “determine whether or not A and do B when A”. However, the case where it is not necessary to determine whether or not A is excluded. In addition, when enumerating things such as “A, B, C”, etc., it is an enumerated list unless otherwise specified, and includes cases where only one of them is selected (for example, only A).
In addition, the system or device is configured by connecting a plurality of computers, hardware, devices, and the like by communication means such as a network (including one-to-one correspondence communication connection), etc., and one computer, hardware, device. The case where it implement | achieves by etc. is also included. “Apparatus” and “system” are used as synonymous terms. Of course, the “system” does not include a social “mechanism” (social system) that is an artificial arrangement.
In addition, when performing a plurality of processes in each module or in each module, the target information is read from the storage device for each process, and the processing result is written to the storage device after performing the processing. is there. Therefore, description of reading from the storage device before processing and writing to the storage device after processing may be omitted. Here, the storage device may include a hard disk, a RAM (Random Access Memory), an external storage medium, a storage device via a communication line, a register in a CPU (Central Processing Unit), and the like.

第1の実施の形態である情報処理装置100は、原文103内の固有名詞を別の名詞に置換するものであって、図1の例に示すように、原文受付モジュール105、固有名詞抽出モジュール110、固有名詞記憶モジュール115、利用者情報受付モジュール120、利用者プロファイル抽出モジュール125、プロファイル記憶モジュール130、置換モジュール135、置換用データ記憶モジュール140を有している。   The information processing apparatus 100 according to the first embodiment replaces the proper noun in the original sentence 103 with another noun, and as shown in the example of FIG. 1, the original sentence reception module 105, the proper noun extraction module 110, a proper noun storage module 115, a user information reception module 120, a user profile extraction module 125, a profile storage module 130, a replacement module 135, and a replacement data storage module 140.

原文受付モジュール105は、固有名詞抽出モジュール110と接続されており、原文103を受け付ける。原文受付モジュール105は、少なくとも固有名詞を含む原文103を受け付ける。原文103を受け付けるとは、例えば、キーボード等を用いて作成された原文103を受け付けること、通信回線を介して外部機器から原文103を受信すること、ハードディスク(情報処理装置100に内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている原文103を読み出すこと等が含まれる。原文103の言語は、日本語、英語、中国語等の種類を問わない。原文103には少なくとも固有名詞が含まれるが、その固有名詞として、例えば、国名、地名、人名、書名、曲名や映画のタイトル等の作品名、グループ名、建築物名、ブランド名、天体名等がある。   The original text reception module 105 is connected to the proper noun extraction module 110 and receives the original text 103. The original sentence receiving module 105 receives an original sentence 103 including at least a proper noun. Accepting the original text 103 is, for example, accepting the original text 103 created using a keyboard or the like, receiving the original text 103 from an external device via a communication line, or a hard disk (those incorporated in the information processing apparatus 100). In addition, reading of the original text 103 stored in a network (including those connected via a network) is included. The language of the original text 103 is not limited to Japanese, English, Chinese, or the like. The original text 103 includes at least a proper noun, and examples of the proper noun include country name, place name, person name, book name, work name such as song title and movie title, group name, building name, brand name, celestial name, etc. There is.

固有名詞記憶モジュール115は、固有名詞抽出モジュール110と接続されている。固有名詞記憶モジュール115は、固有名詞を記憶している。例えば、単語と品詞の組み合わせを有している辞書等であってもよい。
固有名詞抽出モジュール110は、原文受付モジュール105、固有名詞記憶モジュール115、置換モジュール135と接続されている。固有名詞抽出モジュール110は、固有名詞記憶モジュール115内の情報を用いて、原文受付モジュール105が受け付けた原文103から固有名詞を抽出する。例えば、形態素解析等の技術を用いればよい。
The proper noun storage module 115 is connected to the proper noun extraction module 110. The proper noun storage module 115 stores proper nouns. For example, a dictionary having a combination of words and parts of speech may be used.
The proper noun extraction module 110 is connected to the original text reception module 105, the proper noun storage module 115, and the replacement module 135. The proper noun extraction module 110 uses the information in the proper noun storage module 115 to extract proper nouns from the original sentence 103 received by the original sentence reception module 105. For example, a technique such as morphological analysis may be used.

利用者情報受付モジュール120は、利用者プロファイル抽出モジュール125と接続されており、利用者情報118を受け付ける。利用者情報118を受け付けるとは、例えば、利用者のキーボード等の操作による利用者ID(IDentification)とパスワード、指紋認証等による利用者情報118を受け付けること、通信回線を介して外部機器から利用者情報118を受信すること、ハードディスク等に記憶されている利用者情報118を読み出すこと等が含まれる。   The user information reception module 120 is connected to the user profile extraction module 125 and receives user information 118. Accepting the user information 118 means, for example, accepting the user information 118 by the user's operation of the keyboard or the like by ID, ID, password, fingerprint authentication, etc., from the external device via the communication line Receiving information 118, reading user information 118 stored in a hard disk or the like, and the like are included.

プロファイル記憶モジュール130は、利用者プロファイル抽出モジュール125と接続されている。プロファイル記憶モジュール130は、利用者に関する情報を記憶している。「利用者に関する情報」とは、プロファイルともいわれ、対象としている利用者に関する属性の情報を列挙したものであって、具体例として、「名前、年齢、性別、生年月日、年齢、出身国(国籍)、出身地、使用言語、現住所、職業、業種、趣味等」がある。
利用者プロファイル抽出モジュール125は、利用者情報受付モジュール120、プロファイル記憶モジュール130、置換モジュール135と接続されている。利用者プロファイル抽出モジュール125は、情報処理装置100によって処理された文(置換結果142)を利用する利用者に関する情報を、プロファイル記憶モジュール130から取得する。ここで「文を利用する利用者」には、その文の一部を置換した文(本実施の形態による処理済みの文)を直接的又は間接的に利用する者である。直接的に利用する者とは、置換した文の読者であり、間接的に利用する者とは、置換した文に対してさらに処理(翻訳等)を加えた文の読者である。
The profile storage module 130 is connected to the user profile extraction module 125. The profile storage module 130 stores information about users. “Information about users”, also called profiles, is a list of attribute information about target users. Specific examples include “name, age, gender, date of birth, age, country of origin ( Nationality), place of birth, language, current address, occupation, industry, hobby, etc.
The user profile extraction module 125 is connected to the user information reception module 120, the profile storage module 130, and the replacement module 135. The user profile extraction module 125 acquires information about the user who uses the sentence processed by the information processing apparatus 100 (replacement result 142) from the profile storage module 130. Here, a “user who uses a sentence” is a person who directly or indirectly uses a sentence (a sentence that has been processed according to the present embodiment) obtained by replacing a part of the sentence. The direct user is the reader of the sentence that has been replaced, and the indirect user is the reader of the sentence that has been further processed (translated, etc.).

置換用データ記憶モジュール140は、置換モジュール135と接続されている。置換用データ記憶モジュール140は、置換元である固有名詞と置換先である名詞との対を記憶している。また、固有名詞に関する情報、名詞に関する情報を記憶していてもよい。固有名詞に関する情報、名詞に関する情報として、例えば、その固有名詞(名詞)が示す建物等がある場所、用途、言語の種類等がある。さらに、置換先である名詞に、利用者のプロファイルに応じた優先順位が付与されていてもよい。この優先順位にしたがって、置換先の名詞を決定してもよい。また、固有名詞と名詞と利用者に関する情報とを対応させて記憶しているカテゴリーツリーとして表現されていてもよい。   The replacement data storage module 140 is connected to the replacement module 135. The replacement data storage module 140 stores a pair of a proper noun that is a replacement source and a noun that is a replacement destination. Moreover, the information regarding a proper noun and the information regarding a noun may be memorize | stored. Examples of information on proper nouns and information on nouns include places where there are buildings indicated by the proper nouns (nouns), uses, types of languages, and the like. Furthermore, the priority according to a user's profile may be provided to the noun which is a replacement destination. The replacement destination noun may be determined according to this priority. Moreover, you may express as a category tree which memorize | stores the proper noun, the noun, and the information regarding a user correspondingly.

置換モジュール135は、固有名詞抽出モジュール110、利用者プロファイル抽出モジュール125、置換用データ記憶モジュール140と接続されており、置換結果142を出力する。置換モジュール135は、置換用データ記憶モジュール140を用いて、利用者プロファイル抽出モジュール125によって取得された利用者に関する情報を用いて、固有名詞抽出モジュール110によって抽出された固有名詞を別の名詞に置換する。ここで「別の名詞」として、利用者が理解容易な名詞であり、利用者に関する情報(バックボーン)に沿った名詞である。なお、「別の名詞」には、対象としている文内の固有名詞そのものとは異なる名詞であって、もちろんのことながら、固有名詞を含む。例えば、対象としている文に固有名詞「富士山」(標高3776m)があり、これを「別の名詞」として固有名詞「フォレル山」(グリーンランドにある山、標高約3360m)に置換することも含まれる。
また、置換モジュール135は、置換する別の名詞を、利用者の使用言語にしたがって選択するようにしてもよい。そして、この選択を行った場合、固有名詞抽出モジュール110によって抽出された固有名詞を、この選択した「別の名詞」に置換する。
The replacement module 135 is connected to the proper noun extraction module 110, the user profile extraction module 125, and the replacement data storage module 140, and outputs a replacement result 142. The replacement module 135 uses the replacement data storage module 140 to replace the proper noun extracted by the proper noun extraction module 110 with another noun using information about the user acquired by the user profile extraction module 125. To do. Here, the “other noun” is a noun that is easy for the user to understand and is a noun along the information (backbone) about the user. The “other noun” is a noun different from the proper noun itself in the target sentence, and of course includes the proper noun. For example, the target sentence has the proper noun “Mt. Fuji” (elevation 3776m), which is replaced with the proper noun “Mountain Forel” (mountain in Greenland, altitude of about 3360m) as “another noun”. It is.
The replacement module 135 may select another noun to be replaced according to the language used by the user. When this selection is made, the proper noun extracted by the proper noun extraction module 110 is replaced with the selected “other noun”.

また、置換モジュール135は、固有名詞と名詞と利用者に関する情報とを対応させて記憶している置換用データ記憶モジュール140を用いて、固有名詞を別の名詞に置換するようにしてもよい。例えば、前述したように、置換用データ記憶モジュール140内の情報に優先順位が付与されている場合は、利用者に印象を与える固有名詞を選択することができるようになる。
また、置換モジュール135は、固有名詞に類似する名詞に関する情報と、利用者に関する情報を比較することによって、固有名詞を別の名詞に置換するようにしてもよい。例えば、前述のカテゴリーツリーを用いるようにしてもよい。これによって、利用者のプロファイルに応じた置換が可能になる。
Further, the replacement module 135 may replace the proper noun with another noun using the replacement data storage module 140 that stores the proper noun, the noun, and the information about the user in association with each other. For example, as described above, when a priority is given to the information in the replacement data storage module 140, a proper noun that gives an impression to the user can be selected.
Further, the replacement module 135 may replace the proper noun with another noun by comparing information on the noun similar to the proper noun and information on the user. For example, the aforementioned category tree may be used. As a result, replacement according to the user's profile becomes possible.

また、置換モジュール135は、名詞を、現在使われている名詞に変更するようにしてもよい。ここで「現在使われている名詞」として、例えば、インターネットを検索して最新の用語集を用いるようにしてもよいし、電子辞書が改訂等された場合に、その改訂後の電子辞書を用いるようにしてもよい。いわゆるトレンドに応じて名詞(固有名詞を含む)を更新する。例えば、建物など存在しなくなったものを削除すること、名称が変更されたものを書き換えること、頻繁に使われている名詞に変えること等が該当する。これによって、利用者が分かりやすい状態を保つことができる。   Further, the replacement module 135 may change the noun to a currently used noun. Here, as the “currently used noun”, for example, the latest glossary may be used by searching the Internet, or when the electronic dictionary is revised, the revised electronic dictionary is used. You may do it. Update nouns (including proper nouns) according to so-called trends. For example, deleting a thing that no longer exists, such as a building, rewriting a name that has been changed, changing to a frequently used noun, and the like. As a result, it is possible to maintain an easy-to-understand state for the user.

なお、前述した「固有名詞」を、固有名詞とその固有名詞に近接する数量表現の組み合わせを対象としてもよい。ここで「固有名詞とその固有名詞に近接する数量表現の組み合わせ」として、(1)固有名詞に数量表現が後続する場合、(2)数量表現が先にあり、その後に固有名詞がある場合がある。例えば、前者として「大江戸ドーム10個分」等があり、後者として、「10個分の大江戸ドーム」等がある。また、「近接」には、隣接すること(直前又は直後であること)の他に、予め定められた文字数分(例えば、3文字分等)以内で固有名詞と数量表現が存在している場合を含む。なお、数量表現は、数値を示す文字列(数字:1、2、3等、漢数字:一、二、三等、数的文字列:半分、倍等)と単位とによって構成されている文字列をパターンマッチング等で抽出すればよい。   The “proprietary noun” described above may be a combination of a proper noun and a quantity expression close to the proper noun. Here, as “a combination of a proper noun and a quantitative expression close to the proper noun”, (1) when a proper expression is followed by a quantitative expression, (2) there may be a proper expression followed by a proper expression. is there. For example, the former includes “10 Oedo Domes”, and the latter includes “10 Oedo Domes”. In addition to “adjacent” (immediately before or after), there are proper nouns and quantity expressions within a predetermined number of characters (for example, three characters) including. The quantity expression is a character composed of a character string indicating a numerical value (numbers: 1, 2, 3, etc., Chinese numerals: 1, 2, 3, etc., numerical character strings: half, double, etc.) and a unit. The columns may be extracted by pattern matching or the like.

「固有名詞と数量表現の組み合わせ」について、より詳細に説明する。なお、以下の説明は、本実施の形態の理解を容易にすることを目的とするものである。
情報処理装置100は、特に、利用者に応じた数量的表現の言い換えを行うものである。特許文献1に記載の技術では、固有名詞に補足説明(補足情報)をつけることで、固有名詞の理解を助けてはいるが、固有名詞の補足説明だけでは数値による絶対的な大小が分かるだけである。
利用者に馴染みがないモノは、補足説明だけではどのようなものか想像ができないため、馴染みがあるものに置き換えるべきである。特に、「固有名詞と数量的表現との組み合わせ」は作者の知識や経験を基にした相対的又は感情的(その作者が経験してきたことから来る経験的)な数量を伝える表現である。例えば、固有名詞である「大江戸ドーム」は「野球場」であるとの補足説明を付加したとしても、野球が盛んな国であるアメリカ人と野球の人気が低い国であるイギリス人では、読み手が想像する野球場の規模が異なる。また、「北海道と同じ広さ」など特定の地域にしかないモノを基準にした場合、補足説明の「38万平方km」だけでは驚きが伝わらない。
“Combination of proper nouns and quantity expressions” will be described in more detail. The following description is intended to facilitate understanding of the present embodiment.
In particular, the information processing apparatus 100 performs paraphrasing of the quantitative expression according to the user. The technology described in Patent Document 1 helps to understand proper nouns by adding supplemental explanations (supplemental information) to proper nouns, but only the supplementary explanations for proper nouns can only tell the absolute magnitude of numerical values. It is.
Things that are unfamiliar to the user cannot be imagined from the supplementary explanation alone, so they should be replaced with familiar ones. In particular, the “combination of proper nouns and quantitative expressions” is an expression that conveys a relative or emotional (experience that comes from what the author has experienced) quantity based on the knowledge and experience of the author. For example, even if the supplementary explanation that the proper noun “Oedo Dome” is a “baseball stadium” is added, an American who is a popular baseball player and an English who is a less popular baseball player, The size of the baseball field imagined by the reader is different. In addition, if the standard is something that is only in a specific area, such as “the same size as Hokkaido,” the supplementary explanation of “380,000 square km” will not convey surprise.

例えば、情報処理装置100は、利用する人のプロファイルに合わせ、「固有名詞と数量的表現との組み合わせ」の固有名詞を利用者に馴染みのある別の固有名詞に置き換える。
プロファイルとして、前述したように、例えば、「名前、年齢、性別、生年月日、年齢、出身国(国籍)、出身地、使用言語、現住所、職業、業種、趣味等」がある。
扱う数量単位には、例えば、「面積、高さ、深さ、速度、重量、照度、時代、金銭価値、倍率等」がある。
固有名詞を置き換える際、同じ数量単位で表せるのであれば、利用者が分かりやすい異なる分野の固有名詞を使ってもよい。例えば、「大江戸ドームの3倍」の大江戸ドームを言い換える際、サッカーが趣味である利用者であれば野球場ではなく同規模のサッカー場を使う。
For example, the information processing apparatus 100 replaces the proper noun of “a combination of proper nouns and quantitative expressions” with another proper noun familiar to the user in accordance with the profile of the user.
As described above, the profile includes, for example, “name, age, gender, date of birth, age, country of origin (nationality), place of birth, language used, current address, occupation, industry, hobby, etc.”.
Examples of the quantity unit to be handled include “area, height, depth, speed, weight, illuminance, era, monetary value, magnification, etc.”.
When replacing proper nouns, it is possible to use proper nouns from different fields that are easy for the user to understand if they can be expressed in the same unit of measure. For example, when paraphrasing the Oedo Dome, which is “three times larger than the Oedo Dome”, if the user is a hobby of soccer, a soccer field of the same scale is used instead of a baseball field.

図2は、本実施の形態を利用したシステム構成例を示す説明図である。
情報処理装置100、ユーザー端末210A、ユーザー端末210B、データ記憶サーバー220、情報処理サーバー230は、通信回線290を介してそれぞれ接続されている。通信回線290は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。また、情報処理装置100、データ記憶サーバー220、情報処理サーバー230による機能は、クラウドサービスとして実現してもよい。
例えば、ユーザー端末210Aから、情報処理装置100は、原文103を受け取り、置換結果142を返すようにしてもよい。
また、情報処理装置100の代わりに第2の実施の形態である翻訳装置1200を用いた場合、ユーザー端末210Aから原文103を受け取り、翻訳結果1252をユーザー端末210Bに渡すようにしてもよい。
また、情報処理装置100の機能をデータ記憶サーバー220と情報処理サーバー230に分けてもよい。データ記憶サーバー220は、固有名詞記憶モジュール115、プロファイル記憶モジュール130、置換用データ記憶モジュール140を有している。データ記憶サーバー220は、固有名詞記憶モジュール115、プロファイル記憶モジュール130、置換用データ記憶モジュール140を管理して、最新の情報に保つようにしてもよい。また、情報処理サーバー230は、原文受付モジュール105、固有名詞抽出モジュール110、利用者情報受付モジュール120、利用者プロファイル抽出モジュール125、置換モジュール135を有している。情報処理サーバー230は、データ記憶サーバー220内の固有名詞記憶モジュール115、プロファイル記憶モジュール130、置換用データ記憶モジュール140を用いて、原文103内の固有名詞を置換して置換結果142を生成するようにしてもよい。
FIG. 2 is an explanatory diagram showing a system configuration example using the present embodiment.
The information processing apparatus 100, the user terminal 210A, the user terminal 210B, the data storage server 220, and the information processing server 230 are connected to each other via a communication line 290. The communication line 290 may be wireless, wired, or a combination thereof, and may be, for example, the Internet or an intranet as a communication infrastructure. The functions of the information processing apparatus 100, the data storage server 220, and the information processing server 230 may be realized as a cloud service.
For example, the information processing apparatus 100 may receive the original text 103 and return the replacement result 142 from the user terminal 210A.
Further, when the translation apparatus 1200 according to the second embodiment is used instead of the information processing apparatus 100, the original text 103 may be received from the user terminal 210A and the translation result 1252 may be passed to the user terminal 210B.
Further, the functions of the information processing apparatus 100 may be divided into the data storage server 220 and the information processing server 230. The data storage server 220 includes a proper noun storage module 115, a profile storage module 130, and a replacement data storage module 140. The data storage server 220 may manage the proper noun storage module 115, the profile storage module 130, and the replacement data storage module 140 to keep the latest information. The information processing server 230 includes an original text receiving module 105, a proper noun extracting module 110, a user information receiving module 120, a user profile extracting module 125, and a replacement module 135. The information processing server 230 uses the proper noun storage module 115, the profile storage module 130, and the replacement data storage module 140 in the data storage server 220 to replace the proper nouns in the original sentence 103 and generate a replacement result 142. It may be.

図3は、第1の実施の形態による処理例を示すフローチャートである。
ステップS302では、原文受付モジュール105は、原文103を受け付ける。
ステップS304では、固有名詞抽出モジュール110は、固有名詞記憶モジュール115を用いて原文103から固有名詞を探索する。
ステップS306では、置換モジュール135は、固有名詞があるか否かを判断し、ある場合はステップS308へ進み、それ以外の場合は処理を終了する(ステップS399)。
FIG. 3 is a flowchart illustrating a processing example according to the first exemplary embodiment.
In step S <b> 302, the original text receiving module 105 receives the original text 103.
In step S <b> 304, the proper noun extraction module 110 searches for the proper noun from the original sentence 103 using the proper noun storage module 115.
In step S306, the replacement module 135 determines whether or not there is a proper noun. If there is, the process proceeds to step S308, and otherwise, the process ends (step S399).

ステップS308では、置換モジュール135は、固有名詞と近接して、数値+単位があるか否かを判断し、ある場合はステップS310へ進み、それ以外の場合はステップS304へ戻る。
ステップS310では、利用者プロファイル抽出モジュール125は、プロファイル記憶モジュール130からユーザープロファイルを取得する。
ステップS312では、置換モジュール135は、固有名詞の置換語を決定する。
ステップS314では、置換モジュール135は、固有名詞を置換する。
In step S308, the replacement module 135 determines whether there is a numerical value + unit in the vicinity of the proper noun, and if there is, proceeds to step S310, otherwise returns to step S304.
In step S <b> 310, the user profile extraction module 125 acquires a user profile from the profile storage module 130.
In step S312, the replacement module 135 determines a replacement word for the proper noun.
In step S314, the replacement module 135 replaces the proper noun.

図4は、固有名詞対テーブル400のデータ構造例を示す説明図である。固有名詞対テーブル400は、置換用データ記憶モジュール140に記憶されている。固有名詞対テーブル400は、日本固有名詞欄405、米国固有名詞欄410を有している。日本固有名詞欄405は、日本固有名詞を記憶している。米国固有名詞欄410は、米国固有名詞(名詞を含めてもよい)を記憶している。図4の例では、日本における固有名詞とそれに対応する米国における固有名詞とのペアを記憶しているが、他の国におけるペアを記憶していてもよいし、プロファイルに応じたペアを記憶していてもよい。つまり、置換用データ記憶モジュール140内には、固有名詞と置換先の名詞をペアとしたテーブル(固有名詞対テーブル400)を複数記憶している。置換モジュール135は、利用者のプロファイルに応じて、このテーブルを選択すればよい。例えば、利用者のプロファイルとして、国籍が米国である場合は、置換用データ記憶モジュール140から固有名詞対テーブル400を選択して置換に用いるようにすればよい。
また、固有名詞記憶モジュール115が、固有名詞対テーブル400を記憶していてもよい。つまり、原文103からの固有名詞の抽出に、固有名詞対テーブル400(日本固有名詞欄405、米国固有名詞欄410のいずれか一方又は両方)を用いてもよい。
FIG. 4 is an explanatory diagram showing an example of the data structure of the proper noun pair table 400. The proper noun pair table 400 is stored in the replacement data storage module 140. The proper noun pair table 400 has a Japanese proper noun column 405 and a US proper noun column 410. The Japanese proper noun column 405 stores Japanese proper nouns. The US proper noun column 410 stores US proper nouns (which may include nouns). In the example of FIG. 4, pairs of proper nouns in Japan and corresponding proper nouns in the United States are stored, but pairs in other countries may be stored, and pairs corresponding to profiles are stored. It may be. That is, in the replacement data storage module 140, a plurality of tables (proper noun pair table 400) in which proper nouns and replacement destination nouns are paired are stored. The replacement module 135 may select this table according to the user profile. For example, when the user's profile is US, the proper noun pair table 400 may be selected from the replacement data storage module 140 and used for replacement.
The proper noun storage module 115 may store the proper noun pair table 400. That is, the proper noun pair table 400 (one or both of the Japanese proper noun column 405 and the US proper noun column 410) may be used for extracting proper nouns from the original text 103.

図5は、プロファイルテーブル500のデータ構造例を示す説明図である。プロファイルテーブル500は、プロファイル記憶モジュール130に記憶されている。プロファイルテーブル500は、ユーザーID欄505、名前欄510、年齢欄515、性別欄520、国籍欄525、住所欄530、趣味欄535を有している。ユーザーID欄505は、本実施の形態において、ユーザーを一意に識別するための情報(ユーザーID:IDentification)を記憶している。名前欄510は、そのユーザーの名前を記憶している。年齢欄515は、そのユーザーの年齢を記憶している。性別欄520は、そのユーザーの性別を記憶している。国籍欄525は、そのユーザーの国籍を記憶している。住所欄530は、そのユーザーの住所を記憶している。趣味欄535は、そのユーザーの趣味を記憶している。利用者プロファイル抽出モジュール125は、利用者情報118内のユーザーIDを用いて、その利用者の性別、国籍等のプロファイルを抽出する。
そして、置換モジュール135は、そのプロファイルに応じた固有名詞対テーブル400を選択して、置換処理を行う。
FIG. 5 is an explanatory diagram showing an example of the data structure of the profile table 500. The profile table 500 is stored in the profile storage module 130. The profile table 500 includes a user ID column 505, a name column 510, an age column 515, a gender column 520, a nationality column 525, an address column 530, and a hobby column 535. The user ID column 505 stores information (user ID: IDentification) for uniquely identifying a user in the present embodiment. The name column 510 stores the name of the user. The age column 515 stores the age of the user. The gender column 520 stores the gender of the user. The nationality column 525 stores the nationality of the user. The address column 530 stores the address of the user. The hobby column 535 stores the user's hobbies. The user profile extraction module 125 uses the user ID in the user information 118 to extract a profile such as the gender and nationality of the user.
Then, the replacement module 135 selects the proper noun pair table 400 corresponding to the profile and performs a replacement process.

図6は、第1の実施の形態による処理例を示す説明図である。「固有名詞とその固有名詞に近接する数量表現の組み合わせ」を名詞に置換する場合の処理例を示すものである。
原文103として「ネズミーランドは大江戸ドーム10個分の広さです。」を受け付け、利用者がスティングさん610である場合の処理について説明する。なお、原文103は、日本語であることが判明しているとする。例えば、日本語の原文103を受け付けることが既知であっても(予め定められていても)よいし、原文103で用いられている文字コードから、日本語であると判断してもよい。
FIG. 6 is an explanatory diagram illustrating a processing example according to the first exemplary embodiment. The example of a process in the case of replacing "a combination of a proper noun and the quantity expression close to the proper noun" with a noun is shown.
The process when the user 103 is Mr. Sting 610 will be described as accepting “Nezmyland is the size of 10 Oedo Domes” as the original text 103. It is assumed that the original text 103 is known to be in Japanese. For example, it may be known (predetermined) to accept the Japanese original sentence 103, or may be determined to be Japanese from the character code used in the original sentence 103.

固有名詞抽出モジュール110は、原文103から「固有名詞とその固有名詞に近接する数量表現の組み合わせ」として「大江戸ドーム10個分」を抽出する。例えば、原文103から固有名詞記憶モジュール115を用いて固有名詞である「ネズミーランド」と「大江戸ドーム」を抽出する。そして、その固有名詞の前後に数量表現があるものを選択する。ここでは、「10個分」が数量表現であるので、「大江戸ドーム10個分」を「固有名詞とその固有名詞に近接する数量表現の組み合わせ」として抽出する。   The proper noun extraction module 110 extracts “ten Oedo Domes” from the original text 103 as “a combination of proper nouns and quantity expressions close to the proper nouns”. For example, proper names “Nezmy Land” and “Oedo Dome” are extracted from the original text 103 using the proper noun storage module 115. Then, the one having a quantity expression before and after the proper noun is selected. Here, since “10 pieces” is a quantity expression, “10 Oedo Domes” is extracted as “a combination of a proper noun and a quantity expression close to the proper noun”.

一方、利用者であるスティングさん610のプロファイルテーブル500をプロファイル記憶モジュール130から抽出する。スティングさん610の国籍が「アメリカ(米国)」であることが判明する。そこで、日本の固有名詞と米国の名詞のペアで構成されている固有名詞対テーブル400を選択し、「大江戸ドーム」に対応する「イリニドーム」を抽出する。原文103内の「大江戸ドーム」を「イリニドーム」に置換して、置換結果142として「ネズミーランドはイリニドーム10個分の広さです。」を生成する。
なお、置換元の属性(例えば、面積)と類似しているものを置換先の名詞として選択するようにしてもよい。ここで類似とは、両者の差(ここでは面積の差)が予め定められた値以内である場合をいい、完全一致している場合を含む。ここでは、「大江戸ドーム」と「イリニドーム」の面積は、類似している範疇である。また、類似していない場合は、数量表現を変更してもよい。つまり、置換先の属性(例えば、面積)と数量表現Bの積が、置換元の属性(例えば、面積)と数量表現Aの積と、類似するように(「等しくなるように」を含む)数量表現Bを定めればよい。例えば、「大江戸ドーム」の半分の面積である建物等を置換先の名詞とする場合は、数量表現「10個分」を「20個分」と変換する。
On the other hand, the profile table 500 of Mr. Sting 610 who is a user is extracted from the profile storage module 130. It turns out that the nationality of Mr. Sting 610 is “USA”. Therefore, the proper noun pair table 400 composed of pairs of Japanese proper nouns and US nouns is selected, and “Ilinidome” corresponding to “Oedo Dome” is extracted. “Oedo Dome” in the original text 103 is replaced with “Irini Dome” to generate “Nezmy Land is the size of 10 Irini Domes” as the replacement result 142.
In addition, you may make it select the thing similar to the attribute (for example, area) of a replacement source as a noun of a replacement destination. Here, “similar” means a case where a difference between the two (here, a difference in area) is within a predetermined value, and includes a case where they are completely coincident. Here, the areas of “Oedo Dome” and “Ilini Dome” are similar categories. Moreover, when it is not similar, you may change quantity expression. That is, the product of the replacement destination attribute (for example, area) and the quantity expression B is similar to the product of the replacement source attribute (for example, area) and the quantity expression A (including “to be equal”). A quantity expression B may be determined. For example, when a building having a half area of “Oedo Dome” is used as a replacement noun, the quantity expression “10” is converted to “20”.

また、固有名詞対テーブル400の代わりに、属性付固有名詞対テーブル700を用いてもよい。
図7は、属性付固有名詞対テーブル700のデータ構造例を示す説明図である。属性付固有名詞対テーブル700は、固有名詞と名詞と利用者に関する情報とを対応させて記憶しており、日本固有名詞欄705、米国固有名詞欄710、属性欄715を有している。日本固有名詞欄705は、日本固有名詞を記憶している。米国固有名詞欄710は、米国固有名詞を記憶している。属性欄715は、属性を記憶している。つまり、固有名詞対テーブル400に属性欄715を付加したものである。例えば、「大江戸ドーム」を置換するのに、利用者のプロファイル(ここでは性別)が一致する属性である置換先の名詞を選択してもよい。図6の例では、スティングさん610は男性であるので、属性付固有名詞対テーブル700の1行目の「イリニドーム」を置換先として選択する。なお、1つの置換元に対応する置換先が複数ある場合に、属性欄715を用いるようにしてもよい。
Further, instead of the proper noun pair table 400, an attributed proper noun pair table 700 may be used.
FIG. 7 is an explanatory diagram showing an example of the data structure of the attributed proper noun pair table 700. The attributed proper noun pair table 700 stores proper nouns, nouns, and information on users in association with each other, and has a Japanese proper noun column 705, a US proper noun column 710, and an attribute column 715. The Japanese proper noun column 705 stores Japanese proper nouns. The US proper noun column 710 stores US proper nouns. The attribute column 715 stores attributes. That is, the attribute column 715 is added to the proper noun pair table 400. For example, in order to replace “Oedo Dome”, a replacement noun that is an attribute with a matching user profile (here, gender) may be selected. In the example of FIG. 6, since Mr. Sting 610 is a male, “Ilinidome” on the first line of the attributed proper noun pair table 700 is selected as a replacement destination. Note that the attribute column 715 may be used when there are a plurality of replacement destinations corresponding to one replacement source.

また、置換モジュール135は、カテゴリーツリーを用いて、置換処理を行うようにしてもよい。
図8は、カテゴリーツリーのデータ構造例を示す説明図である。ノード(建物)802の下にノード(競技場)804、ノード(イベント会場)806があり、ノード(競技場)804の下にノード(エディンスタースタジアム)808、ノード(Aスタジアム)810、ノード(大江戸ドーム)812があり、ノード(イベント会場)806の下にノード(大江戸ドーム)812、ノード(天領ビッグサイト)814があり、ノード(エディンスタースタジアム)808の下にノード(属性)816があり、ノード(Aスタジアム)810の下にノード(属性)818があり、ノード(大江戸ドーム)812の下にノード(属性)820があり、ノード(天領ビッグサイト)814の下にノード(属性)822がある。
なお、2階層目までのノードであるノード(建物)802、ノード(競技場)804、ノード(イベント会場)806は、カテゴリーを示しており、3階層目のノードであるノード(エディンスタースタジアム)808、ノード(Aスタジアム)810、ノード(大江戸ドーム)812、ノード(天領ビッグサイト)814は、固有名詞を示しており、4階層目のノードであるノード(属性)816、ノード(属性)818、ノード(属性)820、ノード(属性)822は、その固有名詞の関連プロファイル(属性)を示している。
Further, the replacement module 135 may perform replacement processing using a category tree.
FIG. 8 is an explanatory diagram showing an example of the data structure of a category tree. There are a node (stadium) 804 and a node (event venue) 806 under the node (building) 802, and a node (Edinster Stadium) 808, a node (A stadium) 810, a node ( Oedo Dome) 812, node (Event Edo Dome) 812 under node (Event Venue) 806, node (Tenry Big Site) 814, and node (attribute) 816 under Node (Edinster Stadium) 808 There is a node (attribute) 818 under the node (A stadium) 810, a node (attribute) 820 under the node (Oedo Dome) 812, and a node ( Attribute) 822.
Note that a node (building) 802, a node (stadium) 804, and a node (event venue) 806 that are nodes up to the second level indicate categories, and a node (Edinster Stadium) that is a node in the third level. 808, a node (A stadium) 810, a node (Oedo Dome) 812, and a node (Tenryu Big Site) 814 indicate proper nouns, and a node (attribute) 816, which is a node in the fourth layer, and a node (attribute) Reference numeral 818, a node (attribute) 820, and a node (attribute) 822 indicate a related profile (attribute) of the proper noun.

固有名詞ノード(3階層目のノード)と関連プロファイルノード(4階層目のノード)の対は、固有名詞プロファイルテーブル900として実現してもよい。
図9は、固有名詞プロファイルテーブル900のデータ構造例を示す説明図である。固有名詞プロファイルテーブル900は、固有名詞欄905、国欄910、用途欄915、大きさ欄920を有している。固有名詞欄905は、固有名詞を記憶している。国欄910は、その固有名詞が示すモノがある国を記憶している。用途欄915は、その固有名詞が示すモノの用途を記憶している。大きさ欄920は、その固有名詞が示すモノの大きさを記憶している。その他の属性(例えば、性別(具体的には、男性が使うことが多い等))を含めてもよい。
A pair of a proper noun node (third layer node) and a related profile node (fourth layer node) may be realized as a proper noun profile table 900.
FIG. 9 is an explanatory diagram showing an example of the data structure of the proper noun profile table 900. The proper noun profile table 900 has a proper noun column 905, a country column 910, a usage column 915, and a size column 920. The proper noun column 905 stores proper nouns. The country column 910 stores the country where the thing indicated by the proper noun is located. The usage column 915 stores the usage of the object indicated by the proper noun. The size column 920 stores the size of the object indicated by the proper noun. Other attributes (for example, gender (specifically, often used by men)) may be included.

置換モジュール135は、図8の例で示したカテゴリーツリーを用いて、以下の処理を行ってもよい。
(1)置換元の固有名詞「大江戸ドーム」のノードをカテゴリーツリーから探索する。そのノードに対応する属性を抽出する。具体的には、そのノードに接続している4階層目のノードを抽出すればよい。そして、そのノードが含まれるカテゴリーを抽出する。具体的には、そのノードに接続している上位のノードを抽出すればよい。
The replacement module 135 may perform the following processing using the category tree shown in the example of FIG.
(1) A node of the proper noun “Oedo Dome” as a replacement source is searched from the category tree. The attribute corresponding to the node is extracted. Specifically, it is only necessary to extract the fourth layer node connected to the node. Then, the category including the node is extracted. Specifically, a higher-level node connected to the node may be extracted.

(2)抽出した属性、カテゴリーと利用者のプロファイルから検索用プロファイルを作成する。例えば、抽出した属性、カテゴリーと利用者のプロファイルをマージして、検索用プロファイルとしてもよい。なお、どのような属性をマージ対象とするかについては予め定められている。
例えば、図10(a)に示す利用者プロファイルテーブル1000の1行目と、ノード(属性)820をマージして、図10(b)に示す検索用プロファイルテーブル1050を生成する。なお、利用者プロファイルテーブル1000のデータ構造は、図5の例に示すプロファイルテーブル500と同等である。検索用プロファイルテーブル1050は、検索プロファイルID欄1055、国欄1060、趣味欄1065、大きさ欄1070を有している。検索プロファイルID欄1055は、本実施の形態において、検索プロファイルを一意に識別するための情報(検索プロファイルID)を記憶している。国欄1060は、国を記憶している。趣味欄1065は、趣味を記憶している。大きさ欄1070は、大きさを記憶している。この例は、国欄1060として、利用者プロファイルテーブル1000の国籍欄1025を採用し、趣味欄1065として、利用者プロファイルテーブル1000の趣味欄1035と固有名詞プロファイルテーブル900の用途欄915の両方を採用し、大きさ欄1070として、固有名詞プロファイルテーブル900の大きさ欄920を採用している。
(2) Create a search profile from the extracted attributes, categories, and user profiles. For example, the extracted attribute / category and the user profile may be merged to form a search profile. Note that what attributes are to be merged is predetermined.
For example, the first row of the user profile table 1000 shown in FIG. 10A and the node (attribute) 820 are merged to generate the search profile table 1050 shown in FIG. The data structure of the user profile table 1000 is the same as that of the profile table 500 shown in the example of FIG. The search profile table 1050 includes a search profile ID column 1055, a country column 1060, a hobby column 1065, and a size column 1070. The search profile ID column 1055 stores information (search profile ID) for uniquely identifying the search profile in the present embodiment. The country column 1060 stores the country. The hobby column 1065 stores hobbies. The size column 1070 stores the size. In this example, the nationality column 1025 of the user profile table 1000 is adopted as the country column 1060, and both the hobby column 1035 of the user profile table 1000 and the usage column 915 of the proper noun profile table 900 are adopted as the hobby column 1065. As the size column 1070, the size column 920 of the proper noun profile table 900 is adopted.

(3)カテゴリーツリー内で、置換元のノードであるノード(大江戸ドーム)812を下位に含んでいる上位のノードに戻り、その下位にあるノードの属性(4階層目のノード)と検索用プロファイルテーブル1050との一致度によって、置換先の名詞(ノード)を選択するようにしてもよい。
具体的には、図11の例に示すカテゴリーツリー内の太矢印線のように、ノード(大江戸ドーム)812の1つ上位にあるノード(競技場)804に戻り、その下位にあるノード(ノード(エディンスタースタジアム)808、ノード(Aスタジアム)810)を対象として、その属性(ノード(属性)816、ノード(属性)818)と検索用プロファイル(検索用プロファイルテーブル1050)とを比較する。なお、ここで、ノード(エディンスタースタジアム)808、ノード(Aスタジアム)810内の名詞が、ノード(競技場)804に類似する名詞となる。同じ上位ノードであるノード(競技場)804を有しているからである。比較した結果である一致度が予め定められた閾値以上である名詞(3階層目のノード)を、置換先の名詞とする。例えば、ノード(属性)816と検索用プロファイルテーブル1050との一致度が予め定められた閾値以上となり、ノード(エディンスタースタジアム)808の「エディンスタースタジアム」が置換先の名詞として選択される。
ここでの一致度は、属性(ノード(属性)816、ノード(属性)818)と検索用プロファイル(検索用プロファイルテーブル1050)内の一致した項目数の全項目数に対する割合としてもよい。ここで「一致した項目数」とは、具体的には、検索用プロファイルテーブル1050内の一致した欄数を示しており、「全項目数」とは、具体的には、検索用プロファイルテーブル1050内の全欄数を示している。
一致度が予め定められた閾値以上である名詞がない場合は、さらに、上位のノードに戻って、その下位にあるノードを検索対象とする。図11に示す例では、ノード(競技場)804の上位であるノード(建物)802に戻り、その下位にあるノード(イベント会場)806の下位にあるノードも検索対象とする。
そして、カテゴリーツリーのルートに戻っても、一致度が予め定められた閾値以上である名詞がない場合は、置換を行わない。
(3) In the category tree, return to the upper node that includes the node (Oedo Dome) 812, which is the replacement source node, and the attributes of the lower node (node in the fourth layer) and for search The replacement noun (node) may be selected according to the degree of coincidence with the profile table 1050.
Specifically, as indicated by a thick arrow line in the category tree shown in the example of FIG. 11, the node (stadium) 804, which is one level higher than the node (Oedo Dome) 812, is returned to a node ( For nodes (Edinster Stadium) 808 and node (A Stadium) 810), the attributes (node (attribute) 816, node (attribute) 818) are compared with the search profile (search profile table 1050). Here, the nouns in the node (Edinster Stadium) 808 and the node (A stadium) 810 are nouns similar to the node (stadium) 804. This is because it has a node (stadium) 804 which is the same upper node. A noun (a node in the third hierarchy) whose matching degree, which is a result of the comparison, is equal to or higher than a predetermined threshold is set as a replacement noun. For example, the degree of coincidence between the node (attribute) 816 and the search profile table 1050 is equal to or greater than a predetermined threshold value, and “Edinster Stadium” of the node (Edinster Stadium) 808 is selected as a replacement destination noun.
Here, the matching degree may be a ratio of the number of matched items in the attributes (node (attribute) 816, node (attribute) 818) and the search profile (search profile table 1050) to the total number of items. Here, the “number of matched items” specifically indicates the number of matched columns in the search profile table 1050, and the “total number of items” specifically indicates the search profile table 1050. Indicates the total number of columns.
If there is no noun whose degree of matching is equal to or higher than a predetermined threshold, the process returns to the higher node and the lower node is set as the search target. In the example illustrated in FIG. 11, the node (building) 802 that is higher than the node (stadium) 804 is returned to, and the node that is lower than the node (event venue) 806 that is lower than that is also the search target.
And even if it returns to the root | route of a category tree, when there is no noun whose matching degree is more than a predetermined threshold value, substitution is not performed.

<第2の実施の形態>
図12は、第2の実施の形態の構成例についての概念的なモジュール構成図を示している。第2の実施の形態では、第1の実施の形態による処理結果(置換結果142)を対象とした翻訳を行うものである。固有名詞が翻訳先の言語で用いられている名詞に変更されているので、一般的な翻訳処理を行うことによって、翻訳先の言語に適した名詞を用いることができるようになる。つまり、翻訳が難しい固有名詞であっても、事前に翻訳先にある名詞に変更しているため翻訳が可能になる。
なお、第1の実施の形態と同種の部位には同一符号を付し重複した説明を省略する。また、図2に示すシステム構成例にあっては、情報処理装置100を翻訳装置1200に置きかえてもよいし、翻訳装置1200を通信回線290に通信可能に追加してもよい。
<Second Embodiment>
FIG. 12 is a conceptual module configuration diagram of a configuration example according to the second embodiment. In the second embodiment, translation is performed on the processing result (replacement result 142) according to the first embodiment. Since the proper noun is changed to a noun used in the language of the translation destination, a noun suitable for the language of the translation destination can be used by performing a general translation process. That is, even a proper noun that is difficult to translate can be translated because it has been changed in advance to a noun in the translation destination.
In addition, the same code | symbol is attached | subjected to the site | part of the same kind as 1st Embodiment, and the overlapping description is abbreviate | omitted. In the system configuration example shown in FIG. 2, the information processing apparatus 100 may be replaced with the translation apparatus 1200, or the translation apparatus 1200 may be added to the communication line 290 so as to be communicable.

翻訳装置1200は、情報処理装置100、利用者プロファイル抽出モジュール125を有している。
情報処理装置100は、翻訳モジュール1250と接続されており、原文103、利用者情報118を受け付け、翻訳モジュール1250に置換結果142を渡す。
情報処理装置100内の原文受付モジュール105は、第1の言語(翻訳元の言語)で記載された文を受け付けるようにしてもよい。
翻訳モジュール1250は、情報処理装置100と接続されており、情報処理装置100より置換結果142を受け取り、翻訳結果1252を出力する。翻訳モジュール1250は、情報処理装置100(置換モジュール135)によって固有名詞が置換された文(置換結果142)を、第1の言語とは異なっており、かつ、利用者が用いる第2の言語(翻訳先の言語)に翻訳する。なお、翻訳処理は、既に知られた翻訳処理を用いればよい。
翻訳装置1200によって「固有名詞」又は「固有名詞と数量表現の組み合わせ」を置換して翻訳した場合、翻訳結果1252の利用者に合わせた名詞に変換でき、読者である利用者の知識や経験を基にした相対的、感情的な数量を伝える表現が可能になる。
The translation apparatus 1200 includes the information processing apparatus 100 and a user profile extraction module 125.
The information processing apparatus 100 is connected to the translation module 1250, receives the original text 103 and the user information 118, and passes the replacement result 142 to the translation module 1250.
The original text receiving module 105 in the information processing apparatus 100 may receive a text written in the first language (translation source language).
Translation module 1250 is connected to information processing apparatus 100, receives replacement result 142 from information processing apparatus 100, and outputs translation result 1252. The translation module 1250 differs from the first language in the sentence in which the proper noun is replaced by the information processing apparatus 100 (replacement module 135) (the replacement result 142), and the second language used by the user ( Translate to the target language. For the translation process, a known translation process may be used.
When the translation device 1200 translates “proprietary noun” or “combination of proper noun and quantity expression”, it can be converted into a noun suitable for the user of the translation result 1252, and the knowledge and experience of the reader user can be obtained. It is possible to express relative and emotional quantities based on them.

図13は、第2の実施の形態による処理例を示す説明図である。図6の例に対応するものであり、スティングさん610による指示1310(「日本語から英語に!」)にしたがって、置換結果142を翻訳結果1252(「Nezmeyland is the size of 10 Illini Dome.」)に翻訳する。   FIG. 13 is an explanatory diagram illustrating a processing example according to the second exemplary embodiment. 6 corresponds to the example of FIG. 6, and the replacement result 142 is converted into the translation result 1252 (“Nezmeyland is the size of 10 Illini Dome.”) In accordance with the instruction 1310 (“from Japanese to English!”) By Mr. Sting. Translate to

なお、本実施の形態としてのプログラムが実行されるコンピュータのハードウェア構成は、図14に例示するように、一般的なコンピュータであり、具体的にはパーソナルコンピュータ、サーバーとなり得るコンピュータ等である。つまり、具体例として、処理部(演算部)としてCPU1401を用い、記憶装置としてRAM1402、ROM1403、HD1404を用いている。HD1404として、例えばハードディスク、SSD(Solid State Drive)を用いてもよい。原文受付モジュール105、固有名詞抽出モジュール110、利用者情報受付モジュール120、利用者プロファイル抽出モジュール125、置換モジュール135、翻訳モジュール1250等のプログラムを実行するCPU1401と、そのプログラムやデータを記憶するRAM1402と、本コンピュータを起動するためのプログラム等が格納されているROM1403と、固有名詞記憶モジュール115、プロファイル記憶モジュール130、置換用データ記憶モジュール140としての機能を有する補助記憶装置(フラッシュ・メモリ等であってもよい)であるHD1404と、キーボード、マウス、タッチスクリーン、マイク等に対する利用者の操作に基づいてデータを受け付ける受付装置1406と、CRT、液晶ディスプレイ、スピーカー等の出力装置1405と、ネットワークインタフェースカード等の通信ネットワークと接続するための通信回線インタフェース1407、そして、それらをつないでデータのやりとりをするためのバス1408により構成されている。これらのコンピュータが複数台互いにネットワークによって接続されていてもよい。   Note that the hardware configuration of a computer on which the program according to the present embodiment is executed is a general computer as illustrated in FIG. 14, specifically, a personal computer, a computer that can be a server, or the like. That is, as a specific example, the CPU 1401 is used as a processing unit (calculation unit), and the RAM 1402, the ROM 1403, and the HD 1404 are used as storage devices. As the HD 1404, for example, a hard disk or an SSD (Solid State Drive) may be used. A CPU 1401 that executes programs such as an original text receiving module 105, a proper noun extracting module 110, a user information receiving module 120, a user profile extracting module 125, a replacement module 135, a translation module 1250, and a RAM 1402 that stores the programs and data. A ROM 1403 storing a program for starting the computer, an auxiliary storage device (a flash memory or the like) having functions as a proper noun storage module 115, a profile storage module 130, and a replacement data storage module 140. A receiving device 1406 that accepts data based on user operations on a keyboard, mouse, touch screen, microphone, etc., a CRT, and a liquid crystal display An output device 1405 such as a speaker, a communication line interface 1407 for connecting to a communication network such as a network interface card, and, and a bus 1408 for exchanging data by connecting them. A plurality of these computers may be connected to each other via a network.

前述の実施の形態のうち、コンピュータ・プログラムによるものについては、本ハードウェア構成のシステムにソフトウェアであるコンピュータ・プログラムを読み込ませ、ソフトウェアとハードウェア資源とが協働して、前述の実施の形態が実現される。
なお、図14に示すハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図14に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続している形態でもよく、さらに図14に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器(携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む)、情報家電、ロボット、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
Among the above-described embodiments, the computer program is a computer program that reads the computer program, which is software, in the hardware configuration system, and the software and hardware resources cooperate with each other. Is realized.
Note that the hardware configuration illustrated in FIG. 14 illustrates one configuration example, and the present embodiment is not limited to the configuration illustrated in FIG. 14, and is a configuration capable of executing the modules described in the present embodiment. I just need it. For example, some modules may be configured with dedicated hardware (for example, Application Specific Integrated Circuit (ASIC), etc.), and some modules are in an external system and connected via a communication line In addition, a plurality of systems shown in FIG. 14 may be connected to each other via communication lines so as to cooperate with each other. In particular, in addition to personal computers, portable information communication devices (including mobile phones, smartphones, mobile devices, wearable computers, etc.), information appliances, robots, copiers, fax machines, scanners, printers, multifunction devices (scanners, printers, An image processing apparatus having two or more functions such as a copying machine and a fax machine) may be incorporated.

また、前述の実施の形態の説明内での比較処理において、「以上」、「以下」、「より大きい」、「より小さい(未満)」としたものは、その組み合わせに矛盾が生じない限り、それぞれ「より大きい」、「より小さい(未満)」、「以上」、「以下」としてもよい。   In addition, in the comparison processing in the description of the above-described embodiment, “more than”, “less than”, “greater than”, and “less than (less than)” The values may be “larger”, “smaller (less than)”, “more than”, and “less than”, respectively.

なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラムの全体又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分若しくは全部であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
The program described above may be provided by being stored in a recording medium, or the program may be provided by communication means. In that case, for example, the above-described program may be regarded as an invention of a “computer-readable recording medium recording the program”.
The “computer-readable recording medium on which a program is recorded” refers to a computer-readable recording medium on which a program is recorded, which is used for program installation, execution, program distribution, and the like.
The recording medium is, for example, a digital versatile disc (DVD), which is a standard established by the DVD Forum, such as “DVD-R, DVD-RW, DVD-RAM,” and DVD + RW. Standard “DVD + R, DVD + RW, etc.”, compact disc (CD), read-only memory (CD-ROM), CD recordable (CD-R), CD rewritable (CD-RW), Blu-ray disc ( Blu-ray (registered trademark) Disc), magneto-optical disk (MO), flexible disk (FD), magnetic tape, hard disk, read-only memory (ROM), electrically erasable and rewritable read-only memory (EEPROM (registered trademark)) )), Flash memory, Random access memory (RAM) SD (Secure Digital) memory card and the like.
Then, the whole or a part of the program may be recorded on the recording medium for storage or distribution. Also, by communication, for example, a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), a wired network used for the Internet, an intranet, an extranet, or a wireless communication It may be transmitted using a transmission medium such as a network or a combination of these, or may be carried on a carrier wave.
Furthermore, the program may be a part or all of another program, or may be recorded on a recording medium together with a separate program. Moreover, it may be divided and recorded on a plurality of recording media. Further, it may be recorded in any manner as long as it can be restored, such as compression or encryption.

100…情報処理装置
103…原文
105…原文受付モジュール
110…固有名詞抽出モジュール
115…固有名詞記憶モジュール
118…利用者情報
120…利用者情報受付モジュール
125…利用者プロファイル抽出モジュール
130…プロファイル記憶モジュール
135…置換モジュール
140…置換用データ記憶モジュール
142…置換結果
210…ユーザー端末
220…データ記憶サーバー
230…情報処理サーバー
290…通信回線
1200…翻訳装置
1250…翻訳モジュール
1252…翻訳結果
DESCRIPTION OF SYMBOLS 100 ... Information processing apparatus 103 ... Original sentence 105 ... Original sentence reception module 110 ... Proper noun extraction module 115 ... Proper noun storage module 118 ... User information 120 ... User information reception module 125 ... User profile extraction module 130 ... Profile storage module 135 Replacement module 140 Replacement data storage module 142 Replacement result 210 User terminal 220 Data storage server 230 Information processing server 290 Communication line 1200 Translation apparatus 1250 Translation module 1252 Translation result

Claims (8)

少なくとも固有名詞を含む文を受け付ける受付手段と、
本情報処理装置によって処理された文を利用する利用者に関する情報を取得する取得手段と、
前記利用者に関する情報を用いて、前記固有名詞を別の名詞に置換する置換手段
を有する情報処理装置。
A receiving means for receiving a sentence including at least a proper noun;
Obtaining means for obtaining information about a user who uses the sentence processed by the information processing apparatus;
An information processing apparatus comprising: replacement means for replacing the proper noun with another noun using information about the user.
前記置換手段は、置換する前記別の名詞を、前記利用者の使用言語にしたがって置換する、
請求項1に記載の情報処理装置。
The replacement means replaces the another noun to be replaced according to the language used by the user.
The information processing apparatus according to claim 1.
前記受付手段が受付けた文は第1の言語で記載されており、
固有名詞が置換された文を、前記第1の言語とは異なっており、かつ前記利用者が用いる言語である第2の言語に翻訳する翻訳手段
をさらに有する請求項2に記載の情報処理装置。
The sentence accepted by the accepting means is written in the first language,
The information processing apparatus according to claim 2, further comprising a translation unit that translates the sentence in which the proper noun is replaced into a second language that is different from the first language and that is used by the user. .
前記置換手段は、固有名詞と名詞と利用者に関する情報とを対応させて記憶している記憶手段を用いて、前記固有名詞を別の名詞に置換する、
請求項1に記載の情報処理装置。
The replacement means replaces the proper noun with another noun using storage means that stores the proper noun, the noun and the information about the user in association with each other.
The information processing apparatus according to claim 1.
前記置換手段は、固有名詞に類似する名詞に関する情報と、前記利用者に関する情報を比較することによって、前記固有名詞を別の名詞に置換する、
請求項1に記載の情報処理装置。
The replacement means replaces the proper noun with another noun by comparing information on the noun similar to the proper noun and information on the user.
The information processing apparatus according to claim 1.
前記置換手段は、前記名詞を、現在使われている名詞に変更する、
請求項4又は5に記載の情報処理装置。
The replacement means changes the noun to a currently used noun,
The information processing apparatus according to claim 4 or 5.
前記固有名詞を、固有名詞と該固有名詞に近接する数量表現の組み合わせとする、
請求項1から6のいずれか1項に記載の情報処理装置。
The proper noun is a combination of a proper noun and a quantitative expression close to the proper noun,
The information processing apparatus according to any one of claims 1 to 6.
情報処理装置であるコンピュータを、
少なくとも固有名詞を含む文を受け付ける受付手段と、
前記情報処理装置によって処理された文を利用する利用者に関する情報を取得する取得手段と、
前記利用者に関する情報を用いて、前記固有名詞を別の名詞に置換する置換手段
として機能させるための情報処理プログラム。
A computer that is an information processing device
A receiving means for receiving a sentence including at least a proper noun;
Obtaining means for obtaining information relating to a user who uses the sentence processed by the information processing apparatus;
An information processing program for functioning as replacement means for replacing the proper noun with another noun using information on the user.
JP2017041259A 2017-03-06 2017-03-06 Information processing equipment and information processing programs Active JP6897168B2 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2017041259A JP6897168B2 (en) 2017-03-06 2017-03-06 Information processing equipment and information processing programs
US15/701,788 US20180253417A1 (en) 2017-03-06 2017-09-12 Information processing device and non-transitory computer readable medium
CN201710903912.3A CN108536685B (en) 2017-03-06 2017-09-29 Information processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017041259A JP6897168B2 (en) 2017-03-06 2017-03-06 Information processing equipment and information processing programs

Publications (2)

Publication Number Publication Date
JP2018147205A true JP2018147205A (en) 2018-09-20
JP6897168B2 JP6897168B2 (en) 2021-06-30

Family

ID=63355698

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017041259A Active JP6897168B2 (en) 2017-03-06 2017-03-06 Information processing equipment and information processing programs

Country Status (3)

Country Link
US (1) US20180253417A1 (en)
JP (1) JP6897168B2 (en)
CN (1) CN108536685B (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7334434B2 (en) * 2019-03-19 2023-08-29 富士フイルムビジネスイノベーション株式会社 Document search result presentation device, program, and document search result presentation system

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006185311A (en) * 2004-12-28 2006-07-13 Nec Corp Device, method and program for setting document anonymity, and document management device
JP2008269014A (en) * 2007-04-16 2008-11-06 Yahoo Japan Corp Name conversion recognition device and method
US20090172539A1 (en) * 2007-12-28 2009-07-02 Cary Lee Bates Conversation Abstractions Based on Trust Levels in a Virtual World

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5956668A (en) * 1997-07-18 1999-09-21 At&T Corp. Method and apparatus for speech translation with unrecognized segments
JP4356745B2 (en) * 2004-03-18 2009-11-04 日本電気株式会社 Machine translation system, machine translation method and program
EP1826682A1 (en) * 2004-11-12 2007-08-29 JustSystems Corporation Document managing device and document managing method
JP4645242B2 (en) * 2005-03-14 2011-03-09 富士ゼロックス株式会社 Question answering system, data retrieval method, and computer program
US7555475B2 (en) * 2005-03-31 2009-06-30 Jiles, Inc. Natural language based search engine for handling pronouns and methods of use therefor
JP2007207127A (en) * 2006-02-04 2007-08-16 Fuji Xerox Co Ltd Question answering system, question answering processing method and question answering program
WO2007108788A2 (en) * 2006-03-13 2007-09-27 Answers Corporation Method and system for answer extraction
CN101815996A (en) * 2007-06-01 2010-08-25 谷歌股份有限公司 Detect name entities and neologisms
JP5812534B2 (en) * 2012-06-04 2015-11-17 日本電信電話株式会社 Question answering apparatus, method, and program
JP2014206916A (en) * 2013-04-15 2014-10-30 株式会社日立製作所 Work history analysis device, work history analysis system and work history analysis method
JP2016031733A (en) * 2014-07-30 2016-03-07 富士通株式会社 Inference easiness calculation program, apparatus and method
US10127212B1 (en) * 2015-10-14 2018-11-13 Google Llc Correcting errors in copied text
AU2016346341B2 (en) * 2015-10-26 2019-08-08 [24]7.ai, Inc. Method and apparatus for facilitating customer intent prediction
KR102565275B1 (en) * 2016-08-10 2023-08-09 삼성전자주식회사 Translating method and apparatus based on parallel processing
KR102329127B1 (en) * 2017-04-11 2021-11-22 삼성전자주식회사 Apparatus and method for converting dialect into standard language

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006185311A (en) * 2004-12-28 2006-07-13 Nec Corp Device, method and program for setting document anonymity, and document management device
JP2008269014A (en) * 2007-04-16 2008-11-06 Yahoo Japan Corp Name conversion recognition device and method
US20090172539A1 (en) * 2007-12-28 2009-07-02 Cary Lee Bates Conversation Abstractions Based on Trust Levels in a Virtual World

Also Published As

Publication number Publication date
JP6897168B2 (en) 2021-06-30
CN108536685B (en) 2023-08-22
US20180253417A1 (en) 2018-09-06
CN108536685A (en) 2018-09-14

Similar Documents

Publication Publication Date Title
US9262403B2 (en) Dynamic generation of auto-suggest dictionary for natural language translation
KR101326354B1 (en) Transliteration device, recording medium, and method
JP4058071B2 (en) Example translation device, example translation method, and example translation program
JP2007257644A (en) Program, method and device for acquiring translation word based on translation word candidate character string prediction
JP2015201169A (en) Translation result providing method and system based on various semantic categories
US10402474B2 (en) Keyboard input corresponding to multiple languages
JP4502615B2 (en) Similar sentence search device, similar sentence search method, and program
JP2008083994A (en) Dictionary registration device, dictionary registration method, and dictionary registration program
CN107148624A (en) The method of preprocessed text and the pretreatment system for performing this method
JP2010134922A (en) Similar word determination method and system
US10650195B2 (en) Translated-clause generating method, translated-clause generating apparatus, and recording medium
JP6705352B2 (en) Language processing device, language processing method, and language processing program
KR20190090636A (en) Method for automatically editing pattern of document
JP7027757B2 (en) Information processing equipment and information processing programs
JP6897168B2 (en) Information processing equipment and information processing programs
US8135573B2 (en) Apparatus, method, and computer program product for creating data for learning word translation
WO2019225560A1 (en) Search word suggestion device, method for generating unique expression information, and program for generating unique expression information
JP2014137613A (en) Translation support program, method and device
JPWO2009069239A1 (en) Map information processing device
JP6203083B2 (en) Unknown word extraction device and unknown word extraction method
WO2009144890A1 (en) Pre-translation rephrasing rule generating system
JP6076285B2 (en) Translation apparatus, translation method, and translation program
US20240037129A1 (en) Search device, search method, and recording medium
JP6626029B2 (en) Information processing apparatus, information processing method and program
JP2009230705A (en) Template preparation device, device and method for preparing document data, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200121

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201014

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201020

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210511

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210524

R150 Certificate of patent or registration of utility model

Ref document number: 6897168

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150