JPH1145245A - Foreign language sentence interpretation support system, storing medium for storing foreign language sentence interpretation support program and method for foreign language sentence interpretation support - Google Patents

Foreign language sentence interpretation support system, storing medium for storing foreign language sentence interpretation support program and method for foreign language sentence interpretation support

Info

Publication number
JPH1145245A
JPH1145245A JP9217129A JP21712997A JPH1145245A JP H1145245 A JPH1145245 A JP H1145245A JP 9217129 A JP9217129 A JP 9217129A JP 21712997 A JP21712997 A JP 21712997A JP H1145245 A JPH1145245 A JP H1145245A
Authority
JP
Japan
Prior art keywords
translated
translation
target document
foreign language
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9217129A
Other languages
Japanese (ja)
Inventor
Naoyuki Nomura
直之 野村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP9217129A priority Critical patent/JPH1145245A/en
Publication of JPH1145245A publication Critical patent/JPH1145245A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To provide a system for foreign language sentence interpretation support system that can obtain more natural translation results. SOLUTION: At the outset, specific non-translated words and phrases such as compound noun phrase or the like are extracted from a translation object document (in English and so on) by a natural language processing. Then, the whole object document is translated by converting part of non-translated words and phrases to katakana Japanese syllabary transcription without translating the part of non-translated words and phrases word by word. Thus, reading as the whole text of which the contents are known becomes easy by transcribing katakana, for example 'AKUSHON MANEJA' instead of strangely translating 'Action Manager' word by word. Also, since even a user who does not know the contents can read other parts on the assumption that they are written in special words and phrases rather than an obscure verbatim translation, he can go on reading without being confused.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、外国語文読解支援
システム、外国語文読解支援プログラムが記憶された記
憶媒体、及び外国語文読解支援方法に係り、詳細には、
取得した文書の翻訳に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a foreign language reading comprehension support system, a storage medium storing a foreign language reading comprehension support program, and a foreign language reading comprehension support method.
Regarding translation of acquired documents.

【0002】[0002]

【従来の技術】外国語で記載された文書を日本語の文書
に翻訳するシステムのように、所定の言語で作成された
文書(外国語文)をそれと異なる言語の文書に翻訳する
翻訳システムが実用化されている。翻訳システムは、イ
ンターネットやパソコン通信等の各種通信により自由に
且つ大量に情報を入手できるようになった現在では、広
く使用されるようになってきている。この翻訳システム
では、翻訳用の辞書を使用して原文(翻訳対象文書)を
一定のアルゴリズムに従って所定の言語に翻訳してい
る。翻訳は比較的短時間で行われるため、通信を行って
いる場合に外国語で作成されたホームページを理解する
うえで有効である。
2. Description of the Related Art A translation system for translating a document (foreign language sentence) created in a predetermined language into a document in a different language, such as a system for translating a document written in a foreign language into a Japanese document, is practical. Has been 2. Description of the Related Art Translation systems have been widely used nowadays when information can be freely and massively obtained through various communications such as the Internet and personal computer communications. In this translation system, an original sentence (translation target document) is translated into a predetermined language according to a predetermined algorithm using a dictionary for translation. Since translation is performed in a relatively short time, it is effective in understanding a homepage created in a foreign language when communicating.

【0003】[0003]

【発明が解決しようとする課題】しかし、従来の翻訳シ
ステムでは、辞書中に存在しない語句が原文中にある
と、その語句を逐語訳しているため、文全体としてよく
わからない翻訳になったり、時には読解不能になる場合
もあった。これは、本来一体として意味をなすべき複合
名詞句等の語句を正確に認識できていないにもかかわら
ず、これらの語句おを分離して逐語訳をしてしまうため
である。例えば、図13に示すように、「Action Manag
er is now varing. So…」といった原文に対して、従来
の翻訳システムでは、翻訳辞書に存在しない「Action M
anager」の部分を逐語訳により「演技課長」と翻訳して
しまう。その結果、「演技課長は、今や多様化してい
る。従って…」という翻訳文では何のことかよくわから
なかった。
However, in a conventional translation system, if a word that does not exist in the dictionary is present in the original sentence, the word is translated verbatim. In some cases, it became impossible to read. This is because, although words such as compound noun phrases, which should originally have meaning as a unit, cannot be accurately recognized, these words are separated and word-for-word translated. For example, as shown in FIG.
er is now varing. So… ”, the conventional translation system uses“ Action M
The word "anager" is translated into "acting section manager" by word-by-word translation. As a result, the translation "The acting section manager is now diversified. So ..."didn't make much sense.

【0004】そこで本発明は、前記従来の課題を解決す
るために成されたもので、より自然な翻訳結果を得るこ
とが可能な外国語文読解支援システムを提供することを
第1の目的とする。また本発明は、より自然な翻訳結果
を得ることが可能な外国語文読解支援プログラムが記憶
された記憶媒体を提供することを第2の目的とする。ま
た本発明は、より自然な翻訳結果を得ることが可能な外
国語文読解支援方法を提供することを第3の目的とす
る。
The present invention has been made to solve the above-mentioned conventional problems, and has as its first object to provide a foreign language sentence reading support system capable of obtaining a more natural translation result. . It is a second object of the present invention to provide a storage medium storing a foreign language sentence reading support program capable of obtaining a more natural translation result. It is a third object of the present invention to provide a foreign language sentence reading comprehension method capable of obtaining a more natural translation result.

【0005】[0005]

【課題を解決するための手段】請求項1に記載した外国
語文読解支援システムでは、図5に示すように、翻訳対
象となる対象文書を取得する対象文書取得手段501
と、この対象文書取得手段501で取得された対象文書
から非訳出語句を抽出する非訳出語句抽出手段502
と、翻訳辞書503と、前記翻訳辞書503を使用して
前記対象文書を翻訳する翻訳手段504とを備え、前記
翻訳手段504は、前記非訳出語句抽出手段502で抽
出された非訳出語句の訳語として前記対象文書中の原文
表記を訳語として翻訳することにより、前記第1の目的
を達成する。請求項2に記載した外国語文読解支援シス
テムでは、図6に示すように、翻訳対象となる対象文書
を取得する対象文書取得手段501と、前記対象文書取
得手段501で取得された対象文書から非訳出語句を抽
出する非訳出語句抽出手段502と、前記非訳出語句抽
出手段502で抽出された非訳出語句を翻訳対象語によ
る表記に変換する表記変換手段505と、翻訳辞書50
3と、前記翻訳辞書503を使用して前記対象文書を翻
訳する翻訳手段506とを備え、前記翻訳手段506
は、前記非訳出語句抽出手段502で抽出された非訳出
語句の訳語として、前記表記変換手段505により変換
された表記、または、前記表記変換手段505により変
換された表記と前記対象文書中の原文表記の両表記を使
用して、前記対象文書を翻訳することにより、前記第1
の目的を達成する。請求項3に記載した発明では、図
6、図7に示すように、請求項1又は請求項2に記載し
た外国語文読解支援システムにおいて、前記非訳出語句
抽出手段505は、前記翻訳辞書503中には独立して
存在しない名詞句を非訳出語句として抽出する。請求項
4に記載した発明では、図6、図7に示すように、請求
項1又は請求項2に記載した外国語文読解支援システム
において、前記非訳出語句抽出手段502は、複合名詞
句を非訳出語句として抽出する。請求項5に記載した発
明では、図7に1例を示すように、請求項1から請求項
4のうちのいずれか1の請求項に記載の外国語文読解支
援システムにおいて、前記非訳出語句の重要度を判定す
る重要度判定手段507を備え、前記翻訳手段504
は、この重要度判定手段507により判定された重要度
に応じて前記非訳出語句を他の翻訳部分と区別して表示
する。請求項6に記載した発明では、図7に1例を示す
ように、請求項1から請求項4のうちのいずれか1の請
求項に記載の外国語文読解支援システムにおいて、前記
対象文書取得手段501により取得された対象文書の段
落、文、及び非訳出語句のうちの少なくとも1つの単位
に対する類似文書または関連記述を検索する検索手段5
08と、前記検索手段508で検索された類似文書また
は関連記述を、該当単位に関連付ける関連付け手段50
9と、を具備させる。請求項7に記載した発明では、図
9に示すように、翻訳対象となる対象文書を取得する対
象文書取得機能601と、この対象文書取得機能601
で取得された対象文書から非訳出語句を抽出する非訳出
語句抽出機能602と、翻訳辞書603と、前記翻訳辞
書603を使用して前記対象文書を翻訳する翻訳機能6
04とを備え、前記翻訳機能604は、前記非訳出語句
抽出機能602で抽出された非訳出語句の訳語として前
記対象文書中の原文表記を訳語として翻訳することをコ
ンピュータに実現させるためのコンピュータ読取り可能
な外国語文読解支援プログラムが記憶された記憶媒体と
することで、前記第2の目的を達成する。請求項8に記
載した発明では、図10に示すように、翻訳対象となる
対象文書を取得する対象文書取得機能601と、前記対
象文書取得機能601で取得された対象文書から非訳出
語句を抽出する非訳出語句抽出機能602と、前記非訳
出語句抽出機能602で抽出された非訳出語句を翻訳対
象語による表記に変換する表記変換機能605と、翻訳
辞書603と、前記翻訳辞書603を使用して前記対象
文書を翻訳する翻訳機能604とを備え、前記翻訳機能
604は、前記非訳出語句抽出機能602で抽出された
非訳出語句の訳語として、前記表記変換機能605によ
り変換された表記、または、前記表記変換機能605に
より変換された表記と前記対象文書中の原文表記の両表
記を使用して、前記対象文書を翻訳することをコンピュ
ータに実現させるためのコンピュータ読取り可能な外国
語文読解支援プログラムが記憶された記憶媒体とするこ
とで、前記第2の目的を達成する。請求項9に記載した
発明では、図9、図10に示すように、請求項7または
請求項8に記載した外国語文読解支援プログラムが記憶
された記憶媒体において、前記非訳出語句抽出機能60
2は、前記翻訳辞書中には独立して存在しない名詞句を
非訳出語句として抽出する。請求項10に記載した発明
では、図9、図10に示すように、請求項7または請求
項8に記載した外国語文読解支援プログラムが記憶され
た記憶媒体において、前記非訳出語句抽出機能602
は、複合名詞句を非訳出語句として抽出する。請求項1
1に記載した発明では、図11に1例を示すように、請
求項7から請求項10のうちのいずれか1の請求項に記
載の外国語文読解支援プログラムが記憶された記憶媒体
において、前記非訳出語句の重要度を判定する重要度判
定機能607を備え、前記翻訳機能604は、この重要
度判定機能607により判定された重要度に応じて前記
非訳出語句を他の翻訳部分と区別して表示する。請求項
12に記載した発明では、図12に1例を示すように、
請求項7から請求項11のうちのいずれか1の請求項に
記載の外国語文読解支援プログラムが記憶された記憶媒
体において、前記対象文書取得機能601により取得さ
れた対象文書の段落、文、及び非訳出語句のうちの少な
くとも1つの単位に対する類似文書または関連記述を検
索する検索機能608と、前記検索機能608で検索さ
れた類似文書または関連記述を、該当単位に関連付ける
関連付け機能609と、を具備させる。請求項13に記
載した外国語文読解支援方法では、翻訳辞書を使用して
前記対象文書を翻訳する際に、翻訳対象となる対象文書
から非訳出語句を抽出701し、抽出した非訳出語句の
訳語として、翻訳対象語による表記に変換した非訳出語
句の表記と、前記対象文書中の原文表とのうちの少なく
とも一方の表記を使用して翻訳702する。
In the foreign language sentence reading support system according to the first aspect, as shown in FIG. 5, a target document acquiring means 501 for acquiring a target document to be translated.
And a non-translated phrase extracting unit 502 for extracting a non-translated phrase from the target document acquired by the target document acquiring unit 501.
A translation dictionary 503; and a translation unit 504 for translating the target document using the translation dictionary 503. The translation unit 504 is configured to translate the non-translated phrase extracted by the non-translated phrase extraction unit 502. The first object is achieved by translating the original notation in the target document as a translation. In the foreign language sentence reading comprehension support system according to claim 2, as shown in FIG. 6, a target document acquisition unit 501 for acquiring a target document to be translated, and a non-translated target document acquired by the target document acquisition unit 501, A non-translated phrase extraction unit 502 for extracting a translated phrase, a notation conversion unit 505 for converting the non-translated phrase extracted by the non-translated phrase extraction unit 502 into a notation by a translation target word, and a translation dictionary 50
And translation means 506 for translating the target document using the translation dictionary 503, wherein the translation means 506
Is the notation converted by the notation conversion means 505 or the notation converted by the notation conversion means 505 and the original text in the target document as the translated word of the non-translated word extracted by the non-translated word extraction means 502. By translating the target document using both notations of the notation, the first
Achieve the objectives. According to the invention described in claim 3, in the foreign language sentence reading comprehension support system described in claim 1 or 2, as shown in FIGS. Extracts noun phrases that do not independently exist as non-translated phrases. According to the invention described in claim 4, as shown in FIGS. 6 and 7, in the foreign language sentence reading comprehension support system described in claim 1 or 2, the non-translated word / phrase extraction means 502 converts the compound noun phrase into Extract as translated words. According to the invention described in claim 5, as shown in an example in FIG. 7, in the foreign language sentence reading support system according to any one of claims 1 to 4, the non-translated phrase The translation means 504 comprising importance determination means 507 for determining importance;
Displays the non-translated phrase in distinction from other translated parts according to the importance determined by the importance determination means 507. In the invention described in claim 6, in the foreign language reading comprehension support system according to any one of claims 1 to 4, as shown in an example in FIG. Search means 5 for searching for a similar document or a related description for at least one unit of a paragraph, a sentence, and a non-translated phrase of the target document acquired by 501
08 and the associating unit 50 for associating the similar document or the related description searched by the searching unit 508 with the corresponding unit.
9 is provided. In the invention described in claim 7, as shown in FIG. 9, a target document acquisition function 601 for acquiring a target document to be translated, and the target document acquisition function 601
A non-translated phrase extraction function 602 for extracting a non-translated phrase from the target document acquired in step 2, a translation dictionary 603, and a translation function 6 for translating the target document using the translation dictionary 603
04, and the translation function 604 is a computer-readable program for causing a computer to translate the original expression in the target document as a translated word as a translated word of the non-translated phrase extracted by the non-translated phrase extraction function 602. The second object is achieved by using a storage medium in which a possible foreign language reading comprehension support program is stored. In the invention described in claim 8, as shown in FIG. 10, a target document acquisition function 601 for acquiring a target document to be translated, and a non-translated word / phrase are extracted from the target document acquired by the target document acquisition function 601. A non-translated word / phrase extraction function 602, a notation conversion function 605 for converting the non-translated word / phrase extracted by the non-translated word / phrase extraction function 602 into a notation based on a translation target word, a translation dictionary 603, and the translation dictionary 603. And a translation function 604 for translating the target document by using the translation function 604 as a translation of the non-translated phrase extracted by the non-translated phrase extraction function 602. And translating the target document by using both the notation converted by the notation conversion function 605 and the original notation in the target document. By computer-readable foreign language text reading support program for realizing to the stored storage medium, it achieves the second object. According to the ninth aspect of the present invention, as shown in FIGS. 9 and 10, in the storage medium storing the foreign language sentence reading support program according to the seventh or eighth aspect, the non-translated phrase extraction function 60 is provided.
2 extracts noun phrases that do not independently exist in the translation dictionary as non-translated phrases. According to the tenth aspect of the present invention, as shown in FIGS. 9 and 10, in the storage medium storing the foreign language sentence reading support program according to the seventh or eighth aspect, the non-translated phrase extraction function 602 is provided.
Extracts compound noun phrases as non-translated phrases. Claim 1
According to the invention described in Item 1, in the storage medium storing the foreign language sentence reading support program according to any one of Claims 7 to 10, as shown in FIG. The translation function 604 includes an importance determination function 607 for determining the importance of the non-translated phrase, and the translation function 604 distinguishes the non-translated phrase from other translation parts according to the importance determined by the importance determination function 607. indicate. In the invention according to claim 12, as shown in FIG.
A storage medium storing the foreign language sentence reading support program according to any one of claims 7 to 11, wherein a paragraph, a sentence, and a paragraph of the target document acquired by the target document acquisition function 601 are provided. A search function 608 for searching for a similar document or a related description for at least one unit of the non-translated phrase, and an association function 609 for associating the similar document or the related description searched by the search function 608 with the corresponding unit. Let it. 14. The foreign language sentence reading comprehension support method according to claim 13, wherein when translating the target document using a translation dictionary, a non-translated phrase is extracted from the target document to be translated 701, and the translated word of the extracted non-translated phrase is extracted. The translation 702 is performed using at least one of a notation of a non-translated phrase converted into a notation using a translation target word and an original sentence table in the target document.

【0006】[0006]

【発明の実施の形態】以下、本発明の外国語文読解支援
システム、外国語文読解支援プログラムが記憶された記
憶媒体、及び外国語文読解支援方法における好適な実施
の形態について、図1から図9を参照して説明する。 (1)実施形態の概要 本実施形態による外国語文読解支援は、まず最初に翻訳
対象文書(英語等)から、自然言語処理により複合名詞
句等の所定の非訳出語句を抽出する。そして非訳出語句
の部分を逐語訳することなく、カタカナ表記に変換して
対象文書全体を翻訳する。このようにすることで、例え
ば「Action Manager」を変に逐語訳せずに、「アクショ
ン マネージャ」とカタカナ表記することで、その内容
を知っている文章全体としての読解が容易になる。ま
た、内容を知らないユーザであっても、意味不明の逐語
訳よりも、特殊な語句であることを前提に他の部分を読
むことができるため混乱することなく読み進むことがで
きる。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, preferred embodiments of a foreign language sentence reading support system, a storage medium storing a foreign language sentence reading support program, and a foreign language sentence reading assisting method of the present invention will be described with reference to FIGS. It will be described with reference to FIG. (1) Overview of Embodiment In the foreign language sentence reading support according to the present embodiment, first, a predetermined non-translated phrase such as a compound noun phrase is extracted from a document to be translated (English or the like) by natural language processing. Then, the entire target document is translated by converting the non-translated words and phrases into katakana notation without translating the words. By doing so, for example, by writing katakana as "action manager" without translating "Action Manager" strangely, it becomes easy to read the entire sentence that knows the content. Also, even a user who does not know the content can read the other parts on the premise that it is a special word, rather than a verbatim translation whose meaning is unknown, so that the user can proceed without confusion.

【0007】(2)実施の形態の詳細 本実施形態の外国語文読解支援システムは、パーソナル
コンピュータやワードプロセッサ等を含むコンピュータ
システムで構成するだけでなく、LAN(ローカル・エ
リア・ネットワーク)のサーバ、コンピュータ(パソコ
ン)通信のホスト、インターネット上に接続されたコン
ピュータシステム等によって構成することも可能であ
る。また、ネットワーク上の各機器に機能分散させ、ネ
ットワーク全体で外国語文読解支援システムを構成する
ことも可能である。
(2) Details of the Embodiment The foreign language reading comprehension support system of the present embodiment is not only constituted by a computer system including a personal computer and a word processor, but also by a LAN (local area network) server and computer. (Personal computer) It is also possible to configure by a communication host, a computer system connected on the Internet, and the like. In addition, it is also possible to distribute functions to each device on the network and configure a foreign language sentence reading support system on the entire network.

【0008】図1は、外国語文読解支援システムの構成
を表したブロック図である。外国語文読解支援システム
は、図1に示すようにシステム全体を制御するための制
御部11を備えている。この制御部11には、データバ
ス等のバスライン21を介して、入力装置としてのキー
ボード12やマウス13、表示装置14、印刷装置1
5、記憶装置16、記憶媒体駆動装置17、通信制御装
置18、入出力I/F19、及び文字認識装置20が接
続されている。制御部11は、CPU111、ROM1
12、RAM113を備えている。ROM112は、C
PU111が各種制御や演算を行うための各種プログラ
ムやデータが予め格納されたリードオンリーメモリであ
る。
FIG. 1 is a block diagram showing the configuration of a foreign language sentence reading support system. The foreign language reading comprehension support system includes a control unit 11 for controlling the entire system as shown in FIG. The control unit 11 includes a keyboard 12 and a mouse 13 as input devices, a display device 14, and a printing device 1 via a bus line 21 such as a data bus.
5, a storage device 16, a storage medium driving device 17, a communication control device 18, an input / output I / F 19, and a character recognition device 20 are connected. The control unit 11 includes a CPU 111, a ROM 1
12, a RAM 113 is provided. ROM 112
It is a read-only memory in which various programs and data for the PU 111 to perform various controls and calculations are stored in advance.

【0009】RAM113は、CPU111にワーキン
グメモリとして使用されるランダムアクセスメモリであ
る。このRAM113には、本実施形態による外国語文
読解支援処理を行うためのエリアとして、翻訳対象とな
る対象文書が格納される対象文書格納エリア1131
と、対象文書から翻訳しない語句として抽出した非訳出
語句とそのカタカナ表記を格納する非訳出語句格納エリ
ア1132と、非訳出語句にカタカナ表記を使用して翻
訳した翻訳文書を格納する翻訳文書格納エリア1133
その他の各種エリアが確保されるようになっている。
The RAM 113 is a random access memory used as a working memory for the CPU 111. In the RAM 113, a target document storage area 1131 in which a target document to be translated is stored as an area for performing the foreign language sentence reading support processing according to the present embodiment.
A non-translated word storage area 1132 for storing non-translated words extracted as non-translated words from the target document and their katakana notation, and a translated document storage area for storing translated documents translated using katakana notation for non-translated words. 1133
Other various areas are secured.

【0010】キーボード12は、自システム内で対象文
書や他言語を入力する場合の対象文書取得手段や他言語
入力手段の一部を構成し、かな文字を入力するためのか
なキーやテンキー、各種機能を実行するための機能キ
ー、カーソルキー、等の各種キーが配置されている。マ
ウス13は、ポインティングデバイスであり、表示装置
14に表示されたキーやアイコン等を左クリックするこ
とで対応する機能の指定を行う入力装置である。表示装
置14は、例えばCRTや液晶ディスプレイ等が使用さ
れる。この表示装置には、キーボード12やマウス13
による入力結果が表示されたり、外国語文読解支援処理
における、対象文書や翻訳文書等が表示されたりするよ
うになっている。印刷装置15は、表示装置14に表示
された文書や、記憶装置16の文書格納部164に格納
された文書等や、ユーザに対する請求書の印刷を行うた
めのものである。この印刷装置としては、レーザプリン
タ、ドットプリンタ、インクジェットプリンタ、ページ
プリンタ、感熱式プリンタ、熱転写式プリンタ、等の各
種印刷装置が使用される。
The keyboard 12 constitutes a part of a target document acquisition unit or another language input unit for inputting a target document or another language in the own system, and includes a kana key and a numeric keypad for inputting a kana character. Various keys such as a function key and a cursor key for executing a function are arranged. The mouse 13 is a pointing device, and is an input device for designating a corresponding function by left-clicking a key, an icon, or the like displayed on the display device 14. As the display device 14, for example, a CRT or a liquid crystal display is used. The display device includes a keyboard 12 and a mouse 13
Is displayed, and a target document, a translated document, and the like in the foreign language sentence reading support process are displayed. The printing device 15 is for printing documents displayed on the display device 14, documents stored in the document storage unit 164 of the storage device 16, and bills to the user. Various printing apparatuses such as a laser printer, a dot printer, an ink jet printer, a page printer, a thermal printer, and a thermal transfer printer are used as the printing apparatus.

【0011】記憶装置16は、読み書き可能な記憶媒体
と、その記憶媒体に対してプログラムやデータ等の各種
情報を読み書きするための駆動装置で構成されている。
この記憶装置16に使用される記憶媒体としては、主と
してハードディスクが使用されるが、後述の記憶媒体駆
動装置17で使用される各種記憶媒体のうちの読み書き
可能な記憶媒体を使用するようにしてもよい。記憶装置
16は、仮名漢字変換辞書161、プログラム格納部1
62、データ格納部163、文書データベース164、
アクセス履歴データベース165、翻訳に使用される翻
訳辞書165、図示しないその他の格納部(例えば、こ
の記憶装置16内に格納されているプログラムやデータ
等をバックアップするための格納部)等を有している。
プログラム格納部162には、本実施形態における外国
語文読解支援処理プログラム、非訳出語句抽出プログラ
ム等の各種プログラムの他、仮名漢字変換辞書161を
使用して入力された仮名文字列を漢字混り文に変換する
仮名漢字変換プログラム等の各種プログラムが格納され
ている。データ格納部163には、ユーザに関するデー
タ等の、システムが必要とする各種データが格納されて
いる。文書データベース164には、主として日本語の
文書が多数格納されている。必要に応じてこの日本語文
書のなかから所定の文書等と類似している類似文書が検
索される。この文書データベース164に格納される各
文書の形式は特に限定されるものではなく、テキスト形
式の文書、HTML(Hyper Text Markup Language)形
式の文書、JIS形式の文書等の各種形式の文書の格納
が可能である。
The storage device 16 comprises a readable and writable storage medium and a drive device for reading and writing various information such as programs and data on the storage medium.
As a storage medium used for the storage device 16, a hard disk is mainly used, but a readable and writable storage medium among various storage media used in a storage medium driving device 17 described later may be used. Good. The storage device 16 stores the kana-kanji conversion dictionary 161 and the program storage unit 1
62, a data storage unit 163, a document database 164,
It has an access history database 165, a translation dictionary 165 used for translation, and other storage units (not shown) (for example, storage units for backing up programs and data stored in the storage device 16). I have.
The program storage unit 162 stores, in addition to various programs such as a foreign language sentence reading support processing program and a non-translated phrase extraction program according to the present embodiment, a kana character string input using the kana-kanji conversion dictionary 161 in a kanji mixed sentence. Various programs, such as a kana-kanji conversion program, are stored. The data storage unit 163 stores various data required by the system, such as data on the user. The document database 164 mainly stores many Japanese documents. If necessary, a similar document similar to a predetermined document or the like is searched from the Japanese document. The format of each document stored in the document database 164 is not particularly limited, and various types of documents such as text format documents, HTML (Hyper Text Markup Language) format documents, and JIS format documents can be stored. It is possible.

【0012】記憶媒体駆動装置17は、CPU111が
外部の記憶媒体からコンピュータプログラムや文書を含
むデータ等を読み込むための駆動装置である。記憶媒体
に記憶されているコンピュータプログラム等には、本実
施形態の外国語文読解支援システムにより実行される外
国語文読解支援処理等の各種処理プログラム、および、
そこで使用される辞書、データ等も含まれる。ここで、
記憶媒体とは、コンピュータプログラムやデータ等が記
憶される記憶媒体をいい、具体的には、フロッピーディ
スク、ハードディスク、磁気テープ等の磁気記憶媒体、
メモリチップやICカード等の半導体記憶媒体、CD−
ROMやMO、PD(相変化書換型光ディスク)等の光
学的に情報が読み取られる記憶媒体、紙カードや紙テー
プ等の用紙(および、用紙に相当する機能を持った媒
体)を用いた記憶媒体、その他各種方法でコンピュータ
プログラム等が記憶される記憶媒体が含まれる。本実施
形態の外国語文読解支援システムにおいて使用される記
憶媒体としては、主として、CD−ROMやフロッピー
ディスクが使用される。記憶媒体駆動装置17は、これ
らの各種記憶媒体からコンピュータプログラムを読み込
む他に、フロッピーディスクのような書き込み可能な記
憶媒体に対してRAM113や記憶装置16に格納され
ているデータ等を書き込むことが可能である。
The storage medium drive 17 is a drive for the CPU 111 to read a computer program or data including a document from an external storage medium. Computer programs and the like stored in the storage medium include various processing programs such as a foreign language sentence reading support process executed by the foreign language sentence reading support system of the present embodiment, and
The dictionary, data, etc. used there are also included. here,
The storage medium refers to a storage medium in which computer programs, data, and the like are stored, and specifically, a magnetic storage medium such as a floppy disk, a hard disk, a magnetic tape,
Semiconductor storage media such as memory chips and IC cards, CD-
A storage medium such as ROM, MO, and PD (phase change rewritable optical disk) from which information can be read optically; a storage medium using paper (such as a paper card or paper tape) (and a medium having a function equivalent to paper); In addition, a storage medium that stores a computer program or the like by various methods is included. As a storage medium used in the foreign language sentence reading support system of the present embodiment, a CD-ROM or a floppy disk is mainly used. The storage medium drive 17 can read data stored in the RAM 113 or the storage device 16 into a writable storage medium such as a floppy disk in addition to reading a computer program from these various storage media. It is.

【0013】本実施形態の外国語文読解支援システムで
は、制御部11のCPU111が、記憶媒体駆動装置1
7にセットされた外部の記憶媒体からコンピュータプロ
グラムを読み込んで、記憶装置16の各部に格納(イン
ストール)する。そして、本実施形態による外国語文読
解支援処理等の各種処理を実行する場合、記憶装置16
から該当プログラムをRAM113に読み込み、実行す
るようになっている。但し、記憶装置16からではな
く、記憶媒体駆動装置17により外部の記憶媒体から直
接RAM113にプログラムを読み込んで実行すること
も可能である。また、外国語文読解支援システムによっ
ては、本実施形態の外国語文読解支援処理プログラム等
を予めROM112に記憶させておき、これをCPU1
11が実行するようにしてもよい。さらに、本実施形態
の外国語文読解支援処理プログラム等の各種プログラム
やデータを、通信制御装置18を介して他の記憶媒体か
らダウンロードし、実行するようにしてもよい。
In the foreign language sentence reading support system of the present embodiment, the CPU 111 of the control unit 11
The computer program is read from an external storage medium set in 7 and stored (installed) in each section of the storage device 16. When executing various processes such as the foreign language sentence reading support process according to the present embodiment, the storage device 16
The corresponding program is read into the RAM 113 and executed. However, it is also possible to read the program directly from the external storage medium into the RAM 113 by the storage medium driving device 17 and execute the program instead of the storage device 16. In addition, depending on the foreign language reading comprehension support system, the foreign language reading comprehension support processing program or the like of this embodiment is stored in the ROM 112 in advance, and this is stored in the CPU 1.
11 may be executed. Furthermore, various programs and data such as the foreign language sentence reading support processing program of the present embodiment may be downloaded from another storage medium via the communication control device 18 and executed.

【0014】通信制御装置18は、外国語文読解支援シ
ステムと他のパーソナルコンピュータやワードプロセッ
サ等の各種電子機器との間をネットワーク接続するため
の制御装置である。通信制御装置18は、これら各種電
子機器が有している対象文書と同一の言語の文書、入力
された他言語の文書、および同一言語や他言語の文書の
データベースを検索対象としてアクセスすることが可能
になっている。対象となる文書には、テキスト形式やH
TML形式等の各種形式の文書の他、ビットマップデー
タ等の各種データも含まれる。入出力I/F19は、音
声や音楽等の出力を行うスピーカ等の各種機器を接続す
るためのインターフェースである。文字認識装置20
は、用紙等に記載された文字をテキスト形式やHTML
等の各種形式で認識する装置であり、イメージスキャナ
や文字認識プログラム等で構成されている。
The communication control device 18 is a control device for connecting a network between the foreign language sentence reading support system and various electronic devices such as personal computers and word processors. The communication control device 18 can access a document in the same language as the target document of these various electronic devices, a document in another language input, and a database of documents in the same language or another language as search targets. It is possible. Target documents include text format and H
In addition to documents in various formats such as TML format, various data such as bitmap data are included. The input / output I / F 19 is an interface for connecting various devices such as a speaker that outputs audio, music, and the like. Character recognition device 20
Is to convert characters written on paper etc. into text format or HTML
And the like, and is constituted by an image scanner, a character recognition program, and the like.

【0015】本実施形態では、キーボード12の入力操
作により作成され文書(RAM113の所定格納エリア
に格納)の他、記憶媒体駆動装置17により記憶媒体か
ら読み出した外部で作成された文書、予め文書データベ
ースに格納されている文書、通信制御装置18からダウ
ンロードした文書、及び文字認識装置20で文字認識し
た文書、等の各種文書を翻訳の対象となる対象文書とし
て取得する(文書取得手段)ことが可能である。
In this embodiment, in addition to a document created by an input operation of the keyboard 12 (stored in a predetermined storage area of the RAM 113), an externally created document read from a storage medium by the storage medium drive 17, a document database , A document downloaded from the communication control device 18, and a character recognized by the character recognition device 20, etc., can be obtained as target documents to be translated (document obtaining means). It is.

【0016】以上のように構成された本実施形態の外国
語文読解支援システムによる外国語文読解支援処理の動
作について、図2から図4を使用して説明する。本実施
形態では、翻訳を希望する文書(原文)が英語で記載さ
れており、これを日本語に翻訳する場合を例に説明す
る。
The operation of the foreign language reading comprehension support processing by the foreign language reading comprehension support system of the present embodiment configured as described above will be described with reference to FIGS. In the present embodiment, a document (original text) desired to be translated is described in English, and a case where this is translated into Japanese will be described as an example.

【0017】図2は外国語文読解支援処理のメイン動作
を表したフローチャートである。CPU111は、まず
外国語文読解支援(翻訳)を希望する対象文書(原文)
を、取得し(ステップ11)。
FIG. 2 is a flowchart showing the main operation of the foreign language sentence reading support process. The CPU 111 first applies to the target document (original text) for which foreign language sentence reading support (translation) is desired.
Is obtained (step 11).

【0018】そしてキーボード12やマウス13等の入
力装置で指定された原文の言語(例えば英語)と翻訳言
語(例えば日本語)、及び、表示形式を取得し、RAM
113の所定格納エリアに格納する(ステップ12)。
ここで、ユーザにより原文言語の指定がされない場合、
CPU111は、取得した対象文書を解析して言語を特
定する。解析は、各言語固有の表記文字の存在をチェッ
クすることで行う。また、翻訳言語のユーザ選択は原則
として必須項目であるため、選択がされない場合には、
画面表示により選択を促す。ただし、外国語文読解支援
システムが1種類の翻訳(例えば、英語から日本語の
み)だけが可能である場合には、原文言語と翻訳言語の
取得と格納は不要である。CPU111は、原文言語、
翻訳言語、表示形式を取得する場合、翻訳可能な言語の
組み合わせと、表示形式を画面に表示してユーザに選択
してもらうようにする。
Then, the language of the original sentence (for example, English), the translation language (for example, Japanese), and the display format specified by the input device such as the keyboard 12 and the mouse 13 are acquired, and the RAM is obtained.
It is stored in a predetermined storage area 113 (step 12).
Here, if the source language is not specified by the user,
The CPU 111 analyzes the acquired target document and specifies a language. Analysis is performed by checking for the presence of written characters unique to each language. In addition, since the user selection of the translation language is an essential item in principle, if no selection is made,
Prompt for selection by screen display. However, when the foreign language sentence reading support system can perform only one type of translation (for example, only English to Japanese), it is not necessary to acquire and store the original language and the translated language. The CPU 111 is a source language,
When acquiring a translation language and a display format, a combination of languages that can be translated and a display format are displayed on a screen so that the user can select the language and the display format.

【0019】次にCPU111は、RAM113の対象
文書格納エリア1132に格納した対象文書から、原文
言語に対応したプ非訳出語句抽出プログラムを起動し、
非訳出語句を資源言語処理(NLP)抽出し、抽出した
非訳出語句(原文の表記)を非訳出語句格納エリア11
32に格納する(ステップ13)。ここで、非訳出語句
として抽出する語句の例としては、複合名詞句が抽出さ
れ、その例として、名詞+代名詞、名詞+固有名詞、固
有名詞+冠詞+普通名詞(例;Billy the kid )、形容
詞+普通名詞+固有名詞(例;Mad scientist Doctor E
mett Brown)等がある。更に例示すれば、原文言語が英
語の場合、「An incremental utterance taskoriented
dialogue production system 」、「An Internet based
wide area computer assisted foreign language lear
ning prototype demonstration system」等の複合名詞
句が非訳出語句として抽出される。
Next, the CPU 111 activates a non-translated word / phrase extraction program corresponding to the source language from the target document stored in the target document storage area 1132 of the RAM 113,
The non-translated words / phrases are extracted by the resource language processing (NLP), and the extracted non-translated words / phrases (notation of the original text) are stored in the non-translated words / phrases storage area 11
32 (step 13). Here, compound noun phrases are extracted as examples of phrases to be extracted as non-translated phrases, such as noun + pronoun, noun + proper noun, proper noun + article + common noun (eg; Billy the kid), Adjective + ordinary noun + proper noun (eg; Mad scientist Doctor E
mett Brown). For further example, if the source language is English, "An incremental utterance taskoriented
dialogue production system '', `` An Internet based
wide area computer assisted foreign language lear
Compound noun phrases such as "ning prototype demonstration system" are extracted as untranslated phrases.

【0020】次にCPU111は、ステップ12で指定
された表示形式が、カタカナ表示を含む表示形式か否か
を確認する(ステップ14)。カタカナ表示を含む表示
形式である場合には(;Y)、ステップ13で抽出した
非訳出語句をカタカナ表記に変換し(表記変換手段)、
非訳出語句に対応させて変換したカタカナ表記を非訳出
語句格納エリア1132に格納する(ステップ15)。
ここで、非訳出語句のカタカナ表記への変換は、原文が
英語の場合にはローマ字読みにより、または、各単語の
発音記号により変換する。
Next, the CPU 111 checks whether or not the display format specified in step 12 is a display format including katakana display (step 14). If the display format includes the katakana display (Y), the non-translated words extracted in step 13 are converted into katakana notation (notation conversion means).
The katakana notation converted corresponding to the non-translated phrase is stored in the non-translated phrase storage area 1132 (step 15).
Here, the conversion of non-translated words into katakana notation is performed by reading Roman characters when the original sentence is in English, or by using phonetic symbols of each word.

【0021】そして、CPU111は、翻訳辞書165
と、非訳出語句格納エリア1132に格納された非訳出
語句及び/又はカタカナ表記(選択された表示形式によ
って選択)とを使用して対象文書を翻訳し翻訳結果を翻
訳文書格納エリア1133に格納する(ステップ1
6)。翻訳が終了するとCPU111は、RAM113
に格納した翻訳文書を指定された表示形式で表示して
(ステップ17)、処理を終了する。
Then, the CPU 111 executes the translation dictionary 165
The target document is translated using the non-translated phrase and / or katakana notation (selected according to the selected display format) stored in the non-translated phrase storage area 1132, and the translation result is stored in the translated document storage area 1133. (Step 1
6). When the translation is completed, the CPU 111
Is displayed in the designated display format (step 17), and the process ends.

【0022】図3は、表示形式として「カタカナ表記」
が選択された場合の翻訳結果の表示画面を表したもので
ある。この図3では、原文(対象文書)と日本語翻訳結
果とを横に対比して表示しているが、いずれか一方のみ
を表示したり、上下に対比して表示したりすることも可
能である。この図に示したように、非訳出語句「Action
Manager」を変に「演技課長」といった意味不明の語に
逐語訳せず、「アクション マネージャ」と一括してカ
タカナで表記しているので、当該言語を知っているユー
ザは直ちに理解することができる。また、当該言語を知
らないユーザであっても、意味不明の逐語訳で文章全体
がわからなくなるということがなく、特殊な語句である
ことを前提に他の部分を読むことができるため混乱する
ことなく読み進むことができる。
FIG. 3 shows “Katakana notation” as a display format.
13 shows a display screen of a translation result when is selected. In FIG. 3, the original sentence (target document) and the Japanese translation result are displayed horizontally, but it is also possible to display only one of them or to display it vertically. is there. As shown in this figure, the untranslated phrase "Action
The word "Manager" is not translated literally into meaningless words such as "acting section manager", but is collectively written in katakana as "action manager", so that a user who knows the language can immediately understand it. Also, even a user who does not know the language can be confused because the entire sentence can not be understood by a literal translation that has no meaning and can read other parts on the assumption that it is a special word. You can read without reading.

【0023】図4は、他の表示形式が選択された場合の
表示画面を表したものであり、(A)は「原文表記」の
表示画面、(B)は「カタカナ表記(原文表記)」の表
示画面をあらわしたものである。この図に示すように、
原文表記をすることで、その原文の語学力があるユーザ
にとっては原文表記から直ちに内容を理解することがで
き、そうでないユーザとては、原文表記から辞書等によ
って調べなければいけない単語を明確にすることができ
る。なお、図示しないが、表示形式として「原文表記
(カタカナ表記)」が選択された場合には、非訳出語句
「Action Manager」にたいして、「Action Manager(ア
クション マネージャ)」と表示する。
FIGS. 4A and 4B show a display screen when another display format is selected. FIG. 4A shows a display screen of “original text notation”, and FIG. 4B shows a display screen of “Katakana notation (original text notation)”. Are displayed. As shown in this figure,
By using the original language notation, users who have the language skills of the original language can immediately understand the contents from the original language notation, and for those who do not, clearly identify the words that must be looked up from the original language notation using a dictionary etc. can do. Although not shown, when “Original notation (Katakana notation)” is selected as the display format, “Action Manager” is displayed for the non-translated phrase “Action Manager”.

【0024】以上、本実施形態による対象文書に対して
カタカナ表記/原文表記混りの翻訳を行う処理について
説明したが、更に、以下の処理を行うようにしてもよ
い。すなわち、ステップ13で抽出した非訳出語句の重
要度を対象文書を使用して判定し、その重要度に応じ
て、翻訳結果の翻訳文中の原文表記やカタカナ表記部分
を他の部分特別して表示するようにする。原文表記やカ
タカナ表記の区別表示としては、色、濃度、文字サイ
ズ、文字の太さ等の文字飾り情報等を用いて強調した
り、逆強調したりするようにしてもよい。強調するのは
重要度が高い場合で、赤等の目立つ色、高濃度、拡大文
字(重要度に応じて大きさを変える)、太文字、のいず
れか1以上により強調する。逆強調するのは重要度が低
い場合で、水色や灰色等の目立たない色、低濃度、縮小
文字、細文字、の1以上により目立たないように逆強調
する。
In the above, the processing for translating the target document according to the present embodiment in a mixture of the katakana notation and the original sentence notation has been described. However, the following processing may be further performed. That is, the importance of the non-translated phrase extracted in step 13 is determined using the target document, and the original text and katakana text in the translated sentence of the translation result are specially displayed according to the importance. To do it. As the distinction display between the original notation and the katakana notation, emphasis may be performed using character decoration information such as color, density, character size, and character thickness, or reverse emphasis may be performed. The emphasis is high when the importance is high. The emphasis is emphasized by at least one of a conspicuous color such as red, high density, enlarged characters (the size is changed according to the importance), and bold characters. Inverse emphasis is performed when the degree of importance is low. Inverse emphasis is performed so as to be inconspicuous by one or more of inconspicuous colors such as light blue and gray, low density, reduced characters, and fine characters.

【0025】非訳出語句の重要度の判定方法としては、
各種提案されている公知の重要語判定方法を使用する。
例えば、PU111は、形態素解析を行うことで対象文
書から自立語を抽出して候補語とする。そして抽出した
候補語の対象文書中での出現頻度、評価関数から、各候
補語の重要度を決定し、一定の閾値以上の重要度を有す
る候補語を重要語とする。ここで、評価関数としては、
例えば、所定の語句が予め指定されている場合にはその
語句に対する重み付け等が使用される。そして、非訳出
語句中に出現する重要語候補をチェックし、重要度の合
計値をその非訳出語句の重要度とする。
As a method of determining the importance of a non-translated phrase,
Various proposed known important word determination methods are used.
For example, the PU 111 performs a morphological analysis, extracts an independent word from the target document, and sets it as a candidate word. Then, the importance of each candidate word is determined from the appearance frequency of the extracted candidate word in the target document and the evaluation function, and the candidate word having the importance equal to or higher than a certain threshold is determined as the important word. Here, as the evaluation function,
For example, when a predetermined word is specified in advance, weighting for that word is used. Then, important word candidates appearing in the non-translated words are checked, and the total value of the importance is set as the importance of the non-translated words.

【0026】また、非訳出語句の重要度の判定方法とし
て、「全文情報からの意味的情報の抽出と加工」(情報
処理学会第38回全国大会予稿集、第222頁;198
9年)で提案されているように、文書中の重要語を字種
や動詞等の情報から抽出して判定するようにしてもよ
い。
As a method for judging the importance of a non-translated phrase, "extraction and processing of semantic information from full-text information" (Information Processing Society of Japan 38th Annual Conference Proceedings, p. 222; 198)
As proposed in (9th year), important words in a document may be extracted from information such as character types and verbs to make a determination.

【0027】また、本実施形態による対象文書に対して
カタカナ表記/原文表記混りの翻訳を行う処理に加え
て、更に、以下の処理を行うようにしてもよい。すなわ
ち、ステップ11で取得した対象文書の、段落、文、非
訳出語句のうちの少なくとも1つ毎に、による類似文書
または関連記述を検索し、ハイパーリンクを付ける。そ
して、ユーザーが当該箇所にスクロールしたりマウスカ
ーソルをかざしたりした際に、バルーン(吹き出し)状
に関連文書名一覧や文書内容の一部(先頭や要約)を表
示し、理解を支援する。この際、母国語の関連文書を優
先表示するようにしてもよい。
Further, in addition to the process of translating a target document according to the present embodiment in a mixture of katakana and original sentences, the following process may be further performed. That is, a similar document or a related description is searched for at least one of a paragraph, a sentence, and a non-translated phrase in the target document acquired in step 11, and a hyperlink is attached. Then, when the user scrolls or moves the mouse cursor over the relevant portion, the related document name list and a part of the document content (head and summary) are displayed in a balloon (balloon) to assist understanding. At this time, the related document in the native language may be preferentially displayed.

【0028】ここで、類似文書の検索は、公知の各種検
索方法を使用することができ、例えば、文書の特徴を表
す文書ベクトル(文書中に含まれるキーワードの重要度
を要素とするベクトル)を使用し、2文書に対する文書
ベクトル間の角度に依存するコサインにより以下のよう
にして両文書の類似度を求める。すなわち、両文書ベク
トルbnとbn+1間の角度をqとし、両文書ベクトル
の内積をbn・bn+1とし、両文書ベクトルの大きさ
をそれぞれ|bn|、|bn+1|とした場合、両文書
ベクトルの類似度Snn+1は次の数式1により求ま
る。
Here, for searching for similar documents, various known search methods can be used. For example, a document vector (a vector having the importance of a keyword included in the document as an element) representing the characteristics of the document can be used. The similarity between the two documents is determined by the cosine depending on the angle between the document vectors for the two documents as follows. That is, if the angle between the two document vectors bn and bn + 1 is q, the inner product of both document vectors is bn · bn + 1, and the size of both document vectors is | bn | and | bn + 1 | The degree Snn + 1 is obtained by the following equation (1).

【0029】[0029]

【数1】 類似度Snn+1=COS(q) =(bn・bn+1)/(|bn|×|bn+1|)(1) Similarity Snn + 1 = COS (q) = (bn · bn + 1) / (| bn | × | bn + 1 |)

【0030】この類似度Sの値は−1≦S≦1までの値
をとり、1に近いほど2つの文書ベクトルが互いに平行
に近く、2つの文書同士は似ていると考えることができ
る。従って、一定の閾値以上の類似度を有する文書を類
似する文書と判断し、検索結果とする。
The value of the similarity S takes a value up to −1 ≦ S ≦ 1, and as the value is closer to 1, the two document vectors are closer to each other in parallel, and it can be considered that the two documents are similar. Therefore, a document having a similarity equal to or higher than a certain threshold value is determined as a similar document, and is set as a search result.

【0031】以上、本実施形態の構成および外国語文読
解支援の処理について説明したが、本発明では、これら
の各形態に限定されるものではなく、請求項に記載され
た発明の範囲内で種々の変形をすることが可能である。
例えば、実施形態では、対象文書の言語(原文言語)と
して英語、翻訳言語として日本語を例に説明したが、本
発明ではこれらの組み合わせに限定されるものではな
く、あらゆる言語間の組み合わせとすることが可能であ
る。その場合、対象となる文書が作成された言語用の形
態素解析アルゴリズム等を使用するといった、本発明の
構成には影響のない部分を変更するだけでよい。
Although the configuration of this embodiment and the processing for assisting in reading a foreign language sentence have been described above, the present invention is not limited to each of these forms, and various modifications are possible within the scope of the invention described in the claims. Can be modified.
For example, in the embodiment, English has been described as an example of the language (source language) of the target document and Japanese has been described as the translation language. However, the present invention is not limited to these combinations, and may be any combination between languages. It is possible. In this case, it is only necessary to change a portion that does not affect the configuration of the present invention, such as using a morphological analysis algorithm for the language in which the target document is created.

【0032】以上の実施形態において説明した、各装
置、各部、各動作、各処理等に対しては、それらを含む
上位概念としての各手段(〜手段)により、実施形態を
構成することが可能である。例えば、「2文書に対する
文書ベクトル間の角度に依存するコサインにより以下の
ようにして両文書の類似度を求める」との記載に対して
「類似度算出手段」を構成するようにしてもよい。同様
に、その他各種動作に対して「〜(動作)手段」等の上
位概念で実施形態を構成するようにしてもよい。
Each device, each unit, each operation, each process, and the like described in the above embodiment can be constituted by each unit as a high-level concept including these units. It is. For example, the "similarity calculating means" may be configured for the description "the similarity between the two documents is obtained by the cosine depending on the angle between the document vectors for the two documents as follows". Similarly, the embodiment may be configured with a higher concept such as “「 (operation) means ”for various other operations.

【0033】[0033]

【発明の効果】本発明によれば、翻訳辞書を使用して前
記対象文書を翻訳する際に、翻訳対象となる対象文書か
ら非訳出語句を抽出し、抽出した非訳出語句の訳語とし
て、翻訳対象語による表記に変換した非訳出語句の表記
と、前記対象文書中の原文表とのうちの少なくとも一方
の表記を使用して翻訳するようにしたので、より自然な
翻訳結果が提供され、外国語文読解が支援される。
According to the present invention, when translating the target document using the translation dictionary, a non-translated word is extracted from the target document to be translated, and the translated non-translated word is translated as a translation of the extracted non-translated word. Since the translation is performed using at least one of the notation of the non-translated phrase converted into the notation in the target word and the original text table in the target document, a more natural translation result is provided, Word reading comprehension is supported.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明の1実施形態における外国語文読解支援
システムの構成を表したブロック図である。
FIG. 1 is a block diagram showing a configuration of a foreign language sentence reading support system according to an embodiment of the present invention.

【図2】同上、実施形態における外国語文読解支援処理
のメイン動作を表したフローチャートである。
FIG. 2 is a flowchart showing a main operation of a foreign language sentence reading support process according to the embodiment.

【図3】同上、実施形態における表示形式として「カタ
カナ表記」が選択された場合の翻訳結果の表示画面を表
した説明図である。
FIG. 3 is an explanatory diagram showing a translation result display screen when “Katakana notation” is selected as a display format in the embodiment.

【図4】同上、実施形態における他の表示形式が選択さ
れた場合の表示画面を表したもので、(A)は「原文表
記」の表示画面、(B)は「カタカナ表記(原文表
記)」の表示画面をあらわした説明図である。
FIG. 4 shows a display screen when another display format in the embodiment is selected, wherein (A) is a display screen of “original text notation”, and (B) is “display of katakana notation (original text notation)”. It is an explanatory view showing a display screen of "".

【図5】請求項1に記載した発明のクレーム対応図であ
る。
FIG. 5 is a diagram corresponding to claims of the invention described in claim 1;

【図6】請求項2に記載した発明のクレーム対応図であ
る。
FIG. 6 is a diagram corresponding to claims of the invention described in claim 2;

【図7】請求項5に記載した発明のクレーム対応図の1
例である。
FIG. 7 is a diagram corresponding to claim 5 of the invention described in claim 5;
It is an example.

【図8】請求項6に記載した発明のクレーム対応図の1
例である。
FIG. 8 is a diagram corresponding to claim 6 of the invention described in claim 6;
It is an example.

【図9】請求項7に記載した発明のクレーム対応図であ
る。
FIG. 9 is a diagram corresponding to claims of the invention described in claim 7;

【図10】請求項8に記載した発明のクレーム対応図で
ある。
FIG. 10 is a diagram corresponding to claims of the invention described in claim 8;

【図11】請求項11に記載した発明のクレーム対応図
の1例である。
FIG. 11 is an example of a claim correspondence diagram of the invention described in claim 11;

【図12】請求項12に記載した発明のクレーム対応図
の1例である。
FIG. 12 is an example of a claim correspondence diagram of the invention described in claim 12;

【図13】請求項13に記載した発明のクレーム対応図
である。
FIG. 13 is a diagram corresponding to claims of the invention described in claim 13;

【図14】従来の翻訳結果を表す説明図である。FIG. 14 is an explanatory diagram showing a conventional translation result.

【符号の説明】[Explanation of symbols]

11 制御部 112 ROM 113 RAM 1131 対象文書格納エリア 1132 非訳出語句格納エリア 1133 翻訳文書格納エリア 12 キーボード 13 マウス 14 表示装置 15 印刷装置 16 記憶装置 161 仮名漢字変換辞書 162 プログラム格納部 163 データ格納部 164 文書データベース 165 翻訳辞書 17 記憶媒体駆動装置 18 通信制御装置 19 入出力I/F 20 文字認識装置 11 control unit 112 ROM 113 RAM 1131 target document storage area 1132 untranslated words / phrases storage area 1133 translated document storage area 12 keyboard 13 mouse 14 display device 15 printing device 16 storage device 161 kana-kanji conversion dictionary 162 program storage unit 163 data storage unit 164 Document database 165 Translation dictionary 17 Storage medium drive 18 Communication control device 19 Input / output I / F 20 Character recognition device

Claims (13)

【特許請求の範囲】[Claims] 【請求項1】 翻訳対象となる対象文書を取得する対象
文書取得手段と、 この対象文書取得手段で取得された対象文書から非訳出
語句を抽出する非訳出語句抽出手段と、 翻訳辞書と、 前記翻訳辞書を使用して前記対象文書を翻訳する翻訳手
段とを備え、 前記翻訳手段は、前記非訳出語句抽出手段で抽出された
非訳出語句の訳語として前記対象文書中の原文表記を訳
語として翻訳することを特徴とする外国語文読解支援シ
ステム。
1. A target document acquisition unit for acquiring a target document to be translated, a non-translated phrase extraction unit for extracting a non-translated phrase from the target document acquired by the target document acquisition unit, a translation dictionary, A translation unit for translating the target document using a translation dictionary, wherein the translation unit translates the original notation in the target document as a translation of the non-translated phrase extracted by the non-translated phrase extraction unit. A foreign language reading comprehension support system characterized by doing.
【請求項2】 翻訳対象となる対象文書を取得する対象
文書取得手段と、 前記対象文書取得手段で取得された対象文書から非訳出
語句を抽出する非訳出語句抽出手段と、 前記非訳出語句抽出手段で抽出された非訳出語句を翻訳
対象語による表記に変換する表記変換手段と、 翻訳辞書と、 前記翻訳辞書を使用して前記対象文書を翻訳する翻訳手
段とを備え、 前記翻訳手段は、前記非訳出語句抽出手段で抽出された
非訳出語句の訳語として、前記表記変換手段により変換
された表記、または、前記表記変換手段により変換され
た表記と前記対象文書中の原文表記の両表記を使用し
て、前記対象文書を翻訳することを特徴とする外国語文
読解支援システム。
2. A target document acquisition unit for acquiring a target document to be translated, a non-translated phrase extraction unit for extracting a non-translated phrase from the target document acquired by the target document acquisition unit, and the non-translated phrase extraction A notation conversion unit that converts the non-translated phrase extracted by the unit into a notation in a translation target word; a translation dictionary; and a translation unit that translates the target document using the translation dictionary. As a translation of the non-translated phrase extracted by the non-translated phrase extraction means, the notation converted by the notation conversion means, or both the notation converted by the notation conversion means and the original notation in the target document A foreign language reading comprehension support system characterized in that the target document is used for translation.
【請求項3】 前記非訳出語句抽出手段は、前記翻訳辞
書中には独立して存在しない名詞句を非訳出語句として
抽出する、ことを特徴とする請求項1又は請求項2に記
載の外国語文読解支援システム。
3. The foreign language phrase according to claim 1, wherein the non-translated phrase extraction means extracts a noun phrase that does not exist independently in the translation dictionary as a non-translated phrase. Word reading support system.
【請求項4】 前記非訳出語句抽出手段は、複合名詞句
を非訳出語句として抽出する、ことを特徴とする請求項
1又は請求項2に記載の外国語文読解支援システム。
4. The foreign language sentence reading support system according to claim 1, wherein said non-translated phrase extraction means extracts a compound noun phrase as a non-translated phrase.
【請求項5】 前記非訳出語句の重要度を判定する重要
度判定手段を備え、 前記翻訳手段は、この重要度判定手段により判定された
重要度に応じて前記非訳出語句を他の翻訳部分と区別し
て表示することを特徴とする請求項1から請求項4のう
ちのいずれか1の請求項に記載の外国語文読解支援シス
テム。
5. An importance judging means for judging importance of the non-translated phrase, wherein the translating means converts the non-translated phrase into another translated part according to the importance decided by the importance judging means. The foreign language sentence reading support system according to any one of claims 1 to 4, wherein the foreign language sentence reading support system is displayed in a manner distinguishing from the foreign language sentence.
【請求項6】 前記対象文書取得手段により取得された
対象文書の段落、文、及び非訳出語句のうちの少なくと
も1つの単位に対する類似文書または関連記述を検索す
る検索手段と、 前記検索手段で検索された類似文書または関連記述を、
該当単位に関連付ける関連付け手段と、を具備すること
を特徴とする請求項1から請求項5のうちのいずれか1
の請求項に記載の外国語文読解支援システム。
6. A search means for searching for a similar document or a related description for at least one unit of a paragraph, a sentence, and a non-translated phrase of the target document acquired by the target document acquisition means, and a search by the search means Similar documents or related descriptions
6. An associating means for associating with a corresponding unit, wherein:
Foreign language reading comprehension support system described in the claim.
【請求項7】 翻訳対象となる対象文書を取得する対象
文書取得機能と、 この対象文書取得機能で取得された対象文書から非訳出
語句を抽出する非訳出語句抽出機能と、 翻訳辞書と、 前記翻訳辞書を使用して前記対象文書を翻訳する翻訳機
能とを備え、 前記翻訳機能は、前記非訳出語句抽出機能で抽出された
非訳出語句の訳語として前記対象文書中の原文表記を訳
語として翻訳することをコンピュータに実現させるため
のコンピュータ読取り可能な外国語文読解支援プログラ
ムが記憶された記憶媒体。
7. A target document acquisition function for acquiring a target document to be translated, a non-translated phrase extraction function for extracting a non-translated phrase from the target document acquired by the target document acquisition function, a translation dictionary, A translation function of translating the target document using a translation dictionary, wherein the translation function translates the original sentence notation in the target document as a translation of the non-translated phrase extracted by the non-translated phrase extraction function. A storage medium storing a computer-readable foreign-language sentence reading support program for causing a computer to perform the processing.
【請求項8】 翻訳対象となる対象文書を取得する対象
文書取得機能と、 前記対象文書取得機能で取得された対象文書から非訳出
語句を抽出する非訳出語句抽出機能と、 前記非訳出語句抽出機能で抽出された非訳出語句を翻訳
対象語による表記に変換する表記変換機能と、 翻訳辞書と、 前記翻訳辞書を使用して前記対象文書を翻訳する翻訳機
能とを備え、 前記翻訳機能は、前記非訳出語句抽出機能で抽出された
非訳出語句の訳語として、前記表記変換機能により変換
された表記、または、前記表記変換機能により変換され
た表記と前記対象文書中の原文表記の両表記を使用し
て、前記対象文書を翻訳することをコンピュータに実現
させるためのコンピュータ読取り可能な外国語文読解支
援プログラムが記憶された記憶媒体。
8. A target document acquisition function for acquiring a target document to be translated, a non-translated phrase extraction function for extracting a non-translated phrase from the target document acquired by the target document acquisition function, and the non-translated phrase extraction A translation function for translating a non-translated phrase extracted by the function into a representation by a translation target word; a translation dictionary; and a translation function for translating the target document using the translation dictionary. As a translation of the non-translated phrase extracted by the non-translated phrase extraction function, the notation converted by the notation conversion function, or both the notation converted by the notation conversion function and the original notation in the target document A storage medium storing a computer-readable foreign language sentence reading support program for causing a computer to translate the target document by using the program.
【請求項9】 前記非訳出語句抽出機能は、前記翻訳辞
書中には独立して存在しない名詞句を非訳出語句として
抽出する、ことを特徴とする請求項7又は請求項8に記
載の外国語文読解支援プログラムが記憶された記憶媒
体。
9. The foreign language according to claim 7, wherein the non-translated phrase extraction function extracts a noun phrase that does not exist independently in the translation dictionary as a non-translated phrase. A storage medium in which a word and sentence reading support program is stored.
【請求項10】 前記非訳出語句抽出機能は、複合名詞
句を非訳出語句として抽出する、ことを特徴とする請求
項7又は請求項8に記載の外国語文読解支援プログラム
が記憶された記憶媒体。
10. The storage medium storing a foreign language sentence reading support program according to claim 7, wherein the non-translated phrase extraction function extracts a compound noun phrase as a non-translated phrase. .
【請求項11】 前記非訳出語句の重要度を判定する重
要度判定機能を備え、 前記翻訳機能は、この重要度判定機能により判定された
重要度に応じて前記非訳出語句を他の翻訳部分と区別し
て表示することを特徴とする請求項7から請求項10の
うちのいずれか1の請求項に記載の外国語文読解支援プ
ログラムが記憶された記憶媒体。
11. An importance determining function for determining the importance of the non-translated phrase, wherein the translation function converts the non-translated phrase into another translation part according to the importance determined by the importance determining function. A storage medium storing the foreign language sentence reading support program according to any one of claims 7 to 10, wherein the storage medium stores the foreign language sentence reading support program.
【請求項12】 前記対象文書取得機能により取得され
た対象文書の段落、文、及び非訳出語句のうちの少なく
とも1つの単位に対する類似文書または関連記述を検索
する検索機能と、 前記検索機能で検索された類似文書または関連記述を、
該当単位に関連付ける関連付け機能と、を具備すること
を特徴とする請求項7から請求項11のうちのいずれか
1の請求項に記載の外国語文読解支援プログラムが記憶
された記憶媒体。
12. A search function for searching for a similar document or a related description for at least one unit of a paragraph, a sentence, and a non-translated phrase of the target document obtained by the target document obtaining function; Similar documents or related descriptions
The storage medium storing the foreign language sentence reading support program according to any one of claims 7 to 11, further comprising an association function of associating the foreign language sentence with the corresponding unit.
【請求項13】 翻訳辞書を使用して前記対象文書を翻
訳する際に、 翻訳対象となる対象文書から非訳出語句を抽出し、 抽出した非訳出語句の訳語として、翻訳対象語による表
記に変換した非訳出語句の表記と、前記対象文書中の原
文表とのうちの少なくとも一方の表記を使用して翻訳す
ることを特徴とする外国語文読解支援方法。
13. When translating the target document using a translation dictionary, extract a non-translated phrase from the target document to be translated, and convert the extracted non-translated phrase into a notation in the translation target word as a translation of the extracted non-translated phrase. A foreign language reading comprehension support method, characterized in that translation is performed using at least one of a notation of a non-translated word and a source sentence table in the target document.
JP9217129A 1997-07-27 1997-07-27 Foreign language sentence interpretation support system, storing medium for storing foreign language sentence interpretation support program and method for foreign language sentence interpretation support Pending JPH1145245A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9217129A JPH1145245A (en) 1997-07-27 1997-07-27 Foreign language sentence interpretation support system, storing medium for storing foreign language sentence interpretation support program and method for foreign language sentence interpretation support

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9217129A JPH1145245A (en) 1997-07-27 1997-07-27 Foreign language sentence interpretation support system, storing medium for storing foreign language sentence interpretation support program and method for foreign language sentence interpretation support

Publications (1)

Publication Number Publication Date
JPH1145245A true JPH1145245A (en) 1999-02-16

Family

ID=16699316

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9217129A Pending JPH1145245A (en) 1997-07-27 1997-07-27 Foreign language sentence interpretation support system, storing medium for storing foreign language sentence interpretation support program and method for foreign language sentence interpretation support

Country Status (1)

Country Link
JP (1) JPH1145245A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001312463A (en) * 2000-04-28 2001-11-09 Kodansha Ltd Display language conversion system, storage medium, and information vending system
JP2007018359A (en) * 2005-07-08 2007-01-25 Sharp Corp Language processing device, language processing method and language processing program
JP2008108209A (en) * 2006-10-27 2008-05-08 Internatl Business Mach Corp <Ibm> Technique for enhancing precision of machine translation
US11194259B2 (en) 2018-08-30 2021-12-07 Taiwan Semiconductor Manufacturing Co., Ltd. Equipment module with enhanced protection from airborne contaminants, and method of operation

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001312463A (en) * 2000-04-28 2001-11-09 Kodansha Ltd Display language conversion system, storage medium, and information vending system
US7174287B2 (en) 2000-04-28 2007-02-06 Kodansha Co., Ltd. Display language conversion system, storage medium and information selling system
JP2007018359A (en) * 2005-07-08 2007-01-25 Sharp Corp Language processing device, language processing method and language processing program
JP2008108209A (en) * 2006-10-27 2008-05-08 Internatl Business Mach Corp <Ibm> Technique for enhancing precision of machine translation
US8126698B2 (en) 2006-10-27 2012-02-28 International Business Machines Corporation Technique for improving accuracy of machine translation
US11194259B2 (en) 2018-08-30 2021-12-07 Taiwan Semiconductor Manufacturing Co., Ltd. Equipment module with enhanced protection from airborne contaminants, and method of operation

Similar Documents

Publication Publication Date Title
JP4277903B2 (en) Electronic device and program with dictionary function
KR19980080220A (en) Recording medium recording language identification device, language identification method and program of language identification
WO2003065245A1 (en) Translating method, translated sentence outputting method, recording medium, program, and computer device
JPH11338858A (en) Device and method for predicting input and storage medium recording input predictive program
Somers The translator's workstation
JP2010198241A (en) Chinese input device and program
JPH1145247A (en) Document classification device, storage medium for storing document classification program and document classification method
JP4021525B2 (en) Document processing apparatus, storage medium storing document processing program, and document processing method
Jamro Sindhi language processing: A survey
JPH1145245A (en) Foreign language sentence interpretation support system, storing medium for storing foreign language sentence interpretation support program and method for foreign language sentence interpretation support
JPH1153396A (en) Device and method for document processing and storage medium storing document processing program
JPH11238051A (en) Chinese input conversion processor, chinese input conversion processing method and recording medium stored with chinese input conversion processing program
JPH1145278A (en) Document processor, storage medium storing document processing program and document processing method
JP2003323425A (en) Parallel translation dictionary creating device, translation device, parallel translation dictionary creating program, and translation program
JP3952964B2 (en) Reading information determination method, apparatus and program
Patkar et al. Translation of English to Ahirani Language
Joshi et al. Frequency based predictive input system for Hindi
JPH10320399A (en) Language identification device and method therefor and recording medium for recording program of language identification
JP3377942B2 (en) Electronic dictionary search device and computer-readable storage medium storing electronic dictionary search device control program
Somers Translation technologies and minority languages
JPH1145280A (en) Other-language-document retrieval system, storage medium wehre other-language-retrieval program is stored, and other-language-document retrieving method
JP2004118461A (en) Method and device for training language model, method and device for kana/kanji conversion, computer program, and computer readable recording medium
JPH10198664A (en) Japanese language input system and medium for recorded with japanese language input program
JP2022148873A (en) Information retrieval device, information retrieval method, and program
Modi POS Tagging and Structural Annotation of Handwritten Text Image Corpus of Devnagari Script

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040702

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060802

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061002

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061031