JP2008165563A - 対訳例文検索プログラム、対訳例文検索装置、および対訳例文検索方法 - Google Patents
対訳例文検索プログラム、対訳例文検索装置、および対訳例文検索方法 Download PDFInfo
- Publication number
- JP2008165563A JP2008165563A JP2006355467A JP2006355467A JP2008165563A JP 2008165563 A JP2008165563 A JP 2008165563A JP 2006355467 A JP2006355467 A JP 2006355467A JP 2006355467 A JP2006355467 A JP 2006355467A JP 2008165563 A JP2008165563 A JP 2008165563A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- bilingual
- example sentence
- original
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/45—Example-based machine translation; Alignment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/47—Machine-assisted translation, e.g. using translation memory
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
Abstract
【解決手段】検索手段4により、入力文3aに応じた対訳例文が抽出される。次に、一致率計算手段5により、対訳例文内の原文または部分列と入力文3aとの間の一致率が計算される。さらに、リンク付与手段6により、原文の対訳例文に対して下位リンク情報が設定され、部分列の対訳例文に対して上位リンク情報が設定される。そして、結果表示手段7により、一致率が最も高い対訳例文7aa、拡張ボタン7ab、および縮退ボタン7acが表示される。拡張ボタン7abが選択されると、拡張・縮退表示手段8により、拡張ボタン7abに対応する対訳例文8aが表示される。縮退ボタン7acが選択されると、拡張・縮退表示手段8により、縮退ボタン7acに対応する対訳例文8bが表示される。
【選択図】図1
Description
図1は、発明の概要を示す図である。本発明に係る対訳例文検索装置は、対訳例文記憶手段1、関連リンク記憶手段2、入力文受付手段3、検索手段4、一致率計算手段5,リンク付与手段6、結果表示手段7、および拡張・縮退表示手段8を有している。
検索手段4は、入力文3aを検索キーとして、対訳例文記憶手段1内の原文と部分列とに対する検索を行い、該当する原文または部分列の対訳例文を抽出する。たとえば、検索手段4は、原文と部分列とを検索対象として、入力文3aとの間の部分一致検索を行う。部分一致検索では、共通の文字が少なくとも1文字含まれていれば検出される。
[第1の実施の形態]
図2は、本実施の形態に用いる対訳例文検索装置のハードウェア構成例を示す図である。対訳例文検索装置100は、CPU(Central Processing Unit)101によって装置全体が制御されている。CPU101には、バス107を介してRAM(Random Access Memory)102、ハードディスクドライブ(HDD:Hard Disk Drive)103、グラフィック処理装置104、入力インタフェース105、および通信インタフェース106が接続されている。
図3は、第1の実施の形態に係る対訳例文検索装置の機能を示すブロック図である。第1の実施の形態に係る対訳例文検索装置100は対訳例文データベース(DB)110、関連リンクDB120、入力文受付部131、検索部132、一致率計算部133、ソート部134、リンク付与部135、結果表示部136、および拡張・縮退表示部137を有している。
図4は、例文検索処理の手順を示すフローチャートである。以下、図4に示す処理をステップ番号に沿って説明する。
[ステップS12]検索部132は、対訳例文DB110から入力文と類似した対訳例文を検索する。
[ステップS14]ソート部134は、一致率と関連リンクをもとに検索結果をソートする。
[ステップS16]結果表示部136は、ソートされた検索結果例文を表示する。
まず、例文検索を行うためには、予め対訳例文を用意する必要がある。対訳例文は、信頼のおける翻訳者が翻訳を行った原文を元に作成される。
図8は、入力文の検索状況を示す図である。入力文31は、原語で記述されている。本実施の形態では、原文は日本語である。入力文31が入力されると、検索部132によって入力文31をキーとして、対訳例文DB110に対して初期検索が行われる。初期検索では、入力文31中の文字と一文字でも一致する原文または部分列を含む対訳例文が検索される。検出された対訳例文が検索結果例文とされ、入力文と検索結果例文とが一致率計算部133に渡される。
図15は、対訳例文の拡張・縮退における遷移例を示す図である。検索結果表示画面40に表示されている対訳例文41の「上位へ」のボタン44が押下されると、表示対象が対訳例文41の上位の関連リンクによって関連付けられた対訳例文41aに変更される。この例では、対訳例文41aは、原文の全文と訳文の全文とで構成されている。すなわち、対訳例文41aは、例文集合内の最上位の対訳例文である。そのため、対訳例文41aには「上位へ」のボタンがなく、「下位へ」のボタン47aのみが設けられている。「下位へ」のボタン47aが押下されると、検索結果表示画面40の表示対象は、対訳例文41に戻される。
第2の実施の形態は、入力文と、検索結果例文のうちの原語側例文の間で一致した部分を強調表示することにより、必要とする箇所を高速に目視探索できるようにしたものである。
[ステップS27]結果表示部136aは、入力文に含まれる形態素と一致する形態素を強調させ、検索結果例文を表示する。この時点では、1つの原文から生成された複数の対訳例文のうち、入力文との一致率が最も高い代表例文が表示される。
[ステップS29]拡張・縮退表示部137aは、拡張または縮退の指示に従って、検索結果例文の拡張または縮退を行い、検索結果を再表示する。その際、結果表示部136aは、入力文に含まれる形態素と一致する形態素を強調表示する。その後、処理がステップS28に進められる。
図18は、一致形態素検出対象の例を示す図である。図18の例では、入力文31として「学生が東京で買った雑誌」という文が入力され、「東京で買った本」という部分列を含む対訳例文41が、検索結果例文として検出されたものとする。
図20は、一致する形態素の検出結果を示す図である。図20では、一致する形態素同士を、破線で結んでいる。この例では、「東京」、「で」、「買」、および「った」の形態素が互いに一致している。一致した形態素には、その旨を示す強調フラグが設定される。この強調フラグが付与された入力文31と対訳例文41が結果表示部136aに渡されると、強調フラグが付与された形態素が強調表示される。
図22は、第2の実施の形態における拡張・縮退の例を示す図である。図22に示すように、拡張・縮退させることで、代表例文以外の対訳例文を表示させた場合にも、入力文31の形態素と一致する形態素が強調表示される。これにより、表示される文の中から、翻訳に利用できる部分を容易に見つけ出すことができるようになる。
第3の実施の形態は、第2の実施の形態に係る対訳例文検索装置に対して、強調表示された原文(部分列も含む)に対応する訳文を強調表示する機能を付加したものである。
形態素解析部152aは、第2の実施の形態の形態素解析部152の機能に加え、対訳形態素検出部153の依頼に応じて、形態素辞書記憶部140aを参照し、訳文の形態素解析を行い、訳文を形態素へ分割する。
[ステップS48]結果表示部136bは、入力文に含まれる形態素と一致する原語側の形態素、およびその形態素の訳語である訳文側の形態素を強調させ、検索結果例文を表示する。この時点では、1つの原文から生成された複数の対訳例文のうち、入力文との一致率が最も高い代表例文が表示される。
[ステップS50]拡張・縮退表示部137bは、拡張または縮退の指示に従って、検索結果例文の拡張または縮退を行い、検索結果を再表示する。その際、拡張・縮退表示部137bは、入力文に含まれる形態素と一致する原語側の形態素と、その形態素の訳語である訳文側の形態とを強調表示する。その後、処理がステップS49に進められる。
図28は、第3の実施の形態における拡張・縮退の例を示す図である。図28に示すように、拡張・縮退させることで、代表例文以外の対訳例文を表示させた場合にも、入力文31の形態素と一致する一致形態素と訳語とが強調表示される。これにより、表示される文の中から、翻訳に利用できる部分を容易に見つけ出すことができるようになる。
第4の実施の形態は、複数の文で構成される文章や文書(以下、複数の文を含む文字情報を単に文書と呼ぶ)のような文の集合を含めて、処理の対象としたものである。すなわち、第4の実施の形態では、対訳例文の検索結果である検索結果例文の原文を拡張することで、原文を含む文書を表示させることを可能としている。
[ステップS70]拡張・縮退表示部137cは、拡張または縮退の指示を受け取ると、検索結果例文の拡張または縮退処理を行う。具体的には、拡張・縮退表示部137cは、拡張の指示があった場合、現在表示している検索結果例文の上位の関連リンクで関連付けられた検索結果例文に表示対象を変更する。なお、現在表示されている検索結果例文が原文の場合、その原文を含む段落が拡張時の表示対象となる。段落を表示させる場合、拡張・縮退表示部137cは、文書DB170から該当する段落の内容を取得する。また、段落が表示されているときに拡張の指示が出されると、その段落を含む文書が表示対象となる。文書を表示させる場合、拡張・縮退表示部137cは、文書DB170から該当する文書の内容を取得する。
以上説明した実施の形態の主な技術的特徴は、以下の付記の通りである。
コンピュータを、
原語による複数の原文それぞれについて、前記原文と訳語による訳文との組と、前記原文の一部を用いて例文を構成した部分列と前記部分列の訳文との組とを、対訳例文として記憶する対訳例文記憶手段、
前記原文と前記部分列との間の包含関係について、包含する文を上位、包含される文を下位とする上下関係で定義した関連リンクを記憶する関連リンク記憶手段、
検索条件となる入力文の入力を受け付ける入力文受付手段、
前記入力文を検索キーとして、前記対訳例文記憶手段内の前記原文と前記部分列とに対する検索を行い、該当する前記原文または前記部分列の前記対訳例文を抽出する検索手段、
前記検索手段で検出された前記対訳例文に関して、前記対訳例文内の前記原文または前記部分列と前記入力文との間で共通する文字数に応じて一致率を計算する一致率計算手段、
前記関連リンク記憶手段を参照し、前記検索手段で抽出された前記対訳例文のうち、前記原文の前記対訳例文に対して下位の前記対訳例文を指し示す下位リンク情報を設定し、前記部分列の前記対訳例文に対して上位の前記対訳例文を指し示す上位リンク情報を設定するリンク付与手段、
前記原文および前記原文に包含される前記部分列それぞれの前記対訳例文のうち前記一致率が最も高い前記対訳例文を表示する結果表示手段、
拡張指示が入力されると、現在表示されている前記対訳例文に替えて、現在表示されている前記対訳例文に設定された前記上位リンク情報で示される前記対訳例文を表示し、縮退指示が入力されると、現在表示されている前記対訳例文に替えて、現在表示されている前記対訳例文に設定された前記下位リンク情報で示される前記対訳例文を表示する拡張・縮退表示手段、
として機能させるための対訳例文検索プログラム。
複数の前記原文それぞれについて、前記原文および前記原文に包含される前記部分列それぞれの前記対訳例文のうち前記一致率が最も高い前記対訳例文を抽出し、抽出された前記対訳例文を前記一致率が高い順に並べ替えるソート手段として機能させ、
前記結果表示手段は、複数の前記原文それぞれについて前記ソート手段で抽出された前記対訳例文を、前記ソート手段で並べ替えられた順番で表示することを特徴とする付記1記載の対訳例文検索プログラム。
前記関連リンク記憶手段には、前記部分列間の包含関係についても前記関連リンクが格納されており、
前記リンク付与手段は、前記検索手段で抽出された前記部分列の下位の前記部分列が存在する場合には、前記部分列の前記対訳例文に対して下位の前記対訳例文を指し示す前記下位リンク情報を設定することを特徴とする付記1記載の対訳例文検索プログラム。
前記拡張・縮退表示手段は、前記拡張ボタンが選択されると、現在表示されている前記対訳例文に替えて前記拡張ボタンに対応する前記対訳例文を表示し、前記縮退ボタンが選択されると、現在表示されている前記対訳例文に替えて前記縮退ボタンに対応する前記対訳例文を表示することを特徴とする付記1記載の対訳例文検索プログラム。
前記原語に関する形態素が登録された原語形態素辞書を記憶する形態素辞書記憶手段、
前記形態素辞書記憶手段に記憶された前記形態素辞書を参照し、前記検索部で検出された前記対訳例文に含まれる前記原文または前記部分列と、前記入力文との形態素解析を行う形態素解析手段、
前記原文または前記部分列に含まれる形態素のうち、前記入力文に含まれる形態素と一致する一致形態素を検出する一致形態素検出手段として機能させ、
前記結果表示手段は、前記一致形態素を強調表示させることを特徴とする付記1記載の対訳例文検索プログラム。
前記形態素解析手段は、前記形態素辞書記憶手段に記憶された前記形態素辞書を参照し、前記検索部で検出された前記対訳例文に含まれる前記原文または前記部分列、前記原文または前記部分列の前記訳文、および前記入力文の形態素解析を行い、
前記コンピュータを、さらに、
前記原語の形態素に対して、前記原語の形態素の対訳となる前記訳語の形態素が関連付けて登録された対訳辞書を記憶する対訳辞書記憶手段、
前記対訳辞書記憶手段内の前記対訳辞書を参照し、前記検索部で検出された前記対訳例文に関して、前記原文または前記部分列内の前記一致形態素の対訳となる対訳形態素を前記訳文から検出する対訳形態素検出手段として機能させ、
前記結果表示手段は、前記一致形態素と前記対訳形態素とを強調表示させることを特徴とする付記7記載の対訳例文検索プログラム。
前記原文を含む文書内の前記原文を含む段落の文字列を記憶する文書記憶手段として機能させ、
前記関連リンク記憶手段は、さらに、前記関連リンクとして、前記段落と前記文書との間の包含関係について、包含する文を上位、包含される文を下位とする上下関係の定義を記憶しており、
前記リンク付与手段は、さらに、前記関連リンク記憶手段を参照し、前記検索手段で抽出された前記対訳例文のうち前記原文を含む前記対訳例文に対して、上位の前記段落を指し示す上位リンク情報を設定し、
前記拡張・縮退表示手段は、前記原文の前記対訳例文が表示されているときに拡張指示が入力されると、現在表示されている前記対訳例文に替えて前記文書記憶手段に格納されている前記段落の文字列を表示することを特徴とする付記1記載の対訳例文検索プログラム。
前記リンク付与手段は、前記検索手段で抽出された前記対訳例文のうち前記原文を含む前記対訳例文に対して、上位の前記段落を指し示す原語上位リンク情報と、上位の前記段落の訳文を指し示す訳語上位リンク情報とを設定し、
前記拡張・縮退表示手段は、前記原文の前記対訳例文が表示されているときに、前記原語上位リンク情報への拡張指示が入力されると、現在表示されている前記対訳例文に替えて前記文書記憶手段に格納されている前記段落の文字列を表示し、前記訳語上位リンク情報への拡張指示が入力されると、現在表示されている前記対訳例文に替えて前記文書記憶手段に格納されている前記段落の訳文を表示することを特徴とする付記11記載の対訳例文検索プログラム。
前記拡張・縮退表示手段は、前記原文の前記対訳例文が表示されているときに、前記原語上位リンク情報に対応する前記拡張ボタンが選択されると、現在表示されている前記対訳例文に替えて前記文書記憶手段に格納されている前記段落の文字列を表示し、前記訳語上位リンク情報に対応する前記拡張ボタンが選択されると、現在表示されている前記対訳例文に替えて前記文書記憶手段に格納されている前記段落の訳文を表示することを特徴とする付記12記載の対訳例文検索プログラム。
原語による複数の原文それぞれについて、前記原文と訳語による訳文との組と、前記原文の一部を用いて例文を構成した部分列と前記部分列の訳文との組とを、対訳例文として記憶する対訳例文記憶手段と、
前記原文と前記部分列との間の包含関係について、包含する文を上位、包含される文を下位とする上下関係で定義した関連リンクを記憶する関連リンク記憶手段と、
検索条件となる入力文の入力を受け付ける入力文受付手段と、
前記入力文を検索キーとして、前記対訳例文記憶手段内の前記原文と前記部分列とに対する検索を行い、該当する前記原文または前記部分列の前記対訳例文を抽出する検索手段と、
前記検索手段で検出された前記対訳例文に関して、前記対訳例文内の前記原文または前記部分列と前記入力文との間で共通する文字数に応じて一致率を計算する一致率計算手段と、
前記関連リンク記憶手段を参照し、前記検索手段で抽出された前記対訳例文のうち、前記原文の前記対訳例文に対して下位の前記対訳例文を指し示す下位リンク情報を設定し、前記部分列の前記対訳例文に対して上位の前記対訳例文を指し示す上位リンク情報を設定するリンク付与手段と、
前記原文および前記原文に包含される前記部分列それぞれの前記対訳例文のうち前記一致率が最も高い前記対訳例文を表示する結果表示手段と、
拡張指示が入力されると、現在表示されている前記対訳例文に替えて、現在表示されている前記対訳例文に設定された前記上位リンク情報で示される前記対訳例文を表示し、縮退指示が入力されると、現在表示されている前記対訳例文に替えて、現在表示されている前記対訳例文に設定された前記下位リンク情報で示される前記対訳例文を表示する拡張・縮退表示手段と、
を有することを特徴とする対訳例文検索装置。
入力文受付手段が、検索条件となる入力文の入力を受け付け、
検索手段が、前記入力文を検索キーとして、原語による複数の原文それぞれについて、前記原文と訳語による訳文との組と、前記原文の一部を用いて例文を構成した部分列と前記部分列の訳文との組とを、対訳例文として記憶する対訳例文記憶手段内の前記原文と前記部分列とに対する検索を行い、該当する前記原文または前記部分列の前記対訳例文を抽出し、
一致率計算手段が、前記検索手段で検出された前記対訳例文に関して、前記対訳例文内の前記原文または前記部分列と前記入力文との間で共通する文字数に応じて一致率を計算する、
リンク付与手段が、前記原文と前記部分列との間の包含関係について、包含する文を上位、包含される文を下位とする上下関係で定義した関連リンクを記憶する関連リンク記憶手段を参照し、前記検索手段で抽出された前記対訳例文のうち、前記原文の前記対訳例文に対して下位の前記対訳例文を指し示す下位リンク情報を設定し、前記部分列の前記対訳例文に対して上位の前記対訳例文を指し示す上位リンク情報を設定し、
結果表示手段が、前記原文および前記原文に包含される前記部分列それぞれの前記対訳例文のうち前記一致率が最も高い前記対訳例文を表示し、
拡張・縮退表示手段が、拡張指示が入力されると、現在表示されている前記対訳例文に替えて、現在表示されている前記対訳例文に設定された前記上位リンク情報で示される前記対訳例文を表示し、縮退指示が入力されると、現在表示されている前記対訳例文に替えて、現在表示されている前記対訳例文に設定された前記下位リンク情報で示される前記対訳例文を表示する、
ことを特徴とする対訳例文検索方法。
2 関連リンク記憶手段
3 入力文受付手段
4 検索手段
5 一致率計算手段
6 リンク付与手段
7 結果表示手段
7a 検索結果画面
7aa,8a,8b 対訳例文
7ab 拡張ボタン
7ac 縮退ボタン
8 拡張・縮退表示手段
Claims (7)
- 原語による例文を検索し、検出された例文に予め対応付けられた訳語による訳文を表示する対訳例文検索プログラムにおいて、
コンピュータを、
原語による複数の原文それぞれについて、前記原文と訳語による訳文との組と、前記原文の一部を用いて例文を構成した部分列と前記部分列の訳文との組とを、対訳例文として記憶する対訳例文記憶手段、
前記原文と前記部分列との間の包含関係について、包含する文を上位、包含される文を下位とする上下関係で定義した関連リンクを記憶する関連リンク記憶手段、
検索条件となる入力文の入力を受け付ける入力文受付手段、
前記入力文を検索キーとして、前記対訳例文記憶手段内の前記原文と前記部分列とに対する検索を行い、該当する前記原文または前記部分列の前記対訳例文を抽出する検索手段、
前記検索手段で検出された前記対訳例文に関して、前記対訳例文内の前記原文または前記部分列と前記入力文との間で共通する文字数に応じて一致率を計算する一致率計算手段、
前記関連リンク記憶手段を参照し、前記検索手段で抽出された前記対訳例文のうち、前記原文の前記対訳例文に対して下位の前記対訳例文を指し示す下位リンク情報を設定し、前記部分列の前記対訳例文に対して上位の前記対訳例文を指し示す上位リンク情報を設定するリンク付与手段、
前記原文および前記原文に包含される前記部分列それぞれの前記対訳例文のうち前記一致率が最も高い前記対訳例文を表示する結果表示手段、
拡張指示が入力されると、現在表示されている前記対訳例文に替えて、現在表示されている前記対訳例文に設定された前記上位リンク情報で示される前記対訳例文を表示し、縮退指示が入力されると、現在表示されている前記対訳例文に替えて、現在表示されている前記対訳例文に設定された前記下位リンク情報で示される前記対訳例文を表示する拡張・縮退表示手段、
として機能させるための対訳例文検索プログラム。 - 前記コンピュータを、さらに、
複数の前記原文それぞれについて、前記原文および前記原文に包含される前記部分列それぞれの前記対訳例文のうち前記一致率が最も高い前記対訳例文を抽出し、抽出された前記対訳例文を前記一致率が高い順に並べ替えるソート手段として機能させ、
前記結果表示手段は、複数の前記原文それぞれについて前記ソート手段で抽出された前記対訳例文を、前記ソート手段で並べ替えられた順番で表示することを特徴とする請求項1記載の対訳例文検索プログラム。 - 前記対訳例文記憶手段には、前記部分列の一部を用いて例文を構成した部分列と当該部分列の訳文との組で構成される前記対訳例文も格納されており、
前記関連リンク記憶手段には、前記部分列間の包含関係についても前記関連リンクが格納されており、
前記リンク付与手段は、前記検索手段で抽出された前記部分列の下位の前記部分列が存在する場合には、前記部分列の前記対訳例文に対して下位の前記対訳例文を指し示す前記下位リンク情報を設定することを特徴とする請求項1記載の対訳例文検索プログラム。 - 前記コンピュータを、さらに、
前記原語に関する形態素が登録された原語形態素辞書を記憶する形態素辞書記憶手段、
前記形態素辞書記憶手段に記憶された前記形態素辞書を参照し、前記検索部で検出された前記対訳例文に含まれる前記原文または前記部分列と、前記入力文との形態素解析を行う形態素解析手段、
前記原文または前記部分列に含まれる形態素のうち、前記入力文に含まれる形態素と一致する一致形態素を検出する一致形態素検出手段として機能させ、
前記結果表示手段は、前記一致形態素を強調表示させることを特徴とする請求項1記載の対訳例文検索プログラム。 - 前記形態素辞書記憶手段は、さらに前記訳語に関する形態素が登録された訳語形態素辞書を記憶しており、
前記形態素解析手段は、前記形態素辞書記憶手段に記憶された前記形態素辞書を参照し、前記検索部で検出された前記対訳例文に含まれる前記原文または前記部分列、前記原文または前記部分列の前記訳文、および前記入力文の形態素解析を行い、
前記コンピュータを、さらに、
前記原語の形態素に対して、前記原語の形態素の対訳となる前記訳語の形態素が関連付けて登録された対訳辞書を記憶する対訳辞書記憶手段、
前記対訳辞書記憶手段内の前記対訳辞書を参照し、前記検索部で検出された前記対訳例文に関して、前記原文または前記部分列内の前記一致形態素の対訳となる対訳形態素を前記訳文から検出する対訳形態素検出手段として機能させ、
前記結果表示手段は、前記一致形態素と前記対訳形態素とを強調表示させることを特徴とする請求項4記載の対訳例文検索プログラム。 - 原語による例文を検索し、検出された例文に予め対応付けられた訳語による訳文を表示する対訳例文検索装置において、
原語による複数の原文それぞれについて、前記原文と訳語による訳文との組と、前記原文の一部を用いて例文を構成した部分列と前記部分列の訳文との組とを、対訳例文として記憶する対訳例文記憶手段と、
前記原文と前記部分列との間の包含関係について、包含する文を上位、包含される文を下位とする上下関係で定義した関連リンクを記憶する関連リンク記憶手段と、
検索条件となる入力文の入力を受け付ける入力文受付手段と、
前記入力文を検索キーとして、前記対訳例文記憶手段内の前記原文と前記部分列とに対する検索を行い、該当する前記原文または前記部分列の前記対訳例文を抽出する検索手段と、
前記検索手段で検出された前記対訳例文に関して、前記対訳例文内の前記原文または前記部分列と前記入力文との間で共通する文字数に応じて一致率を計算する一致率計算手段と、
前記関連リンク記憶手段を参照し、前記検索手段で抽出された前記対訳例文のうち、前記原文の前記対訳例文に対して下位の前記対訳例文を指し示す下位リンク情報を設定し、前記部分列の前記対訳例文に対して上位の前記対訳例文を指し示す上位リンク情報を設定するリンク付与手段と、
前記原文および前記原文に包含される前記部分列それぞれの前記対訳例文のうち前記一致率が最も高い前記対訳例文を表示する結果表示手段と、
拡張指示が入力されると、現在表示されている前記対訳例文に替えて、現在表示されている前記対訳例文に設定された前記上位リンク情報で示される前記対訳例文を表示し、縮退指示が入力されると、現在表示されている前記対訳例文に替えて、現在表示されている前記対訳例文に設定された前記下位リンク情報で示される前記対訳例文を表示する拡張・縮退表示手段と、
を有することを特徴とする対訳例文検索装置。 - 原語による例文を検索し、検出された例文に予め対応付けられた訳語による訳文を表示するためのコンピュータにおける対訳例文検索方法において、
入力文受付手段が、検索条件となる入力文の入力を受け付け、
検索手段が、前記入力文を検索キーとして、原語による複数の原文それぞれについて、前記原文と訳語による訳文との組と、前記原文の一部を用いて例文を構成した部分列と前記部分列の訳文との組とを、対訳例文として記憶する対訳例文記憶手段内の前記原文と前記部分列とに対する検索を行い、該当する前記原文または前記部分列の前記対訳例文を抽出し、
一致率計算手段が、前記検索手段で検出された前記対訳例文に関して、前記対訳例文内の前記原文または前記部分列と前記入力文との間で共通する文字数に応じて一致率を計算する、
リンク付与手段が、前記原文と前記部分列との間の包含関係について、包含する文を上位、包含される文を下位とする上下関係で定義した関連リンクを記憶する関連リンク記憶手段を参照し、前記検索手段で抽出された前記対訳例文のうち、前記原文の前記対訳例文に対して下位の前記対訳例文を指し示す下位リンク情報を設定し、前記部分列の前記対訳例文に対して上位の前記対訳例文を指し示す上位リンク情報を設定し、
結果表示手段が、前記原文および前記原文に包含される前記部分列それぞれの前記対訳例文のうち前記一致率が最も高い前記対訳例文を表示し、
拡張・縮退表示手段が、拡張指示が入力されると、現在表示されている前記対訳例文に替えて、現在表示されている前記対訳例文に設定された前記上位リンク情報で示される前記対訳例文を表示し、縮退指示が入力されると、現在表示されている前記対訳例文に替えて、現在表示されている前記対訳例文に設定された前記下位リンク情報で示される前記対訳例文を表示する、
ことを特徴とする対訳例文検索方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006355467A JP4997966B2 (ja) | 2006-12-28 | 2006-12-28 | 対訳例文検索プログラム、対訳例文検索装置、および対訳例文検索方法 |
US11/975,767 US8024175B2 (en) | 2006-12-28 | 2007-10-22 | Computer program, apparatus, and method for searching translation memory and displaying search result |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006355467A JP4997966B2 (ja) | 2006-12-28 | 2006-12-28 | 対訳例文検索プログラム、対訳例文検索装置、および対訳例文検索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008165563A true JP2008165563A (ja) | 2008-07-17 |
JP4997966B2 JP4997966B2 (ja) | 2012-08-15 |
Family
ID=39585189
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006355467A Expired - Fee Related JP4997966B2 (ja) | 2006-12-28 | 2006-12-28 | 対訳例文検索プログラム、対訳例文検索装置、および対訳例文検索方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US8024175B2 (ja) |
JP (1) | JP4997966B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010225077A (ja) * | 2009-03-25 | 2010-10-07 | Fujitsu Ltd | 検索結果出力プログラム、検索結果出力装置、および検索結果出力方法 |
JP2016091269A (ja) * | 2014-11-04 | 2016-05-23 | 株式会社東芝 | 外国語文作成支援装置、方法及びプログラム |
JP2016536659A (ja) * | 2013-09-30 | 2016-11-24 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 内容ベースの医療マクロのソート及び検索システムのためのシステム及び方法 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7984034B1 (en) * | 2007-12-21 | 2011-07-19 | Google Inc. | Providing parallel resources in search results |
US20110106849A1 (en) * | 2008-03-12 | 2011-05-05 | Nec Corporation | New case generation device, new case generation method, and new case generation program |
TWI376656B (en) * | 2008-09-11 | 2012-11-11 | Shing Lung Chen | Foreign-language learning method utilizing an original language to review corresponding foreign languages and foreign-language learning database system thereof |
US8265922B2 (en) * | 2008-12-02 | 2012-09-11 | Electronics And Telecommunications Research Institute | Method and apparatus for applying translation memory in automatic translation system |
JP6210398B2 (ja) * | 2012-04-25 | 2017-10-11 | 株式会社サン・フレア | 翻訳支援装置、翻訳支援システム、及びそのプログラム |
JP6705318B2 (ja) * | 2016-07-14 | 2020-06-03 | 富士通株式会社 | 対訳辞書作成装置、対訳辞書作成方法、及び対訳辞書作成プログラム |
US10056083B2 (en) * | 2016-10-18 | 2018-08-21 | Yen4Ken, Inc. | Method and system for processing multimedia content to dynamically generate text transcript |
WO2019183543A1 (en) * | 2018-03-23 | 2019-09-26 | John Rankin | System and method for identifying a speaker's community of origin from a sound sample |
WO2020014354A1 (en) | 2018-07-10 | 2020-01-16 | John Rankin | System and method for indexing sound fragments containing speech |
EP4105840A1 (en) * | 2018-08-29 | 2022-12-21 | IPACTORY, Inc. | Patent document creating device, method, computer program, computer-readable recording medium, server and system |
JP7164015B2 (ja) * | 2019-10-01 | 2022-11-01 | Jfeスチール株式会社 | 情報検索システム |
US11699037B2 (en) | 2020-03-09 | 2023-07-11 | Rankin Labs, Llc | Systems and methods for morpheme reflective engagement response for revision and transmission of a recording to a target individual |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05189487A (ja) * | 1991-08-16 | 1993-07-30 | Xerox Corp | 対話式データベース探索方法および装置 |
JPH08161349A (ja) * | 1994-12-02 | 1996-06-21 | Fujitsu Ltd | 文字列検索装置 |
JP2003330924A (ja) * | 2002-05-09 | 2003-11-21 | Fujitsu Ltd | 翻訳支援装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3015223B2 (ja) * | 1993-05-14 | 2000-03-06 | シャープ株式会社 | 特殊共起を処理する電子化辞書装置、及び機械翻訳装置、並びに情報検索装置 |
US6651039B1 (en) * | 1995-08-08 | 2003-11-18 | Matsushita Electric Industrial Co., Ltd. | Mechanical translation apparatus and method |
JP3822990B2 (ja) * | 1999-01-07 | 2006-09-20 | 株式会社日立製作所 | 翻訳装置、記録媒体 |
US20010029455A1 (en) * | 2000-03-31 | 2001-10-11 | Chin Jeffrey J. | Method and apparatus for providing multilingual translation over a network |
US7107204B1 (en) * | 2000-04-24 | 2006-09-12 | Microsoft Corporation | Computer-aided writing system and method with cross-language writing wizard |
AU2001261506A1 (en) * | 2000-05-11 | 2001-11-20 | University Of Southern California | Discourse parsing and summarization |
AU2002210834A1 (en) * | 2000-10-30 | 2002-05-15 | Alphonsus Albertus Schirris | Pre-translated multi-lingual online search system, method, and computer program product |
US7043692B2 (en) * | 2000-12-18 | 2006-05-09 | Ricoh Co., Ltd. | Windows resource file parameterization system and method |
JP2004110583A (ja) | 2002-09-19 | 2004-04-08 | Advanced Telecommunication Research Institute International | 機械翻訳方法およびそのためのコンピュータプログラム |
US20060015323A1 (en) * | 2004-07-13 | 2006-01-19 | Udupa Raghavendra U | Method, apparatus, and computer program for statistical translation decoding |
US7698124B2 (en) * | 2004-11-04 | 2010-04-13 | Microsoft Corporaiton | Machine translation system incorporating syntactic dependency treelets into a statistical framework |
JP4588417B2 (ja) | 2004-11-05 | 2010-12-01 | 富士通株式会社 | 翻訳装置 |
US7974833B2 (en) * | 2005-06-21 | 2011-07-05 | Language Weaver, Inc. | Weighted system of expressing language information using a compact notation |
JP2007122509A (ja) * | 2005-10-28 | 2007-05-17 | Rozetta Corp | 語句配列の自然度判定装置、方法及びプログラム |
-
2006
- 2006-12-28 JP JP2006355467A patent/JP4997966B2/ja not_active Expired - Fee Related
-
2007
- 2007-10-22 US US11/975,767 patent/US8024175B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05189487A (ja) * | 1991-08-16 | 1993-07-30 | Xerox Corp | 対話式データベース探索方法および装置 |
JPH08161349A (ja) * | 1994-12-02 | 1996-06-21 | Fujitsu Ltd | 文字列検索装置 |
JP2003330924A (ja) * | 2002-05-09 | 2003-11-21 | Fujitsu Ltd | 翻訳支援装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010225077A (ja) * | 2009-03-25 | 2010-10-07 | Fujitsu Ltd | 検索結果出力プログラム、検索結果出力装置、および検索結果出力方法 |
US8566079B2 (en) | 2009-03-25 | 2013-10-22 | Fujitsu Limited | Retrieval result outputting apparatus and retrieval result outputting method |
JP2016536659A (ja) * | 2013-09-30 | 2016-11-24 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 内容ベースの医療マクロのソート及び検索システムのためのシステム及び方法 |
JP2016091269A (ja) * | 2014-11-04 | 2016-05-23 | 株式会社東芝 | 外国語文作成支援装置、方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US8024175B2 (en) | 2011-09-20 |
JP4997966B2 (ja) | 2012-08-15 |
US20080162115A1 (en) | 2008-07-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4997966B2 (ja) | 対訳例文検索プログラム、対訳例文検索装置、および対訳例文検索方法 | |
JP3356536B2 (ja) | 機械翻訳装置 | |
US7260570B2 (en) | Retrieving matching documents by queries in any national language | |
JP4076520B2 (ja) | 翻訳支援プログラムおよび単語対応付けプログラム | |
JP3952216B2 (ja) | 翻訳装置及び辞書検索装置 | |
JP4504555B2 (ja) | 翻訳支援システム | |
US8027966B2 (en) | Method and system for searching a multi-lingual database | |
JP4502615B2 (ja) | 類似文検索装置、類似文検索方法、およびプログラム | |
JPH11345249A (ja) | 情報検索のための方法および装置ならびに記憶媒体 | |
JP2005122295A (ja) | 関係図作成プログラム、関係図作成方法、および関係図作成装置 | |
JP4832952B2 (ja) | データベース解析システム及びデータベース解析方法及びプログラム | |
JP2007058706A (ja) | 文書検索システム、文書検索方法及び文書検索プログラム | |
JP4953440B2 (ja) | 形態素解析装置、形態素解析方法、形態素解析プログラム及びコンピュータプログラムを格納した記録媒体 | |
JP2010225077A (ja) | 検索結果出力プログラム、検索結果出力装置、および検索結果出力方法 | |
CN112104917A (zh) | 一种单双语字幕修改查找处理方法及系统 | |
JPS6118074A (ja) | プレ・エデイツト方式 | |
EP1072986A2 (en) | System and method for extracting data from semi-structured text | |
JP5909123B2 (ja) | 機械翻訳装置、機械翻訳方法およびプログラム | |
JP4432475B2 (ja) | 文書検索装置、文書検索方法、プログラム | |
JP2018147205A (ja) | 情報処理装置及び情報処理プログラム | |
JPH1011424A (ja) | 文章作成支援装置 | |
JP5521670B2 (ja) | パターンマッチング装置、翻訳装置、翻訳システム及び翻訳プログラム | |
JP3952009B2 (ja) | 翻訳メモリシステム、翻訳方法、および翻訳メモリシステム用プログラム | |
JP4206266B2 (ja) | 全文検索装置、処理方法、処理プログラム及び記録媒体 | |
JP2004157830A (ja) | 情報検索プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090907 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120413 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120417 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120430 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150525 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |