JP2007058706A - 文書検索システム、文書検索方法及び文書検索プログラム - Google Patents
文書検索システム、文書検索方法及び文書検索プログラム Download PDFInfo
- Publication number
- JP2007058706A JP2007058706A JP2005245306A JP2005245306A JP2007058706A JP 2007058706 A JP2007058706 A JP 2007058706A JP 2005245306 A JP2005245306 A JP 2005245306A JP 2005245306 A JP2005245306 A JP 2005245306A JP 2007058706 A JP2007058706 A JP 2007058706A
- Authority
- JP
- Japan
- Prior art keywords
- document
- search
- translation
- character string
- translated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】本発明の文書検索システムは、翻訳用辞書を用いて各原文文書を検索文字列の言語に翻訳すると共に、原文文字列とそれに対応する翻訳文字列との関係を示す文字列対応情報を作成する文書翻訳手段と、文書翻訳手段による、各原文文書の各翻訳文書と文字列対応情報とを蓄積する翻訳文書蓄積手段と、翻訳文書蓄積手段に蓄積されている各翻訳文書の中から、検索文字列を含む1又は複数の文書を検索する翻訳文書検索手段と、文字列対応情報に基づいて翻訳文書検索手段が検索した各翻訳文書中の検索文字列と、それに対応する各原文文書中の原文文字列とに対して強調表示処理を行うと共に、少なくとも翻訳文書検索手段が検索した各翻訳文書とその各原文文書とを出力させる文書出力手段とを備える。
【選択図】 図1
Description
以下、本発明の文書検索システム、文書検索方法及び文書検索プログラムの実施形態を図面を参照して説明する。
図1は、本実施形態の文書検索システムを実現する機能構成を示す機能ブロック図である。
次に、本実施形態の文書検索システム10の動作を図面を参照して説明する。
以上のように、本実施形態によれば、文書検索前に、翻訳手段1100が、文書の単語について、適切な同義語を対応付けた検索用翻訳文書を作成し、文書検索手段1200が検索用翻訳文書に基づいて文書を検索することにより、検索語の同義語も含めた文書検索をすることができる。その結果、検索もれを防止することができる。
以下、本発明の文書検索システム、文書検索方法及び文書検索プログラムの第2の実施形態を図面を参照して説明する。
図8は、本実施形態の文書検索システムの機能構成を示す機能ブロック図であり、本実施形態の文書検索システム11は、翻訳手段6100と文書検索手段6200を有して構成される。
次に、本実施形態の文書検索システム11の動作を図面を参照して説明する。
以上のように、本実施形態によれば、検索用翻訳処理と表示用翻訳処理とを別処理で行うことにより、翻訳処理にかかる負荷を分散でき、計算負荷を比較的低くすることができる。これにより、大量の文書を翻訳することができる。
次に、本発明の文書検索システム、文書検索方法及び文書検索プログラムの第2の実施形態を図面を参照して説明する。
図12は、本実施形態の文書検索システムの機能構成を示す機能ブロック図であり、文書検索システム12は、翻訳手段10100、文書検索手段10200を有する。
以下、本実施形態の文書検索システム12の動作を図面を参照して説明する。
以上のように、本実施形態によれば、第1及び第2の実施形態と同様の効果を得ることができる。
次に、本発明の文書検索システム、文書検索方法及び文書検索プログラムの第2の実施形態を図面を参照して説明する。
図15は、本実施形態の文書検索システムの機能構成を示す機能ブロック図であり、本実施形態の文書検索システム13は、分野別辞書13110、文書データベース13120、検索語入力手段13130、検索語翻訳処理部13140、検索語対応記憶部13150、検索処理部13160、検索結果翻訳処理部13170、強調表示処理部13180を少なくとも有する。
次に、本実施形態の文書検索システム13の動作を説明する。図16は、本実施形態の文書検索システム13の文書検索処理の動作を示すフローチャートである。
以上、本実施形態によれば、第1〜第3の実施形態の効果と同様の効果を得ることができる。
(E−1)上述した第1〜第4の実施形態の言語を横断した検索において、ユーザの母国語で、外国語文書を検索することができ、また、検索結果もユーザの母国で表示するため、検索結果から目的文書を見つけ出すことを容易にするものである。
Claims (11)
- 入力された検索文字列を用いて、1又は複数の各言語でなる文書群の中から、上記検索文字列及び又はそれに対応する文字列を含む1又は複数の文書を検索する文書検索システムにおいて、
翻訳用辞書を用いて、1又は複数の各言語でなる各原文文書を上記検索文字列の言語に翻訳すると共に、翻訳前の原文文字列とそれに対応する1又は複数の翻訳文字列との関係を示す文字列対応情報を作成する文書翻訳手段と、
上記文書翻訳手段による、上記各原文文書の各翻訳文書と上記文字列対応情報とを蓄積する翻訳文書蓄積手段と、
上記翻訳文書蓄積手段に蓄積されている上記各翻訳文書の中から、上記検索文字列を含む1又は複数の文書を検索する翻訳文書検索手段と、
上記文字列対応情報に基づいて、上記翻訳文書検索手段が検索した上記各翻訳文書中の上記検索文字列と、それに対応する上記各原文文書中の上記原文文字列とに対して強調表示処理を行うと共に、少なくとも上記翻訳文書検索手段が検索した上記各翻訳文書とその各原文文書とを出力させる文書出力手段と
を備えることを特徴とする文書検索システム。 - 入力された検索文字列を用いて、1又は複数の各言語でなる文書群の中から、上記検索文字列及び又はそれに対応する文字列を含む1又は複数の文書を検索する文書検索システムにおいて、
検索対象とする1又は複数の各言語でなる1又は複数の原文文書を蓄積する原文文書蓄積手段と、
翻訳用辞書を用いて、上記検索用文字列を上記各原文文書の言語に翻訳すると共に、上記翻訳用辞書における、翻訳後の翻訳検索文字列とそれに対応する1又は複数の翻訳検索文字列との関係を示す文字列対応情報を作成する検索文字列翻訳手段と、
上記検索文字列翻訳手段による上記文字列対応情報を記憶する文字列対応情報記憶手段と、
上記原文文書蓄積手段に蓄積されている上記各原文文書の中から、上記翻訳検索文字列を含む1又は複数の文書を検索する原文文書検索手段と、
上記原文文書検索手段が検索した各原文文書を、上記翻訳用辞書を用いて上記検索文字列の言語に翻訳する原文文書翻訳手段と、
上記文字列対応情報に基づいて、上記原文文書検索手段が検索した上記各原文文書中の上記翻訳検索文字列と、それに対応する上記各翻訳文書中の上記文字列とに対して強調表示処理を行うと共に、少なくとも上記原文文書検索手段が検索した上記各原文文書とその各翻訳文書とを出力させる文書出力手段と
を備えることを特徴とする文書検索システム。 - 上記翻訳用辞書が、文書検索カテゴリーの分野別辞書であり、ある見出し文字列に対して複数の同等意義の翻訳文字列が対応付けられた見出し文字列を有することを特徴とする請求項1又は2に記載の文書検索システム。
- 上記文字列対応情報は、上記各原文文書における上記各原文文字列の位置情報と、それに対応する上記各翻訳文書における上記各翻訳文字列の位置情報とを対応付けた情報を有するものであり、
上記文書出力手段は、上記文字列対応情報に基づいて、上記各翻訳文書と上記各原文文書内での強調表示させる文字列の位置を特定することを特徴とする請求項1又は3に記載の文書検索システム。 - 上記文字列対応情報は、上記各翻訳文書中に、上記各原文文字列と上記各翻訳文字列とが対応付けをもって、並べて示されたものであり、
上記文書出力手段は、上記各原文文字列と並べられた上記各翻訳文字列と、上記検索文字列とを比較することで、上記各翻訳文書と上記各原文文書内での強調表示させる文字列の位置を特定することを特徴とする請求項1又は3に記載の文書検索システム。 - 上記文書出力手段は、上記検索文字列を特定すると、特定した上記検索文字列情報以外の上記文字列対応情報を削除することを特徴とする請求項5に記載の文書検索システム。
- 上記文字列対応情報は、上記各原文文書における上記各原文文字列の位置情報と、それに対応する上記各翻訳文書における上記各翻訳文字列の位置情報とを有するものであり、
上記文書出力手段は、上記文字列対応情報に基づいて、上記各翻訳文書と上記各原文文書内での強調表示させる文字列の位置を特定することを特徴とする請求項2又は3に記載の文書検索システム。 - 入力された検索文字列を用いて、1又は複数の各言語でなる文書群の中から、上記検索文字列及び又はそれに対応する文字列を含む1又は複数の文書を検索する文書検索方法において、
文書翻訳手段が、翻訳用辞書を用いて、1又は複数の各言語でなる各原文文書を上記検索文字列の言語に翻訳すると共に、翻訳前の原文文字列とそれに対応する1又は複数の翻訳文字列との関係を示す文字列対応情報を作成する文書翻訳工程と、
翻訳文書蓄積手段が、上記文書翻訳手段による、上記各原文文書の各翻訳文書と上記文字列対応情報とを蓄積する翻訳文書蓄積工程と、
翻訳文書検索手段が、上記翻訳文書蓄積手段に蓄積されている上記各翻訳文書の中から、上記検索文字列を含む1又は複数の文書を検索する翻訳文書検索工程と、
文書出力手段が、上記文字列対応情報に基づいて、上記翻訳文書検索手段が検索した上記各翻訳文書中の上記検索文字列と、それに対応する上記各原文文書中の上記原文文字列とに対して強調表示処理を行うと共に、少なくとも上記翻訳文書検索手段が検索した上記各翻訳文書とその各原文文書とを出力させる文書出力工程と
を備えることを特徴とする文書検索方法。 - 入力された検索文字列を用いて、1又は複数の各言語でなる文書群の中から、上記検索文字列及び又はそれに対応する文字列を含む1又は複数の文書を検索する文書検索方法において、
原文文書蓄積手段が、検索対象とする1又は複数の各言語でなる1又は複数の原文文書を蓄積する原文文書蓄積工程と、
検索文字列翻訳手段が、翻訳用辞書を用いて、上記検索用文字列を上記各原文文書の言語に翻訳すると共に、上記翻訳用辞書における、翻訳後の翻訳検索文字列とそれに対応する1又は複数の翻訳検索文字列との関係を示す文字列対応情報を作成する検索文字列翻訳工程と、
文字列対応情報記憶手段が、上記検索文字列翻訳手段による上記文字列対応情報を記憶する文字列対応情報記憶工程と、
原文文書検索手段が、上記原文文書蓄積手段に蓄積されている上記各原文文書の中から、上記翻訳検索文字列を含む1又は複数の文書を検索する原文文書検索工程と、
原文文書翻訳手段が、上記原文文書検索手段が検索した各原文文書を、上記翻訳用辞書を用いて上記検索文字列の言語に翻訳する原文文書翻訳工程と、
文書出力手段が、上記文字列対応情報に基づいて、上記原文文書検索手段が検索した上記各原文文書中の上記翻訳検索文字列と、それに対応する上記各翻訳文書中の上記文字列とに対して強調表示処理を行うと共に、少なくとも上記原文文書検索手段が検索した上記各原文文書とその各翻訳文書とを出力させる文書出力工程と
を備えることを特徴とする文書検索方法。 - 入力された検索文字列を用いて、1又は複数の各言語でなる文書群の中から、上記検索文字列及び又はそれに対応する文字列を含む1又は複数の文書を検索させる文書検索プログラムにおいて、
コンピュータに、
翻訳用辞書を用いて、1又は複数の各言語でなる各原文文書を上記検索文字列の言語に翻訳すると共に、翻訳前の原文文字列とそれに対応する1又は複数の翻訳文字列との関係を示す文字列対応情報を作成する文書翻訳手段、
上記文書翻訳手段による、上記各原文文書の各翻訳文書と上記文字列対応情報とを蓄積する翻訳文書蓄積手段、
上記翻訳文書蓄積手段に蓄積されている上記各翻訳文書の中から、上記検索文字列を含む1又は複数の文書を検索する翻訳文書検索手段、
上記文字列対応情報に基づいて、上記翻訳文書検索手段が検索した上記各翻訳文書中の上記検索文字列と、それに対応する上記各原文文書中の上記原文文字列とに対して強調表示処理を行うと共に、少なくとも上記翻訳文書検索手段が検索した上記各翻訳文書とその各原文文書とを出力させる文書出力手段
として機能させることを特徴とする文書検索プログラム。 - 入力された検索文字列を用いて、1又は複数の各言語でなる文書群の中から、上記検索文字列及び又はそれに対応する文字列を含む1又は複数の文書を検索させる文書検索プログラムにおいて、
コンピュータに、
検索対象とする1又は複数の各言語でなる1又は複数の原文文書を蓄積する原文文書蓄積手段、
翻訳用辞書を用いて、上記検索用文字列を上記各原文文書の言語に翻訳すると共に、上記翻訳用辞書における、翻訳後の翻訳検索文字列とそれに対応する1又は複数の翻訳検索文字列との関係を示す文字列対応情報を作成する検索文字列翻訳手段、
上記検索文字列翻訳手段による上記文字列対応情報を記憶する文字列対応情報記憶手段、
上記原文文書蓄積手段に蓄積されている上記各原文文書の中から、上記翻訳検索文字列を含む1又は複数の文書を検索する原文文書検索手段、
上記原文文書検索手段が検索した各原文文書を、上記翻訳用辞書を用いて上記検索文字列の言語に翻訳する原文文書翻訳手段、
上記文字列対応情報に基づいて、上記原文文書検索手段が検索した上記各原文文書中の上記翻訳検索文字列と、それに対応する上記各翻訳文書中の上記文字列とに対して強調表示処理を行うと共に、少なくとも上記原文文書検索手段が検索した上記各原文文書とその各翻訳文書とを出力させる文書出力手段
として機能させることを特徴とする文書検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005245306A JP4254763B2 (ja) | 2005-08-26 | 2005-08-26 | 文書検索システム、文書検索方法及び文書検索プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005245306A JP4254763B2 (ja) | 2005-08-26 | 2005-08-26 | 文書検索システム、文書検索方法及び文書検索プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007058706A true JP2007058706A (ja) | 2007-03-08 |
JP4254763B2 JP4254763B2 (ja) | 2009-04-15 |
Family
ID=37922125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005245306A Expired - Fee Related JP4254763B2 (ja) | 2005-08-26 | 2005-08-26 | 文書検索システム、文書検索方法及び文書検索プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4254763B2 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007323238A (ja) * | 2006-05-31 | 2007-12-13 | National Institute Of Information & Communication Technology | 強調表示装置及びプログラム |
WO2008144538A1 (en) * | 2007-05-16 | 2008-11-27 | Google Inc. | Cross-language information retrieval |
JP2008287517A (ja) * | 2007-05-17 | 2008-11-27 | National Institute Of Information & Communication Technology | 強調表示装置及びプログラム |
JP2009128928A (ja) * | 2007-11-19 | 2009-06-11 | Brother Ind Ltd | 翻訳文出力方法、翻訳文出力装置、及び翻訳文出力プログラム |
JP2012123691A (ja) * | 2010-12-09 | 2012-06-28 | Sunflare Co Ltd | 中継サーバ |
JP2013114528A (ja) * | 2011-11-30 | 2013-06-10 | Casio Comput Co Ltd | 例文表示装置及びプログラム |
US8639701B1 (en) | 2010-11-23 | 2014-01-28 | Google Inc. | Language selection for information retrieval |
JP2020071865A (ja) * | 2018-11-02 | 2020-05-07 | サウンドハウンド,インコーポレイテッド | インテリジェントクロスドメイン検索を行うためのシステムおよび方法 |
-
2005
- 2005-08-26 JP JP2005245306A patent/JP4254763B2/ja not_active Expired - Fee Related
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007323238A (ja) * | 2006-05-31 | 2007-12-13 | National Institute Of Information & Communication Technology | 強調表示装置及びプログラム |
WO2008144538A1 (en) * | 2007-05-16 | 2008-11-27 | Google Inc. | Cross-language information retrieval |
US8799307B2 (en) | 2007-05-16 | 2014-08-05 | Google Inc. | Cross-language information retrieval |
JP2008287517A (ja) * | 2007-05-17 | 2008-11-27 | National Institute Of Information & Communication Technology | 強調表示装置及びプログラム |
JP2009128928A (ja) * | 2007-11-19 | 2009-06-11 | Brother Ind Ltd | 翻訳文出力方法、翻訳文出力装置、及び翻訳文出力プログラム |
US8639701B1 (en) | 2010-11-23 | 2014-01-28 | Google Inc. | Language selection for information retrieval |
US8862595B1 (en) | 2010-11-23 | 2014-10-14 | Google Inc. | Language selection for information retrieval |
JP2012123691A (ja) * | 2010-12-09 | 2012-06-28 | Sunflare Co Ltd | 中継サーバ |
JP2013114528A (ja) * | 2011-11-30 | 2013-06-10 | Casio Comput Co Ltd | 例文表示装置及びプログラム |
JP2020071865A (ja) * | 2018-11-02 | 2020-05-07 | サウンドハウンド,インコーポレイテッド | インテリジェントクロスドメイン検索を行うためのシステムおよび方法 |
Also Published As
Publication number | Publication date |
---|---|
JP4254763B2 (ja) | 2009-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100572797B1 (ko) | 데이터베이스 검색 방법, 데이터베이스 검색 시스템 및 컴퓨터 판독 가능 기록 매체 | |
JP4658420B2 (ja) | 文字列の正規化表示を生成するシステム | |
JP3690938B2 (ja) | インデックスの作成装置および作成方法、ならびに記憶媒体 | |
US5850561A (en) | Glossary construction tool | |
US6823325B1 (en) | Methods and apparatus for storing and retrieving knowledge | |
JP4254763B2 (ja) | 文書検索システム、文書検索方法及び文書検索プログラム | |
JPH11345249A (ja) | 情報検索のための方法および装置ならびに記憶媒体 | |
US9558234B1 (en) | Automatic metadata identification | |
US20050267734A1 (en) | Translation support program and word association program | |
KR100835706B1 (ko) | 자동 색인을 위한 한국어 형태소 분석 시스템 및 그 방법 | |
Smith et al. | Corpus tools and methods, today and tomorrow: Incorporating linguists’ manual annotations | |
JP5107556B2 (ja) | 改善された中国語−英語翻訳ツール | |
US20070203691A1 (en) | Translator support program, translator support device and translator support method | |
US20050246351A1 (en) | Document information mining tool | |
Barlow | Parallel texts and corpus-based contrastive analysis | |
US6807545B1 (en) | Method and system for retrieving documents via an electronic data file | |
US20060248037A1 (en) | Annotation of inverted list text indexes using search queries | |
JP5679400B2 (ja) | カテゴリ主題語句抽出装置及び階層的タグ付与装置及び方法及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
KR100659370B1 (ko) | 시소러스 매칭에 의한 문서 db 형성 방법 및 정보검색방법 | |
JP4301879B2 (ja) | 抄録作成支援システム及び特許文献検索システム | |
Shreve | Corpus enhancement and computer-assisted localization and translation | |
JP2009104475A (ja) | 類似文書検索装置、類似文書検索方法およびプログラム | |
JPH06348751A (ja) | 言語変換装置 | |
JP4587908B2 (ja) | メタデータ生成装置、メタデータ制約定義処理装置およびその制御方法 | |
KR20200122089A (ko) | 지역 색인을 이용한 전자문서 검색 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080819 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081125 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090106 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090119 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120206 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120206 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120206 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130206 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140206 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |