JP4254763B2 - 文書検索システム、文書検索方法及び文書検索プログラム - Google Patents
文書検索システム、文書検索方法及び文書検索プログラム Download PDFInfo
- Publication number
- JP4254763B2 JP4254763B2 JP2005245306A JP2005245306A JP4254763B2 JP 4254763 B2 JP4254763 B2 JP 4254763B2 JP 2005245306 A JP2005245306 A JP 2005245306A JP 2005245306 A JP2005245306 A JP 2005245306A JP 4254763 B2 JP4254763 B2 JP 4254763B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- search
- translation
- character string
- translated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Description
以下、本発明の文書検索システム、文書検索方法及び文書検索プログラムの実施形態を図面を参照して説明する。
図1は、本実施形態の文書検索システムを実現する機能構成を示す機能ブロック図である。
次に、本実施形態の文書検索システム10の動作を図面を参照して説明する。
以上のように、本実施形態によれば、文書検索前に、翻訳手段1100が、文書の単語について、適切な同義語を対応付けた検索用翻訳文書を作成し、文書検索手段1200が検索用翻訳文書に基づいて文書を検索することにより、検索語の同義語も含めた文書検索をすることができる。その結果、検索もれを防止することができる。
以下、本発明の文書検索システム、文書検索方法及び文書検索プログラムの第2の実施形態を図面を参照して説明する。
図8は、本実施形態の文書検索システムの機能構成を示す機能ブロック図であり、本実施形態の文書検索システム11は、翻訳手段6100と文書検索手段6200を有して構成される。
次に、本実施形態の文書検索システム11の動作を図面を参照して説明する。
以上のように、本実施形態によれば、検索用翻訳処理と表示用翻訳処理とを別処理で行うことにより、翻訳処理にかかる負荷を分散でき、計算負荷を比較的低くすることができる。これにより、大量の文書を翻訳することができる。
次に、本発明の文書検索システム、文書検索方法及び文書検索プログラムの第3の実施形態を図面を参照して説明する。
図12は、本実施形態の文書検索システムの機能構成を示す機能ブロック図であり、文書検索システム12は、翻訳手段10100、文書検索手段10200を有する。
以下、本実施形態の文書検索システム12の動作を図面を参照して説明する。
以上のように、本実施形態によれば、第1及び第2の実施形態と同様の効果を得ることができる。
次に、本発明の文書検索システム、文書検索方法及び文書検索プログラムの第2の実施形態を図面を参照して説明する。
図15は、本実施形態の文書検索システムの機能構成を示す機能ブロック図であり、本実施形態の文書検索システム13は、分野別辞書13110、文書データベース13120、検索語入力手段13130、検索語翻訳処理部13140、検索語対応記憶部13150、検索処理部13160、検索結果翻訳処理部13170、強調表示処理部13180を少なくとも有する。
次に、本実施形態の文書検索システム13の動作を説明する。図16は、本実施形態の文書検索システム13の文書検索処理の動作を示すフローチャートである。
以上、本実施形態によれば、第1〜第3の実施形態の効果と同様の効果を得ることができる。
(E−1)上述した第1〜第4の実施形態の言語を横断した検索において、ユーザの母国語で、外国語文書を検索することができ、また、検索結果もユーザの母国で表示するため、検索結果から目的文書を見つけ出すことを容易にするものである。
Claims (11)
- 入力された被検索文字列を用いて、1又は複数の各言語でなる文書群の中から、上記被検索文字列及び又はそれに対応する文字列を含む1又は複数の文書を検索する文書検索システムにおいて、
文書検索カテゴリーの分野別辞書であり、第1言語の文字列と、当該分野のそれぞれ第2言語の同等の意義として用いられる複数の検索用文字列とを予め対応付けた翻訳用辞書と、
上記翻訳用辞書を用いて、第1言語でなる各原文文書を第2言語に翻訳すると共に、第1言語の原文文字列とそれに対応する第2言語の複数の検索用文字列との関係を示す文字列対応情報を作成する文書翻訳手段と、
上記文書翻訳手段による、上記各原文文書の各翻訳文書と、上記各翻訳文書の上記文字列対応情報とを蓄積する翻訳文書蓄積手段と、
上記各文字列対応情報の上記複数の検索用文字列の中から、第2言語の被検索文字列が含まれるか否かを判断し、上記各文字列対応情報に上記被検索文字列を含む上記各翻訳文書を検索する翻訳文書検索手段と、
上記翻訳文書検索手段が検索した上記各翻訳文書の上記文字列対応情報が有する上記検索用文字列の中から上記被検索文字列を検出し、当該翻訳文書中の上記被検索文字列と、それに対応する上記各原文文書中の上記原文文字列とに対して強調表示処理を行うと共に、少なくとも上記翻訳文書検索手段が検索した上記各翻訳文書とその各原文文書とを出力させる文書出力手段と
を備えることを特徴とする文書検索システム。 - 入力された被検索文字列を用いて、1又は複数の各言語でなる文書群の中から、上記被検索文字列及び又はそれに対応する文字列を含む1又は複数の文書を検索する文書検索システムにおいて、
第1言語でなる1又は複数の原文文書を蓄積する原文文書蓄積手段と、
文書検索カテゴリーの分野別辞書であり、第1言語の文字列と、当該分野のそれぞれ第2言語の同等の意義として用いられる複数の検索用文字列とを予め対応付けた翻訳用辞書と、
上記翻訳用辞書を用いて、第2言語でなる被検索文字列を第1言語に翻訳して翻訳被検索文字列を生成し、この翻訳被検索文字列に対応する上記複数の検索用文字列との関係を示す文字列対応情報を作成する被検索文字列翻訳手段と、
上記被検索文字列翻訳手段による上記文字列対応情報を記憶する文字列対応情報記憶手段と、
上記原文文書蓄積手段に蓄積されている上記各原文文書の中から、上記翻訳被検索文字列を含む1又は複数の上記原文文書を検索する原文文書検索手段と、
上記原文文書検索手段が検索した上記各原文文書を、上記翻訳用辞書を用いて第2言語に翻訳し、当該原文文書の上記翻訳被検索文字列については上記文字列対応情報の上記複数の検索用文字列の中から上記被検索文字列を用いて翻訳する原文文書翻訳手段と、
上記原文文書翻訳手段が翻訳した各翻訳文書中の上記被検索文字列と、それに対応する上記原文文書中の上記翻訳被検索文字列とに対して強調表示処理を行うと共に、少なくとも上記原文文書検索手段が検索した上記各原文文書とその各翻訳文書とを出力させる文書出力手段と
を備えることを特徴とする文書検索システム。 - 上記文字列対応情報は、上記各原文文書における上記各原文文字列の位置情報と、それに対応する上記各翻訳文書における上記各検出用文字列の位置情報とを対応付けた情報を有するものであり、
上記文書出力手段は、上記文字列対応情報に基づいて、上記各翻訳文書と上記各原文文書内での強調表示させる文字列の位置を特定することを特徴とする請求項1に記載の文書検索システム。 - 上記文字列対応情報は、上記各翻訳文書中に、上記各原文文字列と上記各検索用文字列とが対応付けをもって、並べて示されたものであり、
上記文書出力手段は、上記各原文文字列と並べられた上記各検索用文字列と、上記被検索文字列とを比較することで、上記各翻訳文書と上記各原文文書内での強調表示させる文字列の位置を特定することを特徴とする請求項1に記載の文書検索システム。 - 上記文書出力手段は、上記被検索文字列を特定すると、特定した上記被検索文字列以外の上記文字列対応情報に含まれる上記検出用文字列を削除することを特徴とする請求項4に記載の文書検索システム。
- 上記文字列対応情報は、上記各原文文書における上記各翻訳被検索文字列の位置情報と、それに対応する上記各翻訳文書における上記各検出用文字列の位置情報とを有するものであり、
上記文書出力手段は、上記文字列対応情報に基づいて、上記各翻訳文書と上記各原文文書内での強調表示させる文字列の位置を特定することを特徴とする請求項2に記載の文書検索システム。 - 上記文書出力手段は、上記各原文文書中及び又は上記各翻訳文書中に、上記被検索文字列に相当する文字列が当該被検索文字列と異なる場合、当該被検索文字列に置き換えて強調表示することを特徴とする請求項1〜6のいずれかに記載の文書検索システム。
- 入力された被検索文字列を用いて、1又は複数の各言語でなる文書群の中から、上記被検索文字列及び又はそれに対応する文字列を含む1又は複数の文書を検索する文書検索システムの文書検索方法において、
文書検索カテゴリーの分野別辞書であり、第1言語の文字列と、当該分野のそれぞれ第2言語の同等の意義として用いられる複数の検索用文字列とを予め対応付けた翻訳用辞書を有する文書検索システムが、文書翻訳手段、翻訳文書蓄積手段、翻訳文書検索手段及び文書出力手段を備え、
上記文書翻訳手段が、上記翻訳用辞書を用いて、第1言語でなる各原文文書を第2言語に翻訳すると共に、第1言語の原文文字列とそれに対応する第2言語の複数の検索用文字列との関係を示す文字列対応情報を作成する文書翻訳工程と、
上記翻訳文書蓄積手段が、上記文書翻訳手段による、上記各原文文書の各翻訳文書と、上記各翻訳文書の上記文字列対応情報とを蓄積する翻訳文書蓄積工程と、
上記翻訳文書検索手段が、上記各文字列対応情報の上記複数の検索用文字列の中から、第2言語の被検索文字列が含まれるか否かを判断し、上記各文字列対応情報に上記被検索文字列を含む上記各翻訳文書を検索する翻訳文書検索工程と、
上記文書出力手段が、上記翻訳文書検索手段が検索した上記各翻訳文書の上記文字列対応情報が有する上記検索用文字列の中から上記被検索文字列を検出し、当該翻訳文書中の上記被検索文字列と、それに対応する上記各原文文書中の上記原文文字列とに対して強調表示処理を行うと共に、少なくとも上記翻訳文書検索手段が検索した上記各翻訳文書とその各原文文書とを出力させる文書出力工程と
を有することを特徴とする文書検索方法。 - 入力された被検索文字列を用いて、1又は複数の各言語でなる文書群の中から、上記被検索文字列及び又はそれに対応する文字列を含む1又は複数の文書を検索する文書検索システムの文書検索方法において、
文書検索カテゴリーの分野別辞書であり、第1言語の文字列と、当該分野のそれぞれ第2言語の同等の意義として用いられる複数の検索用文字列とを予め対応付けた翻訳用辞書を有する文書検索システムが、原文文書蓄積手段、被検索文字列翻訳手段、文字列対応情報記憶手段、原文文書検索手段、原文文書翻訳手段及び文書出力手段を備え、
上記原文文書蓄積手段が、第1言語でなる1又は複数の原文文書を蓄積する原文文書蓄積工程と、
上記被検索文字列翻訳手段が、上記翻訳用辞書を用いて、第2言語でなる被検索文字列を第1言語に翻訳して翻訳被検索文字列を生成し、この翻訳被検索文字列に対応する上記複数の検索用文字列との関係を示す文字列対応情報を作成する被検索文字列翻訳工程と、
上記文字列対応情報記憶手段が、上記被検索文字列翻訳手段による上記文字列対応情報を記憶する文字列対応情報記憶工程と、
上記原文文書検索手段が、上記原文文書蓄積手段に蓄積されている上記各原文文書の中から、上記翻訳被検索文字列を含む1又は複数の上記原文文書を検索する原文文書検索工程と、
上記原文文書翻訳手段が、上記原文文書検索手段が検索した上記各原文文書を、上記翻訳用辞書を用いて第2言語に翻訳し、当該原文文書の上記翻訳被検索文字列については上記文字列対応情報の上記複数の検索用文字列の中から上記被検索文字列を用いて翻訳する原文文書翻訳工程と、
上記文書出力手段が、上記原文文書翻訳手段が翻訳した各翻訳文書中の上記被検索文字列と、それに対応する上記原文文書中の上記翻訳被検索文字列とに対して強調表示処理を行うと共に、少なくとも上記原文文書検索手段が検索した上記各原文文書とその各翻訳文書とを出力させる文書出力工程と
を有することを特徴とする文書検索方法。 - 入力された被検索文字列を用いて、1又は複数の各言語でなる文書群の中から、上記被検索文字列及び又はそれに対応する文字列を含む1又は複数の文書を検索させる文書検索プログラムにおいて、
文書検索カテゴリーの分野別辞書であり、第1言語の文字列と、当該分野のそれぞれ第2言語の同等の意義として用いられる複数の検索用文字列とを予め対応付けた翻訳用辞書を有するコンピュータを、
上記翻訳用辞書を用いて、第1言語でなる各原文文書を第2言語に翻訳すると共に、第1言語の原文文字列とそれに対応する第2言語の複数の検索用文字列との関係を示す文字列対応情報を作成する文書翻訳手段、
上記文書翻訳手段による、上記各原文文書の各翻訳文書と、上記各翻訳文書の上記文字列対応情報とを蓄積する翻訳文書蓄積手段、
上記各文字列対応情報の上記複数の検索用文字列の中から、第2言語の被検索文字列が含まれるか否かを判断し、上記各文字列対応情報に上記被検索文字列を含む上記各翻訳文書を検索する翻訳文書検索手段、
上記翻訳文書検索手段が検索した上記各翻訳文書の上記文字列対応情報が有する上記検索用文字列の中から上記被検索文字列を検出し、当該翻訳文書中の上記被検索文字列と、それに対応する上記各原文文書中の上記原文文字列とに対して強調表示処理を行うと共に、少なくとも上記翻訳文書検索手段が検索した上記各翻訳文書とその各原文文書とを出力させる文書出力手段
として機能させることを特徴とする文書検索プログラム。 - 入力された被検索文字列を用いて、1又は複数の各言語でなる文書群の中から、上記被検索文字列及び又はそれに対応する文字列を含む1又は複数の文書を検索させる文書検索プログラムにおいて、
文書検索カテゴリーの分野別辞書であり、第1言語の文字列と、当該分野のそれぞれ第2言語の同等の意義として用いられる複数の検索用文字列とを予め対応付けた翻訳用辞書を有するコンピュータを、
第1言語でなる1又は複数の原文文書を蓄積する原文文書蓄積手段、
上記翻訳用辞書を用いて、第2言語でなる被検索文字列を第1言語に翻訳して翻訳被検索文字列を生成し、この翻訳被検索文字列に対応する上記複数の検索用文字列との関係を示す文字列対応情報を作成する被検索文字列翻訳手段、
上記被検索文字列翻訳手段による上記文字列対応情報を記憶する文字列対応情報記憶手段、
上記原文文書蓄積手段に蓄積されている上記各原文文書の中から、上記翻訳被検索文字列を含む1又は複数の上記原文文書を検索する原文文書検索手段、
上記原文文書検索手段が検索した上記各原文文書を、上記翻訳用辞書を用いて第2言語に翻訳し、当該原文文書の上記翻訳被検索文字列については上記文字列対応情報の上記複数の検索用文字列の中から上記被検索文字列を用いて翻訳する原文文書翻訳手段、
上記原文文書翻訳手段が翻訳した各翻訳文書中の上記被検索文字列と、それに対応する上記原文文書中の上記翻訳被検索文字列とに対して強調表示処理を行うと共に、少なくとも上記原文文書検索手段が検索した上記各原文文書とその各翻訳文書とを出力させる文書出力手段
として機能させることを特徴とする文書検索プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005245306A JP4254763B2 (ja) | 2005-08-26 | 2005-08-26 | 文書検索システム、文書検索方法及び文書検索プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005245306A JP4254763B2 (ja) | 2005-08-26 | 2005-08-26 | 文書検索システム、文書検索方法及び文書検索プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007058706A JP2007058706A (ja) | 2007-03-08 |
JP4254763B2 true JP4254763B2 (ja) | 2009-04-15 |
Family
ID=37922125
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005245306A Expired - Fee Related JP4254763B2 (ja) | 2005-08-26 | 2005-08-26 | 文書検索システム、文書検索方法及び文書検索プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4254763B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007323238A (ja) * | 2006-05-31 | 2007-12-13 | National Institute Of Information & Communication Technology | 強調表示装置及びプログラム |
US8799307B2 (en) | 2007-05-16 | 2014-08-05 | Google Inc. | Cross-language information retrieval |
JP2008287517A (ja) * | 2007-05-17 | 2008-11-27 | National Institute Of Information & Communication Technology | 強調表示装置及びプログラム |
JP2009128928A (ja) * | 2007-11-19 | 2009-06-11 | Brother Ind Ltd | 翻訳文出力方法、翻訳文出力装置、及び翻訳文出力プログラム |
US8862595B1 (en) | 2010-11-23 | 2014-10-14 | Google Inc. | Language selection for information retrieval |
JP5928673B2 (ja) * | 2010-12-09 | 2016-06-01 | 株式会社サン・フレア | 中継サーバ |
JP2013114528A (ja) * | 2011-11-30 | 2013-06-10 | Casio Comput Co Ltd | 例文表示装置及びプログラム |
US20200142890A1 (en) * | 2018-11-02 | 2020-05-07 | Soundhound, Inc. | System and method for performing an intelligent cross-domain search |
-
2005
- 2005-08-26 JP JP2005245306A patent/JP4254763B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007058706A (ja) | 2007-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100572797B1 (ko) | 데이터베이스 검색 방법, 데이터베이스 검색 시스템 및 컴퓨터 판독 가능 기록 매체 | |
JP4254763B2 (ja) | 文書検索システム、文書検索方法及び文書検索プログラム | |
JP4911028B2 (ja) | 単語翻訳装置、翻訳方法および翻訳プログラム | |
US5850561A (en) | Glossary construction tool | |
EP1745396B1 (en) | Document information mining tool | |
US9558234B1 (en) | Automatic metadata identification | |
JPH11345249A (ja) | 情報検索のための方法および装置ならびに記憶媒体 | |
JPH07160727A (ja) | 電子マニュアルの表示方法 | |
KR100835706B1 (ko) | 자동 색인을 위한 한국어 형태소 분석 시스템 및 그 방법 | |
US8041556B2 (en) | Chinese to english translation tool | |
US5890182A (en) | Sentence processing method and apparatus | |
Barlow | Parallel texts and corpus-based contrastive analysis | |
Lopez | Automatic extraction and resolution of bibliographical references in patent documents | |
US6807545B1 (en) | Method and system for retrieving documents via an electronic data file | |
Garrido et al. | GEO-NASS: A semantic tagging experience from geographical data on the media | |
US20060136147A1 (en) | Biological relationship event extraction system and method for processing biological information | |
JP5257189B2 (ja) | 検索結果出力プログラム、検索結果出力装置、および検索結果出力方法 | |
KR100659370B1 (ko) | 시소러스 매칭에 의한 문서 db 형성 방법 및 정보검색방법 | |
WO2014061846A1 (ko) | 혼합 질의 처리를 위한 색인 생성 방법, 혼합 질의 처리 방법 및 색인 자료구조를 기록한 기록 매체 | |
JP4301879B2 (ja) | 抄録作成支援システム及び特許文献検索システム | |
JP2009104475A (ja) | 類似文書検索装置、類似文書検索方法およびプログラム | |
JPH05250416A (ja) | データベースの登録・検索装置 | |
KR102338949B1 (ko) | 기술문서 번역 지원 시스템 | |
CN112183087B (zh) | 一种敏感文本识别的系统和方法 | |
JP2000076254A (ja) | キーワード抽出装置、このキーワード抽出装置を用いた類似文献検索装置、キーワード抽出方法及び記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080819 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081125 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090106 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090119 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120206 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120206 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120206 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130206 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140206 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |