JPWO2020109921A5 - 翻訳用の文書検索方法、及び翻訳用の文書検索システム - Google Patents
翻訳用の文書検索方法、及び翻訳用の文書検索システム Download PDFInfo
- Publication number
- JPWO2020109921A5 JPWO2020109921A5 JP2020557017A JP2020557017A JPWO2020109921A5 JP WO2020109921 A5 JPWO2020109921 A5 JP WO2020109921A5 JP 2020557017 A JP2020557017 A JP 2020557017A JP 2020557017 A JP2020557017 A JP 2020557017A JP WO2020109921 A5 JPWO2020109921 A5 JP WO2020109921A5
- Authority
- JP
- Japan
- Prior art keywords
- search
- text
- block
- sentence
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims 15
- 230000006870 function Effects 0.000 claims 6
Claims (13)
- 複数の検索対象文書をそれぞれ分割することで作成され、且つ第1の言語で作成された翻訳文が存在する複数の文章ブロックの中から、特定の文章ブロックを検索する翻訳用の文書検索方法であって、
検索用文書の一部である、第1の検索用文章ブロックを準備し、
前記複数の文章ブロックのうち少なくとも一部を第1の対象として、前記第1の検索用文章ブロックを検索条件に用いて全文検索を行うことで、前記第1の対象に含まれる文章ブロックそれぞれの、前記第1の検索用文章ブロックに対する第1の関連度を算出し、
前記第1の関連度の高さに基づいて、前記第1の対象の中から第2の対象を決定し、
前記第1の検索用文章ブロックに含まれる文ごとに、前記第2の対象に含まれる文それぞれとの第1の類似度を算出し、
前記第1の類似度を用いて、前記第1の検索用文章ブロックに類似する文章ブロックを少なくとも1つ検索し、
前記検索した前記文章ブロックに対応する前記翻訳文を利用する、翻訳用の文書検索方法。 - 請求項1において、
前記検索用文書を分割することで、複数の検索用文章ブロックを作成し、
前記第1の検索用文章ブロックは、前記複数の検索用文章ブロックの一つである、翻訳用の文書検索方法。 - 請求項1において、
前記検索用文書の他の一部である、第2の検索用文章ブロックを準備し、
前記複数の文章ブロックのうち少なくとも一部を第3の対象として、前記第2の検索用文章ブロックを検索条件に用いて全文検索を行うことで、前記第3の対象に含まれる文章ブロックそれぞれの、前記第2の検索用文章ブロックに対する第2の関連度を算出し、
前記第2の関連度の高さに基づいて、前記第3の対象の中から第4の対象を決定し、
前記第2の検索用文章ブロックに含まれる文ごとに、前記第4の対象に含まれる文それぞれとの第2の類似度を算出し、
前記第2の類似度を用いて、前記第2の検索用文章ブロックに類似する文章ブロックを少なくとも1つ検索する、翻訳用の文書検索方法。 - 請求項3において、
前記第1の対象と前記第3の対象とは、同一である、翻訳用の文書検索方法。 - 請求項1乃至4のいずれか一において、
前記第1の類似度のうち閾値以上の値を用いて、前記第1の検索用文章ブロックに類似する文章ブロックを少なくとも1つ検索する、翻訳用の文書検索方法。 - 複数の検索用文章ブロックのそれぞれについて、複数の検索対象文書をそれぞれ分割することで作成され、且つ第1の言語で作成された翻訳文が存在する複数の文章ブロックの中から、類似する文章ブロックを検索する翻訳用の文書検索方法であって、
検索用文書を分割することで、前記複数の検索用文章ブロックを作成し、
前記複数の検索用文章ブロックのそれぞれについて、
前記複数の文章ブロックのうち少なくとも一部を第1の対象として、前記検索用文章ブロックを検索条件に用いて全文検索を行うことで、前記第1の対象に含まれる文章ブロックそれぞれの、前記検索用文章ブロックに対する関連度を算出するステップと、
前記関連度の高さに基づいて、前記第1の対象の中から第2の対象を決定するステップと、
前記検索用文章ブロックに含まれる文ごとに、前記第2の対象に含まれる文それぞれとの類似度を算出するステップと、
前記類似度を用いて、前記検索用文章ブロックに類似する文章ブロックを少なくとも1つ検索するステップと、
前記検索した前記文章ブロックに対応する前記翻訳文を利用するステップと、を行う、翻訳用の文書検索方法。 - 複数の検索対象文書をそれぞれ分割することで作成され、且つ第1の言語で作成された翻訳文が存在する複数の文章ブロックの中から、特定の文章ブロックを検索する翻訳用の文書検索方法であって、
検索用文書の一部である、第1の検索用文章ブロックを準備し、
前記複数の文章ブロックのうち少なくとも一部を第1の対象として、前記第1の検索用文章ブロックに含まれる各文を検索条件に用いて全文検索を行うことで、前記第1の対象に含まれる文それぞれの、前記第1の検索用文章ブロックに含まれる各文に対する第1の関連度を算出し、
前記第1の検索用文章ブロックに含まれる文ごとに、前記第1の関連度の高さに基づいて、前記第1の対象に含まれる文の中から第2の対象を決定し、
前記第1の検索用文章ブロックに含まれる文ごとに、前記第2の対象に含まれる文それぞれとの第1の類似度を算出し、
前記第1の類似度を用いて、前記第1の検索用文章ブロックに類似する文章ブロックを少なくとも1つ検索し、
前記検索した前記文章ブロックに対応する前記翻訳文を利用する、翻訳用の文書検索方法。 - 請求項7において、
前記検索用文書を分割することで、複数の検索用文章ブロックを作成し、
前記第1の検索用文章ブロックは、前記複数の検索用文章ブロックの一つである、翻訳用の文書検索方法。 - 請求項7において、
前記検索用文書の他の一部である、第2の検索用文章ブロックを準備し、
前記複数の文章ブロックのうち少なくとも一部を第3の対象として、前記第2の検索用文章ブロックに含まれる各文を検索条件に用いて全文検索を行うことで、前記第3の対象に含まれる文それぞれの、前記第2の検索用文章ブロックに含まれる各文に対する第2の関連度を算出し、
前記第2の検索用文章ブロックに含まれる文ごとに、前記第2の関連度の高さに基づいて、前記第3の対象に含まれる文の中から第4の対象を決定し、
前記第2の検索用文章ブロックに含まれる文ごとに、前記第4の対象に含まれる文それぞれとの第2の類似度を算出し、
前記第2の類似度を用いて、前記第2の検索用文章ブロックに類似する文章ブロックを少なくとも1つ検索する、翻訳用の文書検索方法。 - 請求項9において、
前記第1の対象と前記第3の対象とは、同一である、翻訳用の文書検索方法。 - 請求項7乃至10のいずれか一において、
前記第1の類似度のうち閾値以上の値を用いて、前記第1の検索用文章ブロックに類似する文章ブロックを少なくとも1つ検索する、翻訳用の文書検索方法。 - 複数の検索用文章ブロックのそれぞれについて、複数の検索対象文書をそれぞれ分割することで作成され、且つ第1の言語で作成された翻訳文が存在する複数の文章ブロックの中から、類似する文章ブロックを検索する翻訳用の文書検索方法であって、
検索用文書を分割することで、前記複数の検索用文章ブロックを作成し、
前記複数の検索用文章ブロックのそれぞれについて、
前記複数の文章ブロックのうち少なくとも一部を第1の対象として、前記検索用文章ブロックに含まれる各文を検索条件に用いて全文検索を行うことで、前記第1の対象に含まれる文それぞれの、
前記検索用文章ブロックに含まれる各文に対する関連度を算出するステップと、
前記検索用文章ブロックに含まれる文ごとに、前記関連度の高さに基づいて、前記第1の対象に含まれる文の中から第2の対象を決定するステップと、
前記検索用文章ブロックに含まれる文ごとに、前記第2の対象に含まれる文それぞれとの類似度を算出するステップと、
前記類似度を用いて、前記検索用文章ブロックに類似する文章ブロックを少なくとも1つ検索するステップと、
前記検索した前記文章ブロックに対応する前記翻訳文を利用するステップと、を行う、翻訳用の文書検索方法。 - 複数の検索対象文書をそれぞれ分割することで作成され、且つ第1の言語で作成された翻訳文が存在する複数の文章ブロックの中から、特定の文章ブロックを検索する翻訳用の文書検索システムであって、
処理部を有し、
前記処理部は、
検索用文書を分割することで作成された複数の検索用文章ブロックの1つである、第1の検索用文章ブロックを準備する機能と、
前記複数の文章ブロックのうち少なくとも一部を第1の対象として、前記第1の検索用文章ブロックを検索条件に用いて全文検索を行うことで、前記第1の対象に含まれる文章ブロックそれぞれの、前記第1の検索用文章ブロックに対する第1の関連度を算出する機能と、
前記第1の関連度の高さに基づいて、前記第1の対象の中から第2の対象を決定する機能と、
前記第1の検索用文章ブロックに含まれる文ごとに、前記第2の対象に含まれる文それぞれとの第1の類似度を算出する機能と、
前記第1の類似度を用いて、前記第1の検索用文章ブロックに類似する文章ブロックを少なくとも1つ検索する機能と、を有し、
前記翻訳用の文書検索システムは、前記検索した前記文章ブロックに対応する前記翻訳文を利用する機能を有する、翻訳用の文書検索システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018224825 | 2018-11-30 | ||
JP2018224825 | 2018-11-30 | ||
PCT/IB2019/059907 WO2020109921A1 (ja) | 2018-11-30 | 2019-11-19 | 文書検索方法、文書検索システム、プログラム、及び非一時的コンピュータ可読記憶媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2020109921A1 JPWO2020109921A1 (ja) | 2020-06-04 |
JPWO2020109921A5 true JPWO2020109921A5 (ja) | 2022-11-29 |
JP7499183B2 JP7499183B2 (ja) | 2024-06-13 |
Family
ID=70851931
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020557017A Active JP7499183B2 (ja) | 2018-11-30 | 2019-11-19 | 翻訳用の文書検索システム |
Country Status (6)
Country | Link |
---|---|
US (1) | US20220004570A1 (ja) |
JP (1) | JP7499183B2 (ja) |
KR (1) | KR20210095155A (ja) |
CN (1) | CN113168415A (ja) |
DE (1) | DE112019005976T5 (ja) |
WO (1) | WO2020109921A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2021005433A1 (ja) * | 2019-07-05 | 2021-01-14 | 株式会社半導体エネルギー研究所 | 読解支援システム及び読解支援方法 |
JP7476201B2 (ja) | 2019-07-19 | 2024-04-30 | 株式会社半導体エネルギー研究所 | テキスト生成方法およびテキスト生成システム |
KR102540939B1 (ko) * | 2022-10-05 | 2023-06-08 | (주)유알피 | 자연어 검색의 적절도 향상 시스템 및 적절도 향상 방법 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4238616B2 (ja) | 2003-03-28 | 2009-03-18 | 株式会社日立製作所 | 類似文書検索方法および類似文書検索装置 |
JP2006092135A (ja) | 2004-09-22 | 2006-04-06 | Fuji Xerox Co Ltd | 関連文書検索用コンピュータプログラムならびに関連文書検索システムおよび方法。 |
JP2012104051A (ja) | 2010-11-12 | 2012-05-31 | Kansai Electric Power Co Inc:The | 文書インデックス作成装置 |
US9507881B2 (en) * | 2011-12-27 | 2016-11-29 | Mitsubishi Electric Corporation | Search device |
US10430445B2 (en) * | 2014-09-12 | 2019-10-01 | Nuance Communications, Inc. | Text indexing and passage retrieval |
CN107491547B (zh) * | 2017-08-28 | 2020-11-10 | 北京百度网讯科技有限公司 | 基于人工智能的搜索方法和装置 |
-
2019
- 2019-11-19 DE DE112019005976.9T patent/DE112019005976T5/de active Pending
- 2019-11-19 KR KR1020217016842A patent/KR20210095155A/ko unknown
- 2019-11-19 US US17/294,930 patent/US20220004570A1/en active Pending
- 2019-11-19 WO PCT/IB2019/059907 patent/WO2020109921A1/ja active Application Filing
- 2019-11-19 CN CN201980076644.XA patent/CN113168415A/zh active Pending
- 2019-11-19 JP JP2020557017A patent/JP7499183B2/ja active Active
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210192126A1 (en) | Generating structured text summaries of digital documents using interactive collaboration | |
US10467271B2 (en) | Search apparatus and search method | |
JP2021523464A5 (ja) | ||
JPWO2020109921A5 (ja) | 翻訳用の文書検索方法、及び翻訳用の文書検索システム | |
KR101548096B1 (ko) | 문서 자동 요약 방법 및 서버 | |
US9727556B2 (en) | Summarization of a document | |
JP6767042B2 (ja) | シナリオパッセージ分類器、シナリオ分類器、及びそのためのコンピュータプログラム | |
JP2009537901A (ja) | 検索による注釈付与 | |
Corezola Pereira et al. | A new approach for cross-language plagiarism analysis | |
US20150205860A1 (en) | Information retrieval device, information retrieval method, and information retrieval program | |
KR102468481B1 (ko) | 함의 페어 확장 장치, 그것을 위한 컴퓨터 프로그램, 및 질문 응답 시스템 | |
JP2012506596A5 (ja) | ||
CN109710834B (zh) | 相似网页检测方法、装置、存储介质及电子设备 | |
JP6678834B2 (ja) | 単語意味関係推定装置および単語意味関係推定方法 | |
KR101651780B1 (ko) | 빅 데이터 처리 기술을 이용한 연관 단어 추출 방법 및 그 시스템 | |
US20140289260A1 (en) | Keyword Determination | |
WO2015035401A1 (en) | Automated discovery using textual analysis | |
CN105653553B (zh) | 词权重生成方法和装置 | |
Chaibi et al. | Topic segmentation for textual document written in arabic language | |
Ehsan et al. | A Pairwise Document Analysis Approach for Monolingual Plagiarism Detection. | |
JP2009140263A (ja) | 用語共起度抽出装置、用語共起度抽出方法及び用語共起度抽出プログラム | |
US10572592B2 (en) | Method, device, and computer program for providing a definition or a translation of a word belonging to a sentence as a function of neighbouring words and of databases | |
JP2020071678A5 (ja) | ||
CN113032641B (zh) | 一种智能搜索方法和设备 | |
Verberne | A language-modelling approach to user-centred health information retrieval |