JPWO2020109921A5 - 翻訳用の文書検索方法、及び翻訳用の文書検索システム - Google Patents

翻訳用の文書検索方法、及び翻訳用の文書検索システム Download PDF

Info

Publication number
JPWO2020109921A5
JPWO2020109921A5 JP2020557017A JP2020557017A JPWO2020109921A5 JP WO2020109921 A5 JPWO2020109921 A5 JP WO2020109921A5 JP 2020557017 A JP2020557017 A JP 2020557017A JP 2020557017 A JP2020557017 A JP 2020557017A JP WO2020109921 A5 JPWO2020109921 A5 JP WO2020109921A5
Authority
JP
Japan
Prior art keywords
search
text
block
sentence
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020557017A
Other languages
English (en)
Other versions
JPWO2020109921A1 (ja
JP7499183B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority claimed from PCT/IB2019/059907 external-priority patent/WO2020109921A1/ja
Publication of JPWO2020109921A1 publication Critical patent/JPWO2020109921A1/ja
Publication of JPWO2020109921A5 publication Critical patent/JPWO2020109921A5/ja
Application granted granted Critical
Publication of JP7499183B2 publication Critical patent/JP7499183B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (13)

  1. 複数の検索対象文書をそれぞれ分割することで作成され、且つ第1の言語で作成された翻訳文が存在する複数の文章ブロックの中から、特定の文章ブロックを検索する翻訳用の文書検索方法であって、
    検索用文書の一部である、第1の検索用文章ブロックを準備し、
    前記複数の文章ブロックのうち少なくとも一部を第1の対象として、前記第1の検索用文章ブロックを検索条件に用いて全文検索を行うことで、前記第1の対象に含まれる文章ブロックそれぞれの、前記第1の検索用文章ブロックに対する第1の関連度を算出し、
    前記第1の関連度の高さに基づいて、前記第1の対象の中から第2の対象を決定し、
    前記第1の検索用文章ブロックに含まれる文ごとに、前記第2の対象に含まれる文それぞれとの第1の類似度を算出し、
    前記第1の類似度を用いて、前記第1の検索用文章ブロックに類似する文章ブロックを少なくとも1つ検索
    前記検索した前記文章ブロックに対応する前記翻訳文を利用する、翻訳用の文書検索方法。
  2. 請求項1において、
    前記検索用文書を分割することで、複数の検索用文章ブロックを作成し、
    前記第1の検索用文章ブロックは、前記複数の検索用文章ブロックの一つである、翻訳用の文書検索方法。
  3. 請求項1において、
    前記検索用文書の他の一部である、第2の検索用文章ブロックを準備し、
    前記複数の文章ブロックのうち少なくとも一部を第3の対象として、前記第2の検索用文章ブロックを検索条件に用いて全文検索を行うことで、前記第3の対象に含まれる文章ブロックそれぞれの、前記第2の検索用文章ブロックに対する第2の関連度を算出し、
    前記第2の関連度の高さに基づいて、前記第3の対象の中から第4の対象を決定し、
    前記第2の検索用文章ブロックに含まれる文ごとに、前記第4の対象に含まれる文それぞれとの第2の類似度を算出し、
    前記第2の類似度を用いて、前記第2の検索用文章ブロックに類似する文章ブロックを少なくとも1つ検索する、翻訳用の文書検索方法。
  4. 請求項3において、
    前記第1の対象と前記第3の対象とは、同一である、翻訳用の文書検索方法。
  5. 請求項1乃至4のいずれか一において、
    前記第1の類似度のうち閾値以上の値を用いて、前記第1の検索用文章ブロックに類似する文章ブロックを少なくとも1つ検索する、翻訳用の文書検索方法。
  6. 複数の検索用文章ブロックのそれぞれについて、複数の検索対象文書をそれぞれ分割することで作成され、且つ第1の言語で作成された翻訳文が存在する複数の文章ブロックの中から、類似する文章ブロックを検索する翻訳用の文書検索方法であって、
    検索用文書を分割することで、前記複数の検索用文章ブロックを作成し、
    前記複数の検索用文章ブロックのそれぞれについて、
    前記複数の文章ブロックのうち少なくとも一部を第1の対象として、前記検索用文章ブロックを検索条件に用いて全文検索を行うことで、前記第1の対象に含まれる文章ブロックそれぞれの、前記検索用文章ブロックに対する関連度を算出するステップと、
    前記関連度の高さに基づいて、前記第1の対象の中から第2の対象を決定するステップと、
    前記検索用文章ブロックに含まれる文ごとに、前記第2の対象に含まれる文それぞれとの類似度を算出するステップと、
    前記類似度を用いて、前記検索用文章ブロックに類似する文章ブロックを少なくとも1つ検索するステップと、
    前記検索した前記文章ブロックに対応する前記翻訳文を利用するステップと、を行う、翻訳用の文書検索方法。
  7. 複数の検索対象文書をそれぞれ分割することで作成され、且つ第1の言語で作成された翻訳文が存在する複数の文章ブロックの中から、特定の文章ブロックを検索する翻訳用の文書検索方法であって、
    検索用文書の一部である、第1の検索用文章ブロックを準備し、
    前記複数の文章ブロックのうち少なくとも一部を第1の対象として、前記第1の検索用文章ブロックに含まれる各文を検索条件に用いて全文検索を行うことで、前記第1の対象に含まれる文それぞれの、前記第1の検索用文章ブロックに含まれる各文に対する第1の関連度を算出し、
    前記第1の検索用文章ブロックに含まれる文ごとに、前記第1の関連度の高さに基づいて、前記第1の対象に含まれる文の中から第2の対象を決定し、
    前記第1の検索用文章ブロックに含まれる文ごとに、前記第2の対象に含まれる文それぞれとの第1の類似度を算出し、
    前記第1の類似度を用いて、前記第1の検索用文章ブロックに類似する文章ブロックを少なくとも1つ検索
    前記検索した前記文章ブロックに対応する前記翻訳文を利用する、翻訳用の文書検索方法。
  8. 請求項7において、
    前記検索用文書を分割することで、複数の検索用文章ブロックを作成し、
    前記第1の検索用文章ブロックは、前記複数の検索用文章ブロックの一つである、翻訳用の文書検索方法。
  9. 請求項7において、
    前記検索用文書の他の一部である、第2の検索用文章ブロックを準備し、
    前記複数の文章ブロックのうち少なくとも一部を第3の対象として、前記第2の検索用文章ブロックに含まれる各文を検索条件に用いて全文検索を行うことで、前記第3の対象に含まれる文それぞれの、前記第2の検索用文章ブロックに含まれる各文に対する第2の関連度を算出し、
    前記第2の検索用文章ブロックに含まれる文ごとに、前記第2の関連度の高さに基づいて、前記第3の対象に含まれる文の中から第4の対象を決定し、
    前記第2の検索用文章ブロックに含まれる文ごとに、前記第4の対象に含まれる文それぞれとの第2の類似度を算出し、
    前記第2の類似度を用いて、前記第2の検索用文章ブロックに類似する文章ブロックを少なくとも1つ検索する、翻訳用の文書検索方法。
  10. 請求項9において、
    前記第1の対象と前記第3の対象とは、同一である、翻訳用の文書検索方法。
  11. 請求項7乃至10のいずれか一において、
    前記第1の類似度のうち閾値以上の値を用いて、前記第1の検索用文章ブロックに類似する文章ブロックを少なくとも1つ検索する、翻訳用の文書検索方法。
  12. 複数の検索用文章ブロックのそれぞれについて、複数の検索対象文書をそれぞれ分割することで作成され、且つ第1の言語で作成された翻訳文が存在する複数の文章ブロックの中から、類似する文章ブロックを検索する翻訳用の文書検索方法であって、
    検索用文書を分割することで、前記複数の検索用文章ブロックを作成し、
    前記複数の検索用文章ブロックのそれぞれについて、
    前記複数の文章ブロックのうち少なくとも一部を第1の対象として、前記検索用文章ブロックに含まれる各文を検索条件に用いて全文検索を行うことで、前記第1の対象に含まれる文それぞれの、
    前記検索用文章ブロックに含まれる各文に対する関連度を算出するステップと、
    前記検索用文章ブロックに含まれる文ごとに、前記関連度の高さに基づいて、前記第1の対象に含まれる文の中から第2の対象を決定するステップと、
    前記検索用文章ブロックに含まれる文ごとに、前記第2の対象に含まれる文それぞれとの類似度を算出するステップと、
    前記類似度を用いて、前記検索用文章ブロックに類似する文章ブロックを少なくとも1つ検索するステップと、
    前記検索した前記文章ブロックに対応する前記翻訳文を利用するステップと、を行う、翻訳用の文書検索方法。
  13. 複数の検索対象文書をそれぞれ分割することで作成され、且つ第1の言語で作成された翻訳文が存在する複数の文章ブロックの中から、特定の文章ブロックを検索する翻訳用の文書検索システムであって、
    処理部を有し、
    前記処理部は、
    検索用文書を分割することで作成された複数の検索用文章ブロックの1つである、第1の検索用文章ブロックを準備する機能と、
    前記複数の文章ブロックのうち少なくとも一部を第1の対象として、前記第1の検索用文章ブロックを検索条件に用いて全文検索を行うことで、前記第1の対象に含まれる文章ブロックそれぞれの、前記第1の検索用文章ブロックに対する第1の関連度を算出する機能と、
    前記第1の関連度の高さに基づいて、前記第1の対象の中から第2の対象を決定する機能と、
    前記第1の検索用文章ブロックに含まれる文ごとに、前記第2の対象に含まれる文それぞれとの第1の類似度を算出する機能と、
    前記第1の類似度を用いて、前記第1の検索用文章ブロックに類似する文章ブロックを少なくとも1つ検索する機能と、を有
    前記翻訳用の文書検索システムは、前記検索した前記文章ブロックに対応する前記翻訳文を利用する機能を有する、翻訳用の文書検索システム。
JP2020557017A 2018-11-30 2019-11-19 翻訳用の文書検索システム Active JP7499183B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018224825 2018-11-30
JP2018224825 2018-11-30
PCT/IB2019/059907 WO2020109921A1 (ja) 2018-11-30 2019-11-19 文書検索方法、文書検索システム、プログラム、及び非一時的コンピュータ可読記憶媒体

Publications (3)

Publication Number Publication Date
JPWO2020109921A1 JPWO2020109921A1 (ja) 2020-06-04
JPWO2020109921A5 true JPWO2020109921A5 (ja) 2022-11-29
JP7499183B2 JP7499183B2 (ja) 2024-06-13

Family

ID=70851931

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020557017A Active JP7499183B2 (ja) 2018-11-30 2019-11-19 翻訳用の文書検索システム

Country Status (6)

Country Link
US (1) US20220004570A1 (ja)
JP (1) JP7499183B2 (ja)
KR (1) KR20210095155A (ja)
CN (1) CN113168415A (ja)
DE (1) DE112019005976T5 (ja)
WO (1) WO2020109921A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021005433A1 (ja) * 2019-07-05 2021-01-14 株式会社半導体エネルギー研究所 読解支援システム及び読解支援方法
JP7476201B2 (ja) 2019-07-19 2024-04-30 株式会社半導体エネルギー研究所 テキスト生成方法およびテキスト生成システム
KR102540939B1 (ko) * 2022-10-05 2023-06-08 (주)유알피 자연어 검색의 적절도 향상 시스템 및 적절도 향상 방법

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4238616B2 (ja) 2003-03-28 2009-03-18 株式会社日立製作所 類似文書検索方法および類似文書検索装置
JP2006092135A (ja) 2004-09-22 2006-04-06 Fuji Xerox Co Ltd 関連文書検索用コンピュータプログラムならびに関連文書検索システムおよび方法。
JP2012104051A (ja) 2010-11-12 2012-05-31 Kansai Electric Power Co Inc:The 文書インデックス作成装置
US9507881B2 (en) * 2011-12-27 2016-11-29 Mitsubishi Electric Corporation Search device
US10430445B2 (en) * 2014-09-12 2019-10-01 Nuance Communications, Inc. Text indexing and passage retrieval
CN107491547B (zh) * 2017-08-28 2020-11-10 北京百度网讯科技有限公司 基于人工智能的搜索方法和装置

Similar Documents

Publication Publication Date Title
US20210192126A1 (en) Generating structured text summaries of digital documents using interactive collaboration
US10467271B2 (en) Search apparatus and search method
JP2021523464A5 (ja)
JPWO2020109921A5 (ja) 翻訳用の文書検索方法、及び翻訳用の文書検索システム
KR101548096B1 (ko) 문서 자동 요약 방법 및 서버
US9727556B2 (en) Summarization of a document
JP6767042B2 (ja) シナリオパッセージ分類器、シナリオ分類器、及びそのためのコンピュータプログラム
JP2009537901A (ja) 検索による注釈付与
Corezola Pereira et al. A new approach for cross-language plagiarism analysis
US20150205860A1 (en) Information retrieval device, information retrieval method, and information retrieval program
KR102468481B1 (ko) 함의 페어 확장 장치, 그것을 위한 컴퓨터 프로그램, 및 질문 응답 시스템
JP2012506596A5 (ja)
CN109710834B (zh) 相似网页检测方法、装置、存储介质及电子设备
JP6678834B2 (ja) 単語意味関係推定装置および単語意味関係推定方法
KR101651780B1 (ko) 빅 데이터 처리 기술을 이용한 연관 단어 추출 방법 및 그 시스템
US20140289260A1 (en) Keyword Determination
WO2015035401A1 (en) Automated discovery using textual analysis
CN105653553B (zh) 词权重生成方法和装置
Chaibi et al. Topic segmentation for textual document written in arabic language
Ehsan et al. A Pairwise Document Analysis Approach for Monolingual Plagiarism Detection.
JP2009140263A (ja) 用語共起度抽出装置、用語共起度抽出方法及び用語共起度抽出プログラム
US10572592B2 (en) Method, device, and computer program for providing a definition or a translation of a word belonging to a sentence as a function of neighbouring words and of databases
JP2020071678A5 (ja)
CN113032641B (zh) 一种智能搜索方法和设备
Verberne A language-modelling approach to user-centred health information retrieval