JP2014241034A5 - 文を検索する装置および方法 - Google Patents

文を検索する装置および方法 Download PDF

Info

Publication number
JP2014241034A5
JP2014241034A5 JP2013122805A JP2013122805A JP2014241034A5 JP 2014241034 A5 JP2014241034 A5 JP 2014241034A5 JP 2013122805 A JP2013122805 A JP 2013122805A JP 2013122805 A JP2013122805 A JP 2013122805A JP 2014241034 A5 JP2014241034 A5 JP 2014241034A5
Authority
JP
Japan
Prior art keywords
sentence
document
unit
importance
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013122805A
Other languages
English (en)
Other versions
JP2014241034A (ja
JP6099046B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority to JP2013122805A priority Critical patent/JP6099046B2/ja
Priority claimed from JP2013122805A external-priority patent/JP6099046B2/ja
Priority to US14/275,994 priority patent/US9767186B2/en
Publication of JP2014241034A publication Critical patent/JP2014241034A/ja
Publication of JP2014241034A5 publication Critical patent/JP2014241034A5/ja
Application granted granted Critical
Publication of JP6099046B2 publication Critical patent/JP6099046B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (9)

  1. 文書中に含まれる特定の文を検索して出力する装置であって、
    検索対象の文書の検索に用いられる検索キーを取得する検索キー取得部と、
    検索対象の文書に含まれる各文の重要度を算出する重要度計算部と、
    前記検索キー取得部により取得された検索キーを用いて検索対象の文書に対して検索を行い、検索対象の当該文書から当該検索キーを含む文を抽出し、抽出された当該文の当該文書における位置の情報を取得する抽出部と、
    前記抽出部により抽出された各文に関して、当該抽出部により得られた検索対象の前記文書中における当該文の位置に基づき、前記重要度計算部により算出された当該文の重要度の値を修正して修正重要度を算出する重要度修正部と、
    前記重要度修正部により算出された修正重要度に基づく順番にしたがって、前記抽出部により抽出された文を出力する検索結果出力部と、
    を備える、装置。
  2. 前記重要度計算部は、検索対象の前記文書に含まれる各文に対して、当該文に含まれる単語の当該文書全体における出現数に基づき、重要度を算出する、請求項1に記載の装置。
  3. 前記重要度修正部は、前記重要度計算部により算出された各文の重要度に対して、検索対象の前記文書中における当該文の位置が前方であるほど大きい重み付けを行って修正する、請求項1または請求項2に記載の装置。
  4. 前記検索キー取得部は、検索対象の前記文書に含まれる一の文の一部または全部を指定することによって特定された部分を検索キーとして取得し、
    前記重要度修正部は、前記重要度計算部により算出された各文の重要度に対して、検索対象の前記文書中における当該文の位置が前記検索キーとして特定された部分を有する文に近いほど大きい重み付けを行って修正する、請求項1または請求項2に記載の装置。
  5. 前記重要度計算部は、検索対象の前記文書に含まれる単語に関するtf-idf(term frequency-inverse document frequency)に基づいて、当該文書に含まれる各文の重要度を算出する、請求項1に記載の装置。
  6. 文書中に含まれる特定の文を検索して出力する装置であって、
    文書を表示する表示部と、
    前記表示部に表示された文書における特定の部分の指定を受け付ける受け付け部と、
    前記受け付け部により受け付けた前記文書における前記特定の部分を検索キーとして、当該文書に対して検索を行い、検索対象の当該文書から当該検索キーを含む文を抽出し、抽出された当該文の当該文書における位置の情報を取得する抽出部と、
    前記表示部に表示された前記文書に含まれる各文に関して、当該文に含まれる単語の当該文書全体における出現数に基づいて求められた重要度と、前記抽出部により抽出された文に関する前記位置の情報とに基づいて、当該抽出部により抽出された文の表示順を決定する検索結果処理部と、
    前記検索結果処理部により決定された表示順にしたがって、前記抽出部により抽出された文を前記表示部に表示させる表示制御部と、
    を備える、装置。
  7. 前記検索結果処理部は、前記抽出部により抽出された各文の重要度に対して、前記位置の情報に基づき、前記文書中における当該文の位置が前方であるほど大きい重み付けを行って得られた値に基づき、当該抽出部により抽出された文の表示順を決定する、請求項6に記載の装置。
  8. 前記検索結果処理部は、前記抽出部により抽出された各文の重要度に対して、前記位置の情報に基づき、前記文書中における当該文の位置が前記検索キーを指定された文に近いほど大きい重み付けを行って得られた値に基づき、当該抽出部により抽出された文の表示順を決定する、請求項6に記載の装置。
  9. 文書を表示する表示部を備えたコンピュータにおける、当該文書中から特定の文を検索して当該表示部に表示させる方法であって、
    コンピュータのプロセッサが、検索キーの入力を受け付けるステップと、
    前記プロセッサが、受け付けた前記検索キーに基づいて、前記文書に対して検索を行い、検索対象の当該文書から当該検索キーを含む文を抽出し、抽出された当該文の当該文書における位置の情報を取得するステップと、
    前記プロセッサが、前記表示部に表示された前記文書に含まれる各文に関して、当該文に含まれる単語の当該文書全体における出現数に基づいて求められた重要度と、前記検索キーに基づいて抽出された文に関する前記位置の情報とに基づいて、当該検索キーに基づいて抽出された文の表示順を決定するステップと、
    前記プロセッサが、決定された表示順にしたがって、前記検索キーに基づいて抽出された文を前記表示部に表示させるステップと、
    を含む、方法。
JP2013122805A 2013-06-11 2013-06-11 文を検索する装置および方法 Expired - Fee Related JP6099046B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2013122805A JP6099046B2 (ja) 2013-06-11 2013-06-11 文を検索する装置および方法
US14/275,994 US9767186B2 (en) 2013-06-11 2014-05-13 Retrieving a specific sentence from a document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013122805A JP6099046B2 (ja) 2013-06-11 2013-06-11 文を検索する装置および方法

Publications (3)

Publication Number Publication Date
JP2014241034A JP2014241034A (ja) 2014-12-25
JP2014241034A5 true JP2014241034A5 (ja) 2016-03-31
JP6099046B2 JP6099046B2 (ja) 2017-03-22

Family

ID=52006359

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013122805A Expired - Fee Related JP6099046B2 (ja) 2013-06-11 2013-06-11 文を検索する装置および方法

Country Status (2)

Country Link
US (1) US9767186B2 (ja)
JP (1) JP6099046B2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7831795B2 (en) 2005-11-28 2010-11-09 Commvault Systems, Inc. Systems and methods for classifying and transferring information in a storage network
US20200257596A1 (en) 2005-12-19 2020-08-13 Commvault Systems, Inc. Systems and methods of unified reconstruction in storage systems
US8370442B2 (en) 2008-08-29 2013-02-05 Commvault Systems, Inc. Method and system for leveraging identified changes to a mail server
US8892523B2 (en) 2012-06-08 2014-11-18 Commvault Systems, Inc. Auto summarization of content
EP3259680A4 (en) * 2015-02-20 2018-10-17 Hewlett-Packard Development Company, L.P. Citation explanations
US10353994B2 (en) 2015-11-03 2019-07-16 Commvault Systems, Inc. Summarization of email on a client computing device based on content contribution to an email thread using classification and word frequency considerations
US10540516B2 (en) 2016-10-13 2020-01-21 Commvault Systems, Inc. Data protection within an unsecured storage environment
WO2019106878A1 (ja) * 2017-11-28 2019-06-06 桂太 杉原 情報処理システム、情報処理方法、及びコンピュータプログラム
CN109062895B (zh) * 2018-07-23 2022-06-24 挖财网络技术有限公司 一种智能语义处理方法
US11397776B2 (en) 2019-01-31 2022-07-26 At&T Intellectual Property I, L.P. Systems and methods for automated information retrieval
CN110399477A (zh) * 2019-06-20 2019-11-01 全球能源互联网研究院有限公司 一种文献摘要提取方法、设备及可存储介质
US11557284B2 (en) * 2020-01-03 2023-01-17 International Business Machines Corporation Cognitive analysis for speech recognition using multi-language vector representations
KR20210102617A (ko) * 2020-02-12 2021-08-20 삼성전자주식회사 전자 장치 및 그 제어 방법
US11461539B2 (en) 2020-07-29 2022-10-04 Docusign, Inc. Automated document highlighting in a digital management platform
US11494417B2 (en) 2020-08-07 2022-11-08 Commvault Systems, Inc. Automated email classification in an information management system
US11841891B2 (en) * 2022-04-29 2023-12-12 Content Square SAS Mapping webpages to page groups

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3691844B2 (ja) * 1990-05-21 2005-09-07 株式会社東芝 文書処理方法
JP2729356B2 (ja) 1994-09-01 1998-03-18 日本アイ・ビー・エム株式会社 情報検索システム及び方法
JP3579204B2 (ja) 1997-01-17 2004-10-20 富士通株式会社 文書要約装置およびその方法
JPH11184865A (ja) 1997-12-19 1999-07-09 Matsushita Electric Ind Co Ltd 文書要約装置
JP3705917B2 (ja) 1998-03-03 2005-10-12 シャープ株式会社 文書処理装置
JP3429184B2 (ja) * 1998-03-19 2003-07-22 シャープ株式会社 テキスト構造解析装置および抄録装置、並びにプログラム記録媒体
JP3597697B2 (ja) * 1998-03-20 2004-12-08 富士通株式会社 文書要約装置およびその方法
JP2000112967A (ja) * 1998-10-02 2000-04-21 Nippon Telegr & Teleph Corp <Ntt> 記事要約装置および記事要約処理方法および当該方法を記述したプログラムを記録した記録媒体
JP2000222427A (ja) 1999-02-02 2000-08-11 Mitsubishi Electric Corp 関連語抽出装置、関連語抽出方法及び関連語抽出プログラムが記録された記録媒体
JP3791879B2 (ja) * 1999-07-19 2006-06-28 富士通株式会社 文書要約装置およびその方法
JP2002108887A (ja) 2000-09-29 2002-04-12 Canon Inc 文書検索装置、その装置へのキーワード追加方法、文書検索方法及びコンピュータ読み取り可能な記憶媒体
JP2002251394A (ja) 2001-02-22 2002-09-06 Nec Corp 全文検索システム
JP3746233B2 (ja) 2001-12-26 2006-02-15 株式会社東芝 知識分析システムおよび知識分析方法
JP2004062806A (ja) 2002-07-31 2004-02-26 Toshiba Corp 類似文書検索装置及び類似文書検索方法
JP4378284B2 (ja) 2002-09-27 2009-12-02 インターナショナル・ビジネス・マシーンズ・コーポレーション ワールド・ワイド・ウェブからの情報を使用してライブ・スピーチの機能を拡張するためのシステムおよび方法
US7395256B2 (en) 2003-06-20 2008-07-01 Agency For Science, Technology And Research Method and platform for term extraction from large collection of documents
JP2005234635A (ja) * 2004-02-17 2005-09-02 Fuji Xerox Co Ltd 文書要約装置および方法
JP2005250762A (ja) 2004-03-03 2005-09-15 Mitsubishi Electric Corp 辞書生成装置、辞書生成方法および辞書生成プログラム
JP4769005B2 (ja) 2005-03-31 2011-09-07 株式会社日立製作所 情報処理支援システム及び情報処理支援プログラム
JP2007200248A (ja) 2006-01-30 2007-08-09 Nippon Telegr & Teleph Corp <Ntt> 方法説明抽出方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP2008269086A (ja) 2007-04-17 2008-11-06 Fuji Xerox Co Ltd 情報推薦装置及び情報推薦システム
CN101526938B (zh) * 2008-03-06 2011-12-28 夏普株式会社 文档处理装置
JP4499179B1 (ja) * 2009-05-12 2010-07-07 株式会社エヌ・ティ・ティ・データ 端末装置
US8271502B2 (en) * 2009-06-26 2012-09-18 Microsoft Corporation Presenting multiple document summarization with search results
JP5416680B2 (ja) 2010-11-30 2014-02-12 日本電信電話株式会社 文書分割検索装置及び方法及びプログラム

Similar Documents

Publication Publication Date Title
JP2014241034A5 (ja) 文を検索する装置および方法
JP2016508264A5 (ja)
JP2016136341A5 (ja)
JP2016503216A5 (ja)
JP2015109068A5 (ja)
JP2003242176A5 (ja)
JP2012208604A5 (ja)
JP2009082443A5 (ja)
RU2014150944A (ru) Система и способ использования данных предыдущего кадра для оптического распознавания символов кадров видеоматериалов
BR112012015945A2 (pt) métodos e aparelhos para facilitar a recuperação de imagem baseada em conteúdo
JP2011170838A5 (ja)
JP2012226738A5 (ja)
JP2009193356A5 (ja)
JP2014149848A5 (ja)
JP2017533522A5 (ja)
JP2013191046A5 (ja)
JP2018512639A5 (ja)
JP2022069790A5 (ja)
JP2013228883A5 (ja)
JP2015069543A5 (ja)
WO2013026953A3 (en) Method and apparatus for providing search with contextual processing
JP2011238057A5 (ja)
JP2017162148A5 (ja)
JP2010244425A5 (ja)
JP5800974B1 (ja) 同義語判定装置