JP6753190B2 - 文書検索装置及びプログラム - Google Patents

文書検索装置及びプログラム Download PDF

Info

Publication number
JP6753190B2
JP6753190B2 JP2016147694A JP2016147694A JP6753190B2 JP 6753190 B2 JP6753190 B2 JP 6753190B2 JP 2016147694 A JP2016147694 A JP 2016147694A JP 2016147694 A JP2016147694 A JP 2016147694A JP 6753190 B2 JP6753190 B2 JP 6753190B2
Authority
JP
Japan
Prior art keywords
search
content
unit
search term
attribute information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016147694A
Other languages
English (en)
Other versions
JP2018018279A (ja
Inventor
真之 小林
真之 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2016147694A priority Critical patent/JP6753190B2/ja
Priority to US15/429,451 priority patent/US10445320B2/en
Publication of JP2018018279A publication Critical patent/JP2018018279A/ja
Application granted granted Critical
Publication of JP6753190B2 publication Critical patent/JP6753190B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/83Querying
    • G06F16/835Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/282Hierarchical databases, e.g. IMS, LDAP data stores or Lotus Notes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、文書検索装置及びプログラムに関する。
特許文献1には、属性情報を有する構造化文書及びこの構造化文書を持つフォルダが格納された記憶装置から、指定された検索条件により、上記構造化文書の検索を行い、該当した構造化文書の文書ID(Identification)と属性情報とを紐付けして抽出文書データベースに格納する文書管理システムにおいて、前記属性情報の分類を用いて全文検索を行う技術が開示されている。
特開2011−053881号公報
本発明は、属性情報の分類を用いて全文検索を行う場合に比較して、高速に検索結果を出力することができる文書検索装置及びプログラムを提供することを目的とする。
上記目的を達成するために、請求項1に記載の文書検索装置は、階層関係にある複数の検索語がまとめられた1つの検索語群を受け付ける受付部と、前記受付部により受け付けられた第一の検索語の検索範囲として、構造化文書データに含まれる階層関係にある複数のコンテンツのうちの前記第一の検索語の属性情報と同じ属性情報を有する第一のコンテンツを設定し、前記第一の検索語よりも下位の階層となる第二の検索語の検索範囲として、前記第一のコンテンツと同じ階層か又は前記第一のコンテンツよりも下位の階層となり、かつ前記第二の検索語の属性情報と同じ属性情報を有する第二のコンテンツを設定する設定部と、を備えている。
また、請求項に記載の発明は、請求項1に記載の発明において、前記受付部により受け付けられた複数の検索語の少なくとも1つの検索語の類義語を取得する取得部をさらに備え、前記設定部が、前記複数の検索語に加えて、前記取得部により取得された類義語についても対応する階層の検索範囲として前記第二のコンテンツを設定するものである。
また、請求項に記載の発明は、請求項1又は請求項2に記載の発明において、前記設定部が、前記複数のコンテンツの各々における本文の有無を示す情報を含む目次情報に基づいて、前記本文を有するコンテンツを検索対象として前記第一のコンテンツ及び前記第二のコンテンツを設定するものである。
また、請求項に記載の発明は、請求項1から請求項の何れか1項に記載の発明において、前記設定部より設定された第一のコンテンツから前記第一の検索語を含むコンテンツを検索し、かつ第二のコンテンツから前記第二の検索語を含むコンテンツを検索する実行部と、前記実行部による検索により得られたコンテンツを部分木の形式で出力する出力部と、をさらに備えている。
また、請求項に記載の発明は、請求項1から請求項の何れか1項に記載の発明において、前記設定部より設定された第一のコンテンツから前記第一の検索語を含むコンテンツを検索し、かつ第二のコンテンツから前記第二の検索語を含むコンテンツを検索する実行部と、前記実行部による検索結果を、前記実行部による検索に用いられた検索語の階層関係に従って該検索語が含まれるコンテンツを辿れる形式で表示部に出力する出力部と、をさらに備えている。
一方、上記目的を達成するために、請求項に記載のプログラムは、コンピュータを、請求項1から請求項の何れか1項記載の文書検索装置の受付部及び設定部として機能させるためのものである。
請求項1及び請求項に記載の発明によれば、属性情報の分類を用いて全文検索を行う場合に比較して、高速に検索結果を出力することができる。
請求項に記載の発明によれば、属性情報を有さないコンテンツも含めて検索を行う場合に比較して、高速に検索結果を出力することができる。
請求項に記載の発明によれば、受け付けた検索語の類義語も含めて検索することができる。
請求項に記載の発明によれば、本文の無いコンテンツも含めて検索を行う場合に比較して、高速に検索結果を出力することができる。
請求項に記載の発明によれば、検索により得られたコンテンツを個別に出力する場合に比較して、コンテンツが有する目次とは別の視点で作成した目次体系を作成することができる。
請求項に記載の発明によれば、検索により得られたコンテンツを個別に出力する場合に比較して、目標とする情報に辿り易い形式で検索結果を出力することができる。
実施の形態に係る文書検索装置の機能的な構成を示す機能ブロック図である。 実施の形態に係る構造化文書データの一例を示す図である。 実施の形態に係るコンテンツに設定される属性情報の一例を示す図である。 実施の形態に係る検索条件設定ファイルの一例を示す図である。 実施の形態に係る検索結果の一例の説明に供する図である。 実施の形態に係る検索結果の一例の説明に供する図である。 実施の形態に係る検索結果の目次の一例を示す図である。 実施の形態に係る文書検索装置として機能するコンピュータの概略構成を示すブロック図である。 実施の形態に係る検索処理の一例を示すフローチャートである。 変形例に係る検索結果表示画面の画面遷移の一例を示す図である。
以下、図面を参照して、本発明を実施するための形態例を詳細に説明する。
まず、図1を参照して、本実施の形態に係る文書検索装置10の機能的な構成について説明する。図1に示すように、文書検索装置10は、受付部12、取得部14、設定部16、実行部18、出力部20、及び記憶部22を備えている。
本実施の形態に係る記憶部22には、類義語情報24、構造化文書データ26、及び目次情報28が記憶される。本実施の形態に係る類義語情報24には、検索語と、該検索語の類義語とが対応付けられて記憶されている。具体的には、類義語情報24には、例えば、「普通預金」に対応付けられて「定期預金」が記憶されている。
本実施の形態に係る構造化文書データ26は、階層関係にある複数のコンテンツを有する。一例として図2に示すように、構造化文書データ26は、文書の編に対応するコンテンツ30A、章に対応するコンテンツ30B、節に対応するコンテンツ30C、及び条に対応するコンテンツ30Dを有する。また、本実施の形態では、一例として、階層関係として、編が最上位の階層で、条が最下位の階層で、編が章の上位の階層で、章が節の上位の階層で、節が条の上位の階層である関係を適用している。なお、以下では、コンテンツ30A〜30Dを区別せずに総称する場合は、符号の末尾のアルファベットを省略する。また、本実施の形態では、各コンテンツ30が、各々1つのXML(eXtensible Markup Language)ファイルとして記憶部22に記憶されている。
本実施の形態に係る目次情報28には、各コンテンツ30の階層関係を示す情報、及び各コンテンツ30における本文の有無を示す情報が記憶されている。また、目次情報28には、各階層のコンテンツ30に属性情報が設定されている場合は、該属性情報も記憶されている。
本実施の形態に係る受付部12は、後述する入出力装置56(図8参照)を介してユーザにより入力された、階層関係にある複数の検索語を受け付ける。例えば、受付部12は、「預金」及び「普通預金」のように、互いに上位及び下位の階層関係にある複数の検索語を受け付ける。また、受付部12は、検索語に関する属性を示す属性情報も受け付ける。属性情報の例としては、「預金」という検索語に対しては、「OPERATION(操作)」及び「RULE(規程)」といった情報が挙げられる。
本実施の形態に係る受付部12は、例えば、「預金(@TYPE=OPERATION)/普通預金」といった形式で検索語を受け付ける。この形式では、「/」が階層の区切りを示し、括弧内の@TYPEに対応する値(この例ではOPERATION)が、属性情報を示す。
本実施の形態に係る取得部14は、受付部12により受け付けられた検索語の類義語を取得する。本実施の形態では、取得部14は、類義語情報24を参照し、受付部12により受け付けられた複数の検索語のうち、下位の階層の検索語の類義語を取得する。例えば、受付部12より受け付けられた検索語が「預金」及び「普通預金」である場合、取得部14は、「普通預金」の類義語として「定期預金」を取得する。
本実施の形態に係る設定部16は、受付部12により受け付けられた第一の検索語の検索範囲として、構造化文書データ26に含まれる階層関係にある複数のコンテンツ30のうちの第一のコンテンツを設定し、上記第一の検索語よりも下位の階層となる第二の検索語の検索範囲として、上記第一のコンテンツと同じ階層か又は上記第一のコンテンツよりも下位の階層となる第二のコンテンツを設定する。
また、設定部16は、取得部14により取得された類義語についても、対応する階層の検索範囲としてコンテンツ30を設定する。また、設定部16は、目次情報28を参照し、各コンテンツ30のうち、本文を有するコンテンツ30のみを検索範囲として設定する。また、設定部16は、検索語に属性情報が付与されている場合は、各コンテンツ30のうち、検索語に付与されている属性情報と同じ属性情報を有するコンテンツ30のみを該検索語の検索範囲として設定する。
図3及び図4を参照して、設定部16による検索条件の設定処理の一例を具体的に説明する。ここでは、一例として図3に示すように、編の階層のコンテンツ30Aが属性情報を有さず、章の階層のコンテンツ30Bが「OPERATION」との属性情報を有し、節の階層のコンテンツ30C、及び条の階層のコンテンツ30Dが「RULE」との属性情報を有する場合について説明する。なお、各コンテンツ30に設定される属性情報は、図3に示す例に限定されない。例えば、構造化文書データ26に含まれる全てのコンテンツ30に同じ属性情報が設定されてもよいし、コンテンツ30毎に異なる属性情報が設定されてもよい。また、例えば、1つのコンテンツ30に複数の属性情報が設定されてもよい。
また、本実施の形態に係る設定部16は、一例として図4に示すように、検索条件を示す情報として、XMLファイルの形式の検索条件設定ファイル32を生成することで、検索条件を設定する。なお、図4では、コンテンツ30Aは本文を有さず、コンテンツ30B〜30Dは本文を有する場合の検索条件設定ファイル32の例を示している。また、図4では、検索語として、「預金(@TYPE=OPERATION)/普通預金(@TYPE=RULE)」が受付部12により受け付けられた場合の検索条件設定ファイル32の例を示している。すなわち、図4の例では、「預金」が上記第一の検索語に対応し、「普通預金」が上記第二の検索語に対応する。
図4に示すように、本実施の形態に係る検索条件設定ファイル32では、SEARCHITEMタグで検索対象とするコンテンツ30の階層が設定される。図4の例では、STARTが検索を開始する階層を示し、ENDが検索を終了する階層を示す。また、検索条件設定ファイル32では、TEXTタグで検索語が設定される。また、検索条件設定ファイル32では、ATTRNAMEタグで検索語に属性情報が付与されていることを示す文字列が設定され、ATTRVALUEタグで検索語に付与されている属性情報が設定される。また、図4に示す「H2」は章の階層に対応し、「H3」は節の階層に対応し、「H4」は条の階層に対応する。
図4の例では、上位階層の検索語の「預金」については、各々本文を有するコンテンツである章の階層のコンテンツ30B及び節の階層のコンテンツ30Cのうち、「預金」の属性情報と同じ属性情報である「OPERATION」を属性情報として有するコンテンツ30Bが検索範囲として設定されることを示す。
また、図4の例では、下位階層の検索語の「普通預金」については、各々本文を有するコンテンツであって、かつ該「普通預金」よりも上位階層となる「預金」の検索範囲として設定されたコンテンツと同じ階層か又は該設定されたコンテンツよりも下位階層のコンテンツとなる節の階層のコンテンツ30C及び条の階層のコンテンツ30Dのうち、「普通預金」の属性情報と同じ属性情報である「RULE」を属性情報として有するコンテンツ30C、30Dが検索範囲として設定されることを示す。
このように、本実施の形態に係る設定部16は、第一の検索語(上記の例では、「預金」)の検索範囲として、構造化文書データ26に含まれる階層関係にある複数のコンテンツ30のうちの第一のコンテンツ(上記の例では、章の階層のコンテンツ30B、及び節の階層のコンテンツ30C)を設定する。また、設定部16は、第二の検索語(上記の例では「普通預金」)の検索範囲として、第一のコンテンツと同じ階層(上記の例では節の階層)か又は第一のコンテンツよりも下位の階層(上記の例では条の階層)となる第二のコンテンツ(上記の例ではコンテンツ30C、30D)を設定する。
すなわち、本実施の形態では、受付部12により受け付けられた複数の検索語の階層関係に従って、検索範囲が絞って設定される。従って、属性情報の分類を用いて全文検索を行う場合に比較して、高速に検索結果が出力される。
なお、錯綜を回避するために図4では図示を省略したが、例えば、取得部14により「普通預金」の類義語として「定期預金」が取得された場合は、設定部16は、図4に示す「普通預金」を「定期預金」に置き換えた検索条件設定ファイル32も生成する。
本実施の形態に係る実行部18は、設定部16より設定されたコンテンツ30を検索対象として構造化文書データ26に対する検索を実行する。本実施の形態では、実行部18は、設定部16により生成された検索条件設定ファイル32に従って、構造化文書データ26に対する検索を実行する。
本実施の形態に係る出力部20は、実行部18による検索により得られたコンテンツ30を部分木の形式で出力する。本実施の形態では、出力部20は、例として図5及び図6に示すように、実行部18による検索により得られたコンテンツ群34を部分木の形式で記憶部22に出力する。
図5に示す例では、コンテンツ群34は、検索語である「預金」が含まれるコンテンツ30B、「普通預金」が含まれるコンテンツ30C、及び該コンテンツ30Cの下位階層のコンテンツ30Dを含む。また、図6に示すように、コンテンツ群34は、さらに、検索語である「預金」が含まれるコンテンツ30E、コンテンツ30Eの下位階層のコンテンツであって「普通預金」の類義語である「定期預金」が含まれるコンテンツ30F、及び該コンテンツ30Fの下位階層のコンテンツ30Gを含む。
このように、本実施の形態では、実行部18による検索により得られたコンテンツ30を部分木の形式で出力している。これにより、一例として図7に示すように、検索結果として「預金/普通預金」及び「預金/定期預金」のそれぞれの部分木の階層構造をあわせた構成が得られることから、コンテンツが予め有する目次とは別の視点(例えば、それぞれの業務シーンに対応した視点)で作成した目次体系が作成される。このような別の視点で作成した目次体系を用いることにより、検索結果を個別に表示する場合よりも高速に目的の検索結果にたどり着く。
前述した文書検索装置10は、図8に示すコンピュータ50によって実現される。本実施の形態に係るコンピュータ50は、CPU(Central Processing Unit)52、一時記憶領域としてのメモリ54、及び不揮発性の記憶部22を備える。また、コンピュータ50は、ディスプレイ等の表示装置とキーボード及びマウス等の入力装置とを含む入出力装置56が接続される入出力I/F(InterFace)58を備える。また、コンピュータ50は、記録媒体60に対するデータの読み込みと書き込みとを制御するR/W(Read/Write)部62、及びネットワークに接続されるネットワークI/F64を備える。CPU52、メモリ54、記憶部22、入出力I/F58、R/W部62、及びネットワークI/F64は、バス66を介して互いに接続される。
記憶部22は、HDD(Hard Disk Drive)、SSD(Solid State Drive)、及びフラッシュメモリ等によって実現される。記憶媒体としての記憶部22には、コンピュータ50を文書検索装置10として機能させるための検索処理プログラム68が記憶される。
CPU52は、検索処理プログラム68を記憶部22から読み出してメモリ54に展開し、検索処理プログラム68が有するプロセスを順次実行する。CPU52が検索処理プログラム68を実行することで、図1に示す受付部12、取得部14、設定部16、実行部18、及び出力部20として動作する。これにより、検索処理プログラム68がインストールされたコンピュータ50が、文書検索装置10として機能する。
次に、本実施の形態に係る文書検索装置10の作用を説明する。コンピュータ50により検索処理プログラム68を実行させることで、図9に示す検索処理が実行される。図9に示す検索処理は、例えば、ユーザによって入出力装置56を介して階層関係にある複数の検索語が入力され、検索開始の実行指示が入力された場合に実行される。
図9のステップ100で、受付部12は、入出力装置56を介してユーザにより入力された、階層関係にある複数の検索語を受け付ける。次のステップ102で、取得部14は、前述したように、類義語情報24を参照し、ステップ100で受け付けられた検索語の類義語を取得する。なお、ここで受け付けられた検索語の類義語が類義語情報24に存在しない場合もあるが、この場合は、以降の処理で類義語に関する処理は行わない。
次のステップ104で、設定部16は、前述したように、ステップ100で受け付けられた検索語、ステップ102で取得された類義語、及び目次情報28に基づいて、検索条件設定ファイル32を生成する。
次のステップ106で、実行部18は、ステップ104で生成された検索条件設定ファイル32に従って、構造化文書データ26に対する検索を実行する。次のステップ108で、出力部20は、ステップ106の処理による検索により得られたコンテンツ群34を部分木の形式で記憶部22に出力した後、本検索処理を終了する。
なお、上記実施の形態において、出力部20は、構造化文書データ26に対する検索に用いられた検索語の階層関係に従って該検索語が含まれるコンテンツ30を辿れる形式で入出力装置56のディスプレイに出力する形態としてもよい。この出力部20による出力によりディスプレイに表示される検索結果表示画面の画面遷移の一例を図10に示す。図10に示すように、この形態例における検索結果表示画面では、まず最上位階層の検索語である「預金」に対応する預金ボタンが表示される。
そして、例えば、ユーザにより入出力装置56の入力装置を介して預金ボタンが指定されると、預金の下位階層である普通預金及び定期預金の各々に対応する普通預金ボタン及び定期預金ボタンが表示される。さらに、例えば、ユーザにより入出力装置56の入力装置を介して普通預金ボタンが指定されると、「普通預金」が含まれるコンテンツ30の該当箇所が表示される。
また、上記実施の形態では、検索語の階層数として、2階層を適用した場合について説明したがこれに限定されない。検索語の階層数として、3階層以上を適用する形態としてもよい。また、構造化文書データの階層数も4階層に限定されないことは言うまでもない。但し、検索語の階層数が構造化文書データの階層数未満であることが好ましい。
また、上記実施の形態では、目次情報28に各コンテンツ30の階層関係を示す情報が含まれる場合について説明したが、これに限定されない。例えば、構造化文書データ26が1つのXMLファイルである場合は、階層を表すタグの包含関係から各コンテンツ30の階層関係が判別可能である。この例のように、構造化文書データ26に各コンテンツ30の階層関係を示す情報が含まれる場合は、目次情報28に各コンテンツ30の階層関係を示す情報が含まれなくてもよい。
また、上記実施の形態では、検索処理プログラム68が記憶部22に予め記憶(インストール)されている場合について説明したが、これに限定されない。検索処理プログラム68は、CD−ROM(Compact Disk Read Only Memory)、DVD−ROM(Digital Versatile Disk Read Only Memory)、USB(Universal Serial Bus)メモリ等の記録媒体に記録された形態で提供されてもよい。また、検索処理プログラム68は、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
さらに、上記実施の形態では、検索処理を、プログラムを実行することにより、コンピュータを利用してソフトウェア構成により実現する場合について説明したが、これに限定されない。例えば、検索処理を、ハードウェア構成や、ハードウェア構成とソフトウェア構成の組み合わせによって実現する形態としてもよい。
その他、上記実施の形態で説明した文書検索装置10の構成(図1参照)は一例であり、本発明の主旨を逸脱しない範囲内において不要な部分を削除したり、新たな部分を追加したりしてもよいことは言うまでもない。
また、上記実施の形態で説明した検索処理の流れ(図9参照)も一例であり、本発明の主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよいことは言うまでもない。
10 文書検索装置
12 受付部
14 取得部
16 設定部
18 実行部
20 出力部
22 記憶部
24 類義語情報
26 構造化文書データ
28 目次情報
30A、30B、30C、30D、30E、30F、30G コンテンツ
32 検索条件設定ファイル
34 コンテンツ群
50 コンピュータ
52 CPU
54 メモリ
56 入出力装置
60 記録媒体
68 検索処理プログラム

Claims (6)

  1. 階層関係にある複数の検索語がまとめられた1つの検索語群を受け付ける受付部と、
    前記受付部により受け付けられた第一の検索語の検索範囲として、構造化文書データに含まれる階層関係にある複数のコンテンツのうちの前記第一の検索語の属性情報と同じ属性情報を有する第一のコンテンツを設定し、前記第一の検索語よりも下位の階層となる第二の検索語の検索範囲として、前記第一のコンテンツと同じ階層か又は前記第一のコンテンツよりも下位の階層となり、かつ前記第二の検索語の属性情報と同じ属性情報を有する第二のコンテンツを設定する設定部と、
    を備えた文書検索装置。
  2. 前記受付部により受け付けられた複数の検索語の少なくとも1つの検索語の類義語を取得する取得部をさらに備え、
    前記設定部は、前記複数の検索語に加えて、前記取得部により取得された類義語についても対応する階層の検索範囲として前記第二のコンテンツを設定する
    請求項1に記載の文書検索装置。
  3. 前記設定部は、前記複数のコンテンツの各々における本文の有無を示す情報を含む目次情報に基づいて、前記本文を有するコンテンツを検索対象として前記第一のコンテンツ及び前記第二のコンテンツを設定する
    請求項1又は請求項2に記載の文書検索装置。
  4. 前記設定部より設定された第一のコンテンツから前記第一の検索語を含むコンテンツを検索し、かつ第二のコンテンツから前記第二の検索語を含むコンテンツを検索する実行部と、
    前記実行部による検索により得られたコンテンツを部分木の形式で出力する出力部と、
    をさらに備えた請求項1から請求項の何れか1項に記載の文書検索装置。
  5. 前記設定部より設定された第一のコンテンツから前記第一の検索語を含むコンテンツを検索し、かつ第二のコンテンツから前記第二の検索語を含むコンテンツを検索する実行部と、
    前記実行部による検索結果を、前記実行部による検索に用いられた検索語の階層関係に従って該検索語が含まれるコンテンツを辿れる形式で表示部に出力する出力部と、
    をさらに備えた請求項1から請求項の何れか1項に記載の文書検索装置。
  6. コンピュータを、請求項1から請求項の何れか1項に記載の文書検索装置の受付部及び設定部として機能させるためのプログラム。
JP2016147694A 2016-07-27 2016-07-27 文書検索装置及びプログラム Active JP6753190B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2016147694A JP6753190B2 (ja) 2016-07-27 2016-07-27 文書検索装置及びプログラム
US15/429,451 US10445320B2 (en) 2016-07-27 2017-02-10 Document search apparatus, non-transitory computer readable medium, and document search method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016147694A JP6753190B2 (ja) 2016-07-27 2016-07-27 文書検索装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2018018279A JP2018018279A (ja) 2018-02-01
JP6753190B2 true JP6753190B2 (ja) 2020-09-09

Family

ID=61012090

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016147694A Active JP6753190B2 (ja) 2016-07-27 2016-07-27 文書検索装置及びプログラム

Country Status (2)

Country Link
US (1) US10445320B2 (ja)
JP (1) JP6753190B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020129307A (ja) * 2019-02-08 2020-08-27 富士電機株式会社 情報検索装置、情報検索方法およびプログラム

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6993527B1 (en) * 1998-12-21 2006-01-31 Adobe Systems Incorporated Describing documents and expressing document structure
CN1222898C (zh) * 2000-10-20 2005-10-12 夏普公司 动态图像内容检索信息管理装置、方法和检索装置
CA2451208A1 (en) * 2001-06-21 2003-01-03 Paul P. Vagnozzi Database indexing method and apparatus
US7080059B1 (en) * 2002-05-13 2006-07-18 Quasm Corporation Search and presentation engine
EP1685474A4 (en) * 2003-11-17 2007-01-24 Bloomberg Lp LEGAL RESEARCH SYSTEM
US20130325916A1 (en) * 2004-09-09 2013-12-05 William M. Pitts Full text search capabilities integrated into distributed file systems - Incrementally Indexing Files
US9189481B2 (en) * 2005-05-06 2015-11-17 John M. Nelson Database and index organization for enhanced document retrieval
US20100036840A1 (en) * 2005-09-09 2010-02-11 Pitts William M Presentation of Search Results
US9361365B2 (en) * 2008-05-01 2016-06-07 Primal Fusion Inc. Methods and apparatus for searching of content using semantic synthesis
JP2011053881A (ja) 2009-09-01 2011-03-17 Mitsubishi Electric Corp 文書管理システム
US8577823B1 (en) * 2011-06-01 2013-11-05 Omar M. A. Gadir Taxonomy system for enterprise data management and analysis
JP2012252529A (ja) * 2011-06-03 2012-12-20 Sony Corp 情報処理装置、情報処理方法及びプログラム
US20130091266A1 (en) * 2011-10-05 2013-04-11 Ajit Bhave System for organizing and fast searching of massive amounts of data
US8996501B2 (en) * 2011-12-08 2015-03-31 Here Global B.V. Optimally ranked nearest neighbor fuzzy full text search
US9461876B2 (en) * 2012-08-29 2016-10-04 Loci System and method for fuzzy concept mapping, voting ontology crowd sourcing, and technology prediction
US9489119B1 (en) * 2013-10-25 2016-11-08 Theodore Root Smith, Jr. Associative data management system utilizing metadata
US10585892B2 (en) * 2014-07-10 2020-03-10 Oracle International Corporation Hierarchical dimension analysis in multi-dimensional pivot grids
US10671677B2 (en) * 2015-06-12 2020-06-02 Smugmug, Inc. Advanced keyword search application

Also Published As

Publication number Publication date
JP2018018279A (ja) 2018-02-01
US10445320B2 (en) 2019-10-15
US20180032577A1 (en) 2018-02-01

Similar Documents

Publication Publication Date Title
US9760347B2 (en) Method and system to identify GUI objects for non-markup-language-presented applications
US8190632B2 (en) Computer product, information retrieving apparatus, and information retrieving method
JP2008146424A (ja) Xml文書の適合度の算出方法およびそのプログラムと、情報処理装置
JP6898542B2 (ja) 情報処理装置、その制御方法、及びプログラム
JP6753190B2 (ja) 文書検索装置及びプログラム
JP2008234078A (ja) 情報処理装置、情報処理方法、情報処理プログラム、及び情報処理プログラムを記録した記録媒体
JP7208222B2 (ja) データレコード内のフォーマットを動的に定義する技術
JP2009199164A (ja) 文書管理装置、文書管理方法及び記録媒体
JP5950522B2 (ja) 文書リストの表示のための装置、方法及びプログラム
JP2010256977A (ja) 情報検索装置およびプログラム
JP2009129202A (ja) データ処理装置、データ処理方法、および、プログラム
JP2008269106A (ja) スキーマ抽出方法、情報処理装置、コンピュータプログラム及び記録媒体
JP2008084128A (ja) 構造化文書の要素指定装置、要素指定方法及び要素指定プログラム
WO2023223424A1 (ja) ドキュメント生成装置、プログラム及びドキュメント生成方法
JP5417359B2 (ja) 文書評価支援システム、及び文書評価支援方法
JP2008262324A (ja) 情報処理装置及び情報処理方法及びプログラム
JP6813776B2 (ja) 情報処理装置、その制御方法及びプログラム
JP2009301511A (ja) 索引情報作成装置、索引情報作成方法及びプログラム
JP2009193298A (ja) 情報処理装置及び情報処理方法及びプログラム
JP2005284417A (ja) テーブル形式のxml文書のランダムアクセス方法、及びそのプログラム
JP2015162170A (ja) 情報処理装置、及び制御方法
JP5971069B2 (ja) 情報処理装置、タイトル抽出方法及びプログラム
JP5367099B2 (ja) 差異箇所抽出装置及びプログラム
JP2016004539A (ja) テキスト表示プログラム
JP2013191106A (ja) 入力支援プログラム、入力支援装置、及び入力支援方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190520

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200324

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200423

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200721

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200803

R150 Certificate of patent or registration of utility model

Ref document number: 6753190

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350