JP7326920B2 - 検索装置、検索システム、及び検索プログラム - Google Patents

検索装置、検索システム、及び検索プログラム Download PDF

Info

Publication number
JP7326920B2
JP7326920B2 JP2019117923A JP2019117923A JP7326920B2 JP 7326920 B2 JP7326920 B2 JP 7326920B2 JP 2019117923 A JP2019117923 A JP 2019117923A JP 2019117923 A JP2019117923 A JP 2019117923A JP 7326920 B2 JP7326920 B2 JP 7326920B2
Authority
JP
Japan
Prior art keywords
words
word
recommended
query
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019117923A
Other languages
English (en)
Other versions
JP2021005179A (ja
Inventor
維文 川口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2019117923A priority Critical patent/JP7326920B2/ja
Priority to US16/658,234 priority patent/US20200410007A1/en
Priority to CN201911241146.4A priority patent/CN112131355A/zh
Publication of JP2021005179A publication Critical patent/JP2021005179A/ja
Application granted granted Critical
Publication of JP7326920B2 publication Critical patent/JP7326920B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、検索装置、検索システム、及び検索プログラムに関する。
特許文献1には、クエリに入力された単語同士を関連付けて記憶する検索ログを利用してクエリサジェスチョンを行うクエリサジェスチョン提供装置が提案されている。具体的には、検索クエリ及び再検索クエリを含む一連の検索操作を示す検索ログを参照して、一連の検索操作に含まれる検索クエリ間の関連度を示すスコアを算出する。このとき、一連の検索操作のうちの最終クエリと、他の検索クエリと、の間のスコアに高いウェイトを付与してスコアを算出する。そして、ユーザ端末から検索クエリを受け付けると、当該検索クエリとの間のスコアの高い検索クエリをユーザ端末に提供する。
特許文献2には、ドキュメントを絞り込み検索するための情報検索装置が提案されている。具体的には、ドキュメントに含まれる文章を形態素解析することによって単語を抽出して前記ドキュメントと関連付けて初期状態の逆引きインデックスを作成して抽出された単語ごとに該単語を含むドキュメントを関連付けた単語リストを生成し、ユーザ端末に表示する。そして、単語リストからユーザに単語を選択させて、初期状態の逆引きインデックスから選択された単語を含むドキュメントの部分集合から再構成した逆引きインデックスを作成して、再構成した逆引きインデックスを用いて単語リストを再生成し、ユーザ端末に再表示する。
特開2012-003532号公報 特開2008-234559号公報
ある単語から検索されたコンテンツをさらに絞り込むために、追加で単語を入力する場合において、入力する単語を推薦する方法として、コンテンツの一例である文書と単語を関連付けた逆引きインデックスを用いて推薦単語リストを作成し推薦する方法があったが、逆引きインデックスを用いた推薦単語リストの推薦方法では、絞り込むために推薦された単語が複数ある場合に、各単語によって検索されるコンテンツが重複したり、絞り込むために推薦された単語が複数ある場合に、各単語によって検索されるコンテンツの数にバラツキがある場合があるため、推薦された各単語をそれぞれ入力し、その中から必要な情報を見つけ出す必要があった。本発明は、ある単語から検索されたコンテンツをさらに絞り込むために、追加で単語を入力する場合において、逆引きインデックスを用いて推薦単語リストを作成し推薦する方法と比較して、ユーザにとって必要な情報の多い検索結果とすることが可能な検索装置、検索システム、及び検索プログラムを提供することを目的とする。
請求項1に記載の検索装置は、検索単語を受け付ける受付部と、前記受付部が受け付けた前記検索単語から得た検索結果を絞り込む推薦単語を複数出力する場合に、複数の前記推薦単語の各単語をクエリに追加した際に絞り込みの結果が重複すること、及び前記各単語をクエリに追加した際に絞り込んだ数に差が生じることの少なくとも一方が、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出する導出部と、を含み、前記導出部は、予め記憶された複数の文書から前記受付部が受け付けた前記検索単語を含む文書を抽出して得た文書リストと、予め記憶された複数の単語との対応関係を用いて、単語同士の関係を求め、求めた単語同士の関係から任意個の推薦単語を導出する
請求項に記載の発明は、請求項に記載の発明において、前記導出部は、前記単語同士の関係として、推薦する単語が選択される確率と絞り込みタイプの確率の相互情報量を求め、前記相互情報量が最小または予め定めた閾値以下になるような任意個の推薦単語を導出する。
請求項に記載の発明は、請求項又は請求項に記載の発明において、前記受付部が受け付けた前記検索単語を用いて、前記単語同士の関係を求める際に用いる前記複数の単語の数を限定する限定部を更に含む。
請求項に記載の発明は、請求項の何れか1項に記載の発明において、前記文書リストの必要文書数を制限する制限部を更に含み、前記導出部は、前記制限部により制限された文書数の中から前記受付部が受け付けた前記検索単語を含む文書リストを抽出して抽出した前記文書リストと、予め記憶された複数の単語との対応関係を用いて、単語同士の関係を求めて任意個の推薦単語を導出する。
請求項に記載の発明は、請求項に記載の発明において、前記制限部は、文書数と予め定めた推薦単語数を用いて前記必要文書数を決定する。
請求項に記載の発明は、請求項1~の何れか1項に記載の発明において、前記導出部は、複数の前記推薦単語の各単語をクエリに追加した際に絞り込みの結果が重複することが、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出する場合、Jaccard係数、Dice係数、または、Simpson係数を用いて任意個の推薦単語を導出する。
請求項7に記載の発明は、検索単語を受け付ける受付部と、前記受付部が受け付けた前記検索単語から得た検索結果を絞り込む推薦単語を複数出力する場合に、複数の前記推薦単語の各単語をクエリに追加した際に絞り込みの結果が重複すること、及び前記各単語をクエリに追加した際に絞り込んだ数に差が生じることの少なくとも一方が、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出する導出部と、を含み、前記導出部は、前記各単語をクエリに追加した際に絞り込んだ数に差が生じることが、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出する場合、推薦単語をクエリに追加することで得られる文書数の差を利用して任意個の推薦単語を導出する。
請求項8に記載の発明は、請求項1~の何れか1項に記載の発明において、前記導出部は、前記各単語をクエリに追加した際に絞り込んだ数に差が生じることが、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出する場合、推薦単語をクエリに追加することで得られる文書数の差を利用して任意個の推薦単語を導出する。
請求項9に記載の発明は、請求項に記載の発明において、前記導出部は、検索結果が予め定めた理想的な文書数で、かつ他の単語と検索結果が重複しない仮想的に定めたダミー単語を用いて前記推薦単語を導出する。
請求項10に記載の発明は、検索単語を受け付ける受付部と、前記受付部が受け付けた前記検索単語から得た検索結果を絞り込む推薦単語を複数出力する場合に、複数の前記推薦単語の各単語をクエリに追加した際に絞り込みの結果が重複すること、及び前記各単語をクエリに追加した際に絞り込んだ数に差が生じることの少なくとも一方が、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出する導出部と、絞り込む前のクエリの文書数、任意個の推薦単語の何れかの単語をクエリに追加した場合の文書量、任意個の推薦単語の何れかの単語をクエリに追加した場合の重複、任意個の推薦単語の何れかの単語をクエリに追加した場合の偏り、及び任意個の推薦単語の何れかの単語をクエリに追加した場合の損失のそれぞれを領域として表示する表示部と、を含む。
請求項1に記載の発明は、請求項1~9の何れか1項に記載の発明において、絞り込む前のクエリの文書数、任意個の推薦単語の何れかの単語をクエリに追加した場合の文書量、任意個の推薦単語の何れかの単語をクエリに追加した場合の重複、任意個の推薦単語の何れかの単語をクエリに追加した場合の偏り、及び任意個の推薦単語の何れかの単語をクエリに追加した場合の損失のそれぞれを領域として表示する表示部を更に含む。
請求項1に記載の発明は、請求項1に記載の発明において、前記表示部は、前記領域を選択することにより領域に対応する単語をクエリに追加する追加部を更に含む。
請求項1に記載の検索システムは、請求項1~1の何れか1項に記載の検索装置と、前記受付部が受け付ける単語を入力し、前記導出部の導出結果を表示する情報処理端末と、を含む。
請求項1に記載の検索プログラムは、コンピュータを、請求項1~1の何れか1項に記載の検索装置として機能させる。
請求項1に記載の検索装置によれば、ある単語から検索されたコンテンツをさらに絞り込むために、追加で単語を入力する場合において、逆引きインデックスを用いて推薦単語リストを作成し推薦する方法と比較して、ユーザにとって必要な情報の多い検索結果とすることが可能で、かつ単語同士の関係を考慮した推薦単語を導出することが可能な検索装置を提供できる。
請求項に記載の発明によれば、複数の推薦単語の各単語をクエリに追加した際に絞り込みの結果が重複すること、及び各単語をクエリに追加した際に絞り込んだ数に差が生じることの少なくとも一方が、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出することが可能となる。
請求項に記載の発明によれば、予め記憶された複数の単語全てを用いて推薦単語を導出する場合に比べて、計算量を削減できる。
請求項に記載の発明によれば、全ての文書リストを用いて推薦単語を導出する場合に比べて、計算量を削減できる。
請求項に記載の発明によれば、推薦単語を導出するために必要な文書数を決定することが可能となる。
請求項に記載の発明によれば、複数の推薦単語の各単語をクエリに追加した際に絞り込みの結果が重複することが、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出することが可能となる。
請求項7に記載の発明によれば、ある単語から検索されたコンテンツをさらに絞り込むために、追加で単語を入力する場合において、逆引きインデックスを用いて推薦単語リストを作成し推薦する方法と比較して、ユーザにとって必要な情報の多い検索結果とすることが可能で、かつ各単語をクエリに追加した際に絞り込んだ数に差が生じることが、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出することが可能となる。
請求項8に記載の発明によれば、各単語をクエリに追加した際に絞り込んだ数に差が生じることが、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出することが可能となる。
請求項9に記載の発明によれば、ダミー単語を用いずに相互情報量を求めて推薦単語を導出する場合に比べて、任意個の推薦単語のどの単語をクエリに追加しても検索にヒットしない文書が生じることを抑制することが可能となる。
請求項10に記載の発明によれば、ある単語から検索されたコンテンツをさらに絞り込むために、追加で単語を入力する場合において、逆引きインデックスを用いて推薦単語リストを作成し推薦する方法と比較して、ユーザにとって必要な情報の多い検索結果とすることが可能で、かつ単語同士の関係を目視で確認することが可能となる。
請求項1に記載の発明によれば、単語同士の関係を目視で確認することが可能となる。
請求項1に記載の発明によれば、単語同士の関係を確認しながら、単語をクエリに追加することができる。
請求項1に記載の検索システムによれば、ある単語から検索されたコンテンツをさらに絞り込むために、追加で単語を入力する場合において、逆引きインデックスを用いて推薦単語リストを作成し推薦する方法と比較して、ユーザにとって必要な情報の多い検索結果とすることが可能で、かつ単語同士の関係を考慮した推薦単語を導出することが可能な検索システムを提供できる。
請求項13に記載の検索プログラムによれば、ある単語から検索されたコンテンツをさらに絞り込むために、追加で単語を入力する場合において、逆引きインデックスを用いて推薦単語リストを作成し推薦する方法と比較して、ユーザにとって必要な情報の多い検索結果とすることが可能で、かつ単語同士の関係を考慮した推薦単語を導出することが可能な検索プログラムを提供できる。
本実施形態に係る情報処理システムの概略構成を示す図である。 本実施形態に係る情報処理システムにおける情報処理端末及びサーバの電気系の要部構成を示すブロック図である。 第1実施形態に係るサーバの機能ブロック図である。 クエリに「料理」を追加した場合の推薦単語の一例を示す図である。 相互情報量の「重複」と「偏り」との関係を模式的に表したもので、「重複」が小さいと相互情報量は小さくなることを示す図である。 相互情報量の「重複」と「偏り」との関係を模式的に表したもので、「偏り」が小さいと相互情報量は小さくなることを示す図である。 第1実施形態に係るサーバで行われる処理の流れの一例を示すフローチャートである。 第2実施形態に係るサーバの機能ブロック図である。 第2実施形態に係るサーバ16で行われる処理の流れの一例を示すフローチャートである。 第3実施形態に係るサーバの機能ブロック図である。 対応テーブルの一例を示す図である。 対応テーブルをもとにスコアとして相互情報量を(9)式に従って計算したものである。 相互情報量をもとに推薦単語リストのスコアを算出したものである。 第3実施形態に係るサーバで行われる処理の流れの一例を示すフローチャートである。 クエリに「料理」を追加した際の推薦単語候補とその単語をクエリに追加した時にヒットする文書数を示している。 「ダミー単語」を用意した例を示す図である。 「重複」、「偏り」、「損失」に対応したGUIの一例を示す図である。 「重複」、「偏り」、「損失」に対応したGUIを用いてクエリへの単語の追加を行う例を説明するための図である。 単語と文書の真偽テーブルを用いたGUIの一例を示す図である。
以下、図面を参照して本実施形態の一例を詳細に説明する。本実施形態では、複数の情報処理装置、及びサーバが各種ネットワーク等の通信回線を介して各々接続された情報処理システムを検索システムの一例として説明する。図1は、本実施形態に係る情報処理システム10の概略構成を示す図である。
本実施形態に係る情報処理システム10は、図1に示すように、複数の情報処理端末14a、14b、・・・と、検索装置としてのサーバ16とを備えている。なお、情報処理端末14a、14b・・・を区別して説明する必要がない場合は、符号末尾のアルファベットを省略して記載することがある。また、本実施形態では、複数の情報処理端末14a、14b、・・・を備える例を説明するが、情報処理端末14は1つでもよい。
各情報処理端末14及びサーバ16は、LAN(Local Area Network)、WAN(Wide Area Network)、インターネット、イントラネット等の通信回線12を介して各々接続されている。そして、情報処理端末14及びサーバの各々は、通信回線12を介して各種データの送受信を相互に行うことが可能とされている。
本実施形態に係る情報処理システム10は、サーバ16が、クラウドサービスとして文書を管理する文書管理サービスを提供する。文書管理サービスは、例えば、情報処理端末14からサーバ16にアクセスすることにより、サーバ16に情報としての各種文書を格納したり、サーバ16に格納された管理対象の文書の閲覧等が可能とされている。
続いて、本実施形態に係る情報処理端末14及びサーバ16の電気系の要部構成について説明する。図2は、本実施形態に係る情報処理システム10における情報処理端末14及びサーバ16の電気系の要部構成を示すブロック図である。なお、情報処理端末14及びサーバ16は基本的には一般的なコンピュータの構成とされているので、情報処理端末14を代表して説明する。
本実施の形態に係る情報処理端末14は、図2に示すように、CPU14A、ROM14B、RAM14C、HDD14D、キーボード14E、ディスプレイ14F、及び通信回線IF(インタフェース)部14Gを備えている。CPU14Aは、情報処理端末14の全体の動作を司る。ROM14Bは、各種制御プログラムや各種パラメータ等が予め記憶される。RAM14Cは、CPU14Aによる各種プログラムの実行時のワークエリア等として用いられる。HDD14Dは、各種のデータやアプリケーション・プログラム等が記憶される。キーボード14Eは各種の情報を入力するために用いられる。ディスプレイ14Fは、各種の情報を表示するために用いられる。通信回線IF部14Gは、通信回線12に接続され、当該通信回線12に接続された他の装置と各種データの送受信を行う。以上の情報処理端末14の各部はシステムバス14Hにより電気的に相互に接続されている。なお、本実施の形態に係る情報処理端末14では、HDD14Dを記憶部として適用しているが、これに限らず、フラッシュメモリ等の他の不揮発性の記憶部を適用してもよい。
以上の構成により、本実施の形態に係る情報処理端末14は、CPU14Aにより、ROM14B、RAM14C、及びHDD14Dに対するアクセス、キーボード14Eを介した各種データの取得、ディスプレイ14Fに対する各種情報の表示を各々実行する。また、情報処理端末14は、CPU14Aにより、通信回線IF部14Gを介した通信データの送受信の制御を実行する。
このように構成された本実施形態に係る情報処理システム10では、上述したように、サーバ16が、クラウドサービスとして文書を管理する文書管理サービスを提供する。例えば、情報処理端末14に格納された情報を管理対象の文書としてサーバ16に移行することで、サーバ16によって文書の管理が行われ、情報処理端末14を操作することで、サーバ16に格納された文書へのアクセスが可能とされている。
(第1実施形態)
続いて、第1実施形態に係るサーバ16の機能的構成について説明する。図3は、第1実施形態に係るサーバ16の機能ブロック図である。
本実施形態では、情報処理端末14からサーバ16が提供する文書管理サービスに格納された文書情報を検索する際に、情報処理端末14によって入力された単語に対応する単語リストをサーバ16が利用者に推薦して検索を支援する機能を備えている。すなわち、情報処理端末14によってクエリとして文字を入力すると、サーバ16が入力中の文字または文字列に対応する単語リストを情報処理端末14に推薦する。例えば、図4に示すように、クエリに「料理」を追加した場合に、「料理」に対応する推薦単語リスト候補として、「日本」、「イタリア」、「フランス」、「中華」、「美味しい」、「簡単」を推薦する。なお、以下の説明では、文書を検索するためにクエリに入力する単語を検索単語と称する。また、クエリに入力された検索単語に関係する単語を推薦単語と称する。
サーバ16は、図3に示すように、文書DB(データベース)22、単語DB(データベース)24、受付部としてのクエリ受付部18、検索部20、スコア算出部26、導出部としての推薦単語リスト算出部28、及び単語選択部30の機能を備えている。
文書DB22には、サーバ16に予め登録された文書情報が格納されており、情報処理端末14から文書の登録及び閲覧が可能とされている。
単語DB24には、文書DB22に文書が登録された際に、文書内の単語が抽出されて文書と関連付けて登録される。
クエリ受付部18は、情報処理端末14を利用者が操作して、文書を検索するための単語を入力した場合に、入力された単語を検索単語として情報処理端末14から取得して受け付ける。また、クエリ受付部18は、単語DB24を参照して、受け付けた単語を検索し、検索結果をスコア算出部26に出力する。
検索部20は、クエリ受付部18が受け付けた単語を参照し、条件に一致する検索対象の文書リストを作成し、スコア算出部26に出力する。すなわち、クエリ受付部18が受け付けた単語を含む文書リストを文書DB22から検索し、検索した文書リストをスコア算出部26に出力する。
スコア算出部26は、文書DB22と単語DB24の対応関係を用いて、単語同士の関係を表すスコアを計算する。
推薦単語リスト算出部28は、スコア算出部26によって算出されたスコアが最小となる任意個の単語を推薦単語リストとして算出する。本実施形態では、推薦単語リスト算出部28は、クエリ受付部18が受け付けた検索単語から得た検索結果を絞り込む推薦単語を複数出力する場合に、「重複」及び「偏り」の少なくとも一方が、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出する。
単語選択部30は、推薦単語リスト算出部28が算出した推薦単語リストの中から、利用者が選択した単語をクエリに検索単語として追加する。
続いて、スコア算出部26によるスコアの算出と、推薦単語リスト算出部28による推薦端とリストの算出について詳細に説明する。
本実施形態では、絞り込みを単語ではなく推薦単語リストで行う。つまり、推薦単語同士の関係を考慮する。本実施形態では、推薦単語リストをクエリに追加した場合の検索結果の「重複」、「偏り」、「損失」をスコアリングする。なお、「重複」とは、各単語をクエリに追加した際に、絞り込みの結果が重複することである。また、「偏り」とは、各単語をクエリに追加した際に、絞り込んだ文書数に差が生じることである。また、「損失」とは、推薦単語リストの中のどの単語をクエリに追加しても、検索にヒットしない文書が生じることである。
「重複」をスコアリングする方法としては、例えば、Jaccard係数やDice係数、Simpson係数などの集合同士の類似度スコアを利用する方法がある。具体的には、ある単語wiを追加したことにより検索にヒットする文書の集合をriとし、ある単語wjを追加したことにより検索にヒットする文書の集合をrjとすると、そのJaccard係数Jijは、以下の(1)式で表すことができる。
つまり、推薦単語リスト算出部28は、推薦単語リストのJaccard係数の総和Jが最小となる単語リストを選択すればよい。Jaccard係数の総和Jは、以下の(2)式で表される。
また、「偏り」をスコアリングする方法としては、例えば、推薦単語のクエリに追加することで得られる文書数の差を利用する方法がある。具体的には、ある単語wiを追加したことにより検索にヒットする文書数をriとし、ある単語wjを追加したことにより検索にヒットする文書数をrjとすると、その差を用いて「偏り」のスコアDijは、以下の(3)式で表すことができる。
つまり、推薦単語リスト算出部28は、推薦単語リストの差の絶対値の総和Dが最小となる単語リストを選択すればよい。総和Dは、以下の(4)式で表される。
また、「重複」と「偏り」を同時にスコアリングする方法としては、例えば、推薦単語リストの中の単語が選択される確率と、絞り込みタイプ(and検索、not検索)の確率の相互情報量を利用する方法がある。ある単語wiを追加したことにより検索にヒットする文書数をriとし、ある単語wjを追加したことにより検索にヒットする文書数rjとし、riとrjの和集合をrijとすると、相互情報量Iijは、和集合rijから任意の文書を選択する確率p(rijのエントロピーH(p(rij))と、絞り込みタイプの確率p(t)の元での確率p(rij)のエントロピーH(p(rij|r))の差から求まる。
図5、6は、相互情報量の「重複」と「偏り」との関係を模式的に表したもので、「重複」が小さいと相互情報量は小さくなり、「偏り」が小さいと相互情報量は小さくなる。相互情報量Iijは、「単語wiによる絞り込み」と「単語wjによる絞り込み」の「重複」、「偏り」に対応している。つまり、推薦単語リスト算出部28は、推薦単語リストの相互情報量の総和Iが最小になるような単語リストを選択すればよい。相互情報量の総和Iは、以下の(7)式で表される。
続いて、本実施形態に係るサーバ16で行われる具体的な処理について説明する。図7は、本実施形態に係るサーバ16で行われる処理の流れの一例を示すフローチャートである。なお、図7の処理は、情報処理端末14が利用者によって操作されてクエリに単語が入力された場合に開始するものとする。
ステップ100では、クエリ受付部18は、情報処理端末14によってクエリに入力された単語を受け付けてステップ102へ移行する。
ステップ102では、クエリ受付部18が、単語DB24を参照して、受け付けた単語を検索してステップ104へ移行する。
ステップ104では、検索部20が、クエリ受付部18が受け付けた単語を含む文書を文書DB22から検索してステップ106へ移行する。
ステップ106では、スコア算出部26が、文書DB22と単語DB24の対応関係を用いて、単語同士の関係を表すスコアを計算してステップ108へ移行する。スコアの算出は、上述したように、「重複」をスコアリングする方法を用いてもよいし、「偏り」をスコアリングする方法を用いてもよいし、「重複」と「偏り」を同時にスコアリングする方法を用いてもよい。
ステップ108では、推薦単語リスト算出部28が、スコア算出部26によって算出されたスコアが最小となる任意個の単語を推薦単語リストとして算出して利用者に提示してステップ110へ移行する。
ステップ110では、単語選択部30が、推薦単語リスト算出部28が算出した推薦単語リストの中から、利用者が選択した単語をクエリに検索単語として追加する指示が行われたか否かを判定する。該判定が肯定された場合には、指示された単語をクエリに追加してステップ100に戻って上述の処理を繰り返す。判定が否定された場合にはステップ112へ移行する。
ステップ112では、単語選択部30が、単語の選択が行われずに、文書の検索が指示されたか否かを判定する。該判定が肯定された場合にはステップ114へ移行する。一方、クエリに入力された単語がリセットされて他の単語がクエリに入力されたり、他の処理が指示された場合には判定が否定されて一連の処理を終了する。
ステップ114では、CPU16Aが、クエリに入力された単語を含む文書を文書DB22から検索して情報処理端末14に提示して一連の処理を終了する。
(第2実施形態)
続いて、第2実施形態に係るサーバ16の機能的構成について説明する。図8は、本実施形態に係るサーバ16の機能ブロック図である。なお、上記実施形態と同一構成については同一符号を付して詳細な説明は省略する。
上記の実施形態では、スコア算出部26がスコアを計算する際に、計算量の問題が生じる。例えば、単語DB24に登録されている単語がW個とし、その中から単語N個を選択して推薦単語リストとする場合、その組み合わせはWNとなり、単語数が多い場合には現実的な時間での計算が不可能になる。
そこで、本実施形態では、図8に示すように、限定部としての推薦候補単語算出部32の機能を更に備えて、入力クエリに基づいて単語DB24からスコアの計算に使用する推薦単語候補の数を限定する。
推薦単語候補を限定する技術としては、例えば、word embed(word2vec(Mikolov, T., Chen, K., Corrado, G., & Dean, J. (2013). Efficient estimation of word representations in vector space. arXiv preprint arXiv:1301.3781.)や、fasttext(Joulin, A., Grave, E., Bojanowski, P., & Mikolov, T. (2016). Bag of tricks for efficient text classification. arXiv preprint arXiv:1607.01759.)など)空間上の近傍単語を利用してもよい。或いは、知識グラフ(オントロジー)上の近傍単語を利用してもよい。
図9は、本実施形態に係るサーバ16で行われる処理の流れの一例を示すフローチャートである。なお、図7と同一の処理については同一符号を付して詳細な説明は省略する。
図9に示すように、図7に対してステップ103を追加し、ステップ103において、推薦候補単語算出部32が、推薦単語候補を算出することで、単語を限定してスコア計算を行うことで、計算量が削減され、利用者に対して高速に単語リストが推薦される。
(第3実施形態)
続いて、第3実施形態に係るサーバ16の機能的構成について説明する。図10は、本実施形態に係るサーバ16の機能ブロック図である。なお、上記の各実施形態と同一構成については同一符号を付して詳細な説明は省略する。
本実施形態に係るサーバ16は、第2実施形態に対して、検索結果表示部34、及びテーブル作成部36の機能を更に備えている。
検索結果表示部34は、検索部20による文書DB22の検索結果を利用者が操作する情報処理端末14に対して表示する処理を行う。
テーブル作成部36は、推薦候補単語算出部32によって算出された推薦単語候補と、検索部20によって検索された文書との対応テーブルを作成する。図11は、対応テーブルの一例を示す図である。
図11の例では、簡単のために、単語DB24の登録単語Wと、文書DB22の登録文書Dを以下のように定義する。
W={w1、w2、w3、w4、w5}、D={D1、D2、D3、D4、D5} ・・・(8)
この定義した登録単語と対象文書をもとに、スコア算出部26によるスコア算出と、推薦単語リスト算出部28による推薦単語リスト算出とを行う。
図11中の「T]は、単語wが文書dに対応すること、すなわち、検索にヒットすることを表しており、「F」は単語wが文書dに対応しないこと、すなわち、検索にヒットしないことを表している。
図12は、図11の対応テーブルをもとにスコアとして相互情報量を以下の(9)式に従って計算したものである。
ここで、Δrは微少量であり、rjがriの部分集合である場合に、rij-ri=0となり、0で除算することによる計算不可が生じるのを防ぐためのものである。ここでは、Δr=1.0×10-5として計算を行った。相互情報量は非対称であるため、基準が異なれば組み合わせが同じであってもスコアが異なる(例えば、w1、w3と、w3、w1とでは、スコアは異なる)
図13は、図12の結果をもとに推薦単語リスト(図13の例では2単語)のスコアを算出したものである。図13の例では、w1、w2のスコアが最小となり、推薦単語リストとなる。図11のw1、w2を見ると、「T」の「重複」及び「偏り」が小さいリストとなっている。例えば、w4、w5は、「偏り」はあるが、「重複」はないペアであるが、相互情報量は0.80と他に比べて大きくなっている。また、w2、w3のペアは「重複」があり、「偏り」はないが、w1、w2のペアと比較すると相互情報量が大きくなっている。こられの結果からも、相互情報量が「重複」と「偏り」を同時にスコアリングしていることがわかる。
今回の例では、登録単語は5であり、2単語を選択する組み合わせ52=10通りとなるが、登録単語数と選択する単語の数の増加に伴って、推薦単語リストを作成する際に組み合わせの増加が生じる。そのため、リスト算出に使用する登録単語を制限する等のフィルタリングが必要となる。
図14は、本実施形態に係るサーバ16で行われる処理の流れの一例を示すフローチャートである。なお、図9と同一の処理については同一符号を付して詳細な説明は省略する。
本実施形態では、図14に示すように、ステップ104において、検索部20が、クエリ受付部18が受け付けた単語を含む文書を文書DB22から検索した後にステップ105Aへ移行する。
ステップ105Aでは、検索結果表示部34が、検索部20の検索結果を利用者が操作する情報処理端末14に表示する処理を行ってステップ105Bへ移行する。
そして、ステップ105Bでは、テーブル作成部36が、推薦候補単語算出部32によって算出された推薦単語候補と、検索部20によって検索された文書との対応テーブルを作成する。そして、上述のステップ106へ移行して、スコア算出部26が、作成された対応テーブルを用いて、単語同士の関係を表すスコアを計算する。
なお、上記の各実施形態において、スコア算出部26は、「重複」、「偏り」、「損失」の計算を分けて行うことが可能である。例えば、相互情報量は、「重複」と「偏り」は定量化できるが、「損失」は定量化できない。そこで、損失を先にスコアリングし、そのデータを元に相互情報量を計算することにより、「重複」、「偏り」、「損失」を考慮する。これにより、「重複」、「偏り」、「損失」が様々な計算で表現され、対象に応じてスコアリング方法を変更できるだけでなく、それぞれの計算段階で閾値を設けることで、計算量を削減するためのフィルタリングとして利用できる。具体的には、相互情報量では、「損失」を定量化できないため、「損失」を抑制するために、単語をクエリに追加することでヒットする文書の数に下限(以下、「必要単語数」という。)を設けて文書数を制限し、単語をフィルタリングする。推薦単語Wnと文書数Dから、必要文書数Dnを決定し、その条件を満たす単語をスコア算出部26がスコアを算出する際にテーブルから選択し、相互情報量の計算を行うことで「損失」に対応する。なお、この場合のスコア算出部26は制限部に対応する。
文書の数に下限を設けてフィルタリングする例を具体的に説明する。図15は、クエリに「料理」を追加した際の推薦単語候補とその単語をクエリに追加した時にヒットする文書数を示している。クエリに「料理」を追加した場合のヒットする文書数R=200、推薦単語数Wn=5とする。必要文書数Dnを以下の(10)式のように定義する。なお、必要文書数Dnは、重複が0と仮定した時の損失を0にするための1単語あたりのヒット数とする。
n=R/Wn ・・・(10)
文書数R=200、推薦単語数Wn=5の場合、必要文書数Dn=40となり、図15の例では、「時短」、「エジプト」、「激辛」は相互情報量の計算から除外される。
また、上記の各実施形態において、スコア算出部26が相互情報量を用いてスコアリングする場合に、「ダミー単語」を用いることにより「損失」を抑制してもよい。相互情報量では「損失」を定量化できないので、「検索結果が理想的な文書数であり、かつ他の単語と検索結果が重複しない単語」を、図16に示すように、「ダミー単語」として用意する。「ダミー単語」は他の単語との「重複」がないため、「偏り」だけで相互情報量が計算できる。つまり、「ダミー単語」を用いることで、「損失」が抑制される。
また、上記の各実施形態は、「重複」、「偏り」、「損失」に対応したGUI(Graphical User Interface)をサーバ16が提供してもよい。すなわち、推薦単語リストからクエリに追加した場合の「重複」、「偏り」、「損失」を明示的に表示してもよい。具体的には、上述のステップ108において、推薦単語リスト算出部28が推薦単語リストを算出して利用者に提示する際に、図17に示すような画面50をGUIとして利用者に提示してもよい。なお、この場合の推薦単語リスト算出部28は表示部に対応する。
図17において、絞り込む前のクエリ(「料理」)の文書数は矩形の最外領域で表し、推薦単語リストの単語をクエリに追加した場合の文書量は、その単語の書かれた領域で表す。また、推薦単語リストの単語をクエリに追加した場合の「重複」は、それぞれの領域の重複部分の大きさで表す。また、推薦単語リストの単語をクエリに追加した場合の「偏り」は、それぞれの領域の差で表す。また、推薦単語リストの単語をクエリに追加した場合の「損失」は、領域が存在しない部分の大きさで表す。または、「損失」の領域として明示的に示す。
「重複」、「偏り」、「損失」を明示的に表示することで、利用者は単語同士の関係を直接目視で確認できるため理解が容易となる。また、単語を選択することにより全体からどの程度絞り込めたかが確認し易く効率的となる。
また、上記の各実施形態は、「重複」、「偏り」、「損失」に対応したGUIを用いてクエリへの単語の追加を行ってもよい。例えば、利用者が情報処理端末14を操作して、図18に示す画面52の各領域を指定する操作を行うことで、操作された領域に対応する単語をクエリに追加することが可能なGUIを推薦単語リスト算出部28が提供してもよい。例えば、図18に示す画面52の重複領域を指定する操作を行った場合には、「重複」を構成する複数単語をまとめてクエリに追加する。GUIによる単語追加を可能とすることで、利用者は単語同士の関係を確認しながらクエリを選択できるため、絞り込みが効率的となる。なお、この場合の推薦単語リスト算出部28は追加部に対応する。
また、GUIとしては、単語と文書の真偽テーブルを用いたGUIを適用してもよい。具体的には、図19のような縦軸に単語、横軸に文書をとるような真理値テーブルとしたGUIを適用する。単語と文書が対応する場合には「真」としてセルを埋めて「白」とし、対応しない場合には「偽」としてセルを埋めずに「黒」とする。このような真偽テーブルを作成することで、単語と文書の対応関係が明示的に表現される。
また、IRM(Infinite Relational Model(Charles, K., Joshua, T., Thomas, G., Takeshi, Y., & Naonori, U. (2006). Learning Systems of Concepts with an Infinite Relational Model. AAAI))のような技術を利用することで、テーブルのクラスタリングが可能となり、単語同士の関係、及び文書同士の関係の理解が容易となる。
また、上記の実施形態に係るサーバ16で行われる処理は、ソフトウエアで行われる処理としてもよいし、ハードウエアで行われる処理としてもよいし、双方を組み合わせた処理としてもよい。また、サーバ16で行われる処理は、プログラムとして記憶媒体に記憶して流通させるようにしてもよい。
また、本発明は、上記に限定されるものでなく、上記以外にも、その主旨を逸脱しない範囲内において種々変形して実施可能であることは勿論である。
10 情報処理システム
12 通信回線
14 情報処理端末
16 サーバ
18 クエリ受付部
20 検索部
22 文書DB
24 単語DB
26 スコア算出部
28 推薦単語リスト算出部
30 単語選択部
32 推薦候補単語算出部
36 テーブル作成部
50、52 画面

Claims (14)

  1. 検索単語を受け付ける受付部と、
    前記受付部が受け付けた前記検索単語から得た検索結果を絞り込む推薦単語を複数出力する場合に、複数の前記推薦単語の各単語をクエリに追加した際に絞り込みの結果が重複すること、及び前記各単語をクエリに追加した際に絞り込んだ数に差が生じることの少なくとも一方が、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出する導出部と、
    を含み、
    前記導出部は、予め記憶された複数の文書から前記受付部が受け付けた前記検索単語を含む文書を抽出して得た文書リストと、予め記憶された複数の単語との対応関係を用いて、単語同士の関係を求め、求めた単語同士の関係から任意個の推薦単語を導出する検索装置。
  2. 前記導出部は、前記単語同士の関係として、推薦する単語が選択される確率と絞り込みタイプの確率の相互情報量を求め、前記相互情報量が最小または予め定めた閾値以下になるような任意個の推薦単語を導出する請求項1に記載の検索装置。
  3. 前記受付部が受け付けた前記検索単語を用いて、前記単語同士の関係を求める際に用いる前記複数の単語の数を限定する限定部を更に含む請求項1又は請求項2に記載の検索装置。
  4. 前記文書リストの必要文書数を制限する制限部を更に含み、
    前記導出部は、前記制限部により制限された文書数の中から前記受付部が受け付けた前記検索単語を含む文書リストを抽出して抽出した前記文書リストと、予め記憶された複数の単語との対応関係を用いて、単語同士の関係を求めて任意個の推薦単語を導出する請求項1~3の何れか1項に記載の検索装置。
  5. 前記制限部は、文書数と予め定めた推薦単語数を用いて前記必要文書数を決定する請求項4に記載の検索装置。
  6. 前記導出部は、複数の前記推薦単語の各単語をクエリに追加した際に絞り込みの結果が重複することが、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出する場合、Jaccard係数、Dice係数、または、Simpson係数を用いて任意個の推薦単語を導出する請求項1~5の何れか1項に記載の検索装置。
  7. 検索単語を受け付ける受付部と、
    前記受付部が受け付けた前記検索単語から得た検索結果を絞り込む推薦単語を複数出力する場合に、複数の前記推薦単語の各単語をクエリに追加した際に絞り込みの結果が重複すること、及び前記各単語をクエリに追加した際に絞り込んだ数に差が生じることの少なくとも一方が、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出する導出部と、
    を含み、
    前記導出部は、前記各単語をクエリに追加した際に絞り込んだ数に差が生じることが、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出する場合、推薦単語をクエリに追加することで得られる文書数の差を利用して任意個の推薦単語を導出する検索装置。
  8. 前記導出部は、前記各単語をクエリに追加した際に絞り込んだ数に差が生じることが、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出する場合、推薦単語をクエリに追加することで得られる文書数の差を利用して任意個の推薦単語を導出する請求項1~の何れか1項に記載の検索装置。
  9. 前記導出部は、検索結果が予め定めた理想的な文書数で、かつ他の単語と検索結果が重複しない仮想的に定めたダミー単語を用いて前記推薦単語を導出する請求項に記載の検索装置。
  10. 検索単語を受け付ける受付部と、
    前記受付部が受け付けた前記検索単語から得た検索結果を絞り込む推薦単語を複数出力する場合に、複数の前記推薦単語の各単語をクエリに追加した際に絞り込みの結果が重複すること、及び前記各単語をクエリに追加した際に絞り込んだ数に差が生じることの少なくとも一方が、他の単語の組み合わせで絞り込むよりも少なくなるような任意個の推薦単語を導出する導出部と、
    絞り込む前のクエリの文書数、任意個の推薦単語の何れかの単語をクエリに追加した場合の文書量、任意個の推薦単語の何れかの単語をクエリに追加した場合の重複、任意個の推薦単語の何れかの単語をクエリに追加した場合の偏り、及び任意個の推薦単語の何れかの単語をクエリに追加した場合の損失のそれぞれを領域として表示する表示部と、
    を含む検索装置。
  11. 絞り込む前のクエリの文書数、任意個の推薦単語の何れかの単語をクエリに追加した場合の文書量、任意個の推薦単語の何れかの単語をクエリに追加した場合の重複、任意個の推薦単語の何れかの単語をクエリに追加した場合の偏り、及び任意個の推薦単語の何れかの単語をクエリに追加した場合の損失のそれぞれを領域として表示する表示部を更に含む請求項1~9の何れか1項に記載の検索装置。
  12. 前記表示部は、前記領域を選択することにより領域に対応する単語をクエリに追加する追加部を更に含む請求項11に記載の検索装置
  13. 請求項1~12の何れか1項に記載の検索装置と、
    前記受付部が受け付ける単語を入力し、前記導出部の導出結果を表示する情報処理端末と、
    を含む検索システム
  14. コンピュータを、請求項1~12の何れか1項に記載の検索装置として機能させるための検索プログラム
JP2019117923A 2019-06-25 2019-06-25 検索装置、検索システム、及び検索プログラム Active JP7326920B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019117923A JP7326920B2 (ja) 2019-06-25 2019-06-25 検索装置、検索システム、及び検索プログラム
US16/658,234 US20200410007A1 (en) 2019-06-25 2019-10-21 Search apparatus, search system, and non-transitory computer readable medium
CN201911241146.4A CN112131355A (zh) 2019-06-25 2019-12-06 搜索装置、搜索系统、非暂时性计算机可读介质和搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019117923A JP7326920B2 (ja) 2019-06-25 2019-06-25 検索装置、検索システム、及び検索プログラム

Publications (2)

Publication Number Publication Date
JP2021005179A JP2021005179A (ja) 2021-01-14
JP7326920B2 true JP7326920B2 (ja) 2023-08-16

Family

ID=73849941

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019117923A Active JP7326920B2 (ja) 2019-06-25 2019-06-25 検索装置、検索システム、及び検索プログラム

Country Status (3)

Country Link
US (1) US20200410007A1 (ja)
JP (1) JP7326920B2 (ja)
CN (1) CN112131355A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014235664A (ja) 2013-06-04 2014-12-15 富士通株式会社 情報検索装置および情報検索方法
US20180247271A1 (en) 2017-02-28 2018-08-30 Linkedln Corporation Value of content relevance through search engine optimization

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014235664A (ja) 2013-06-04 2014-12-15 富士通株式会社 情報検索装置および情報検索方法
US20180247271A1 (en) 2017-02-28 2018-08-30 Linkedln Corporation Value of content relevance through search engine optimization

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
戸田 浩之,特徴的な固有表現を用いたラベル指向ナビゲーション手法の提案,情報処理学会研究報告 Vol.2004 No.45 IPSJ SIG Technical Reports,社団法人情報処理学会,2004年05月14日,第2004巻,第45号,pp.99-106

Also Published As

Publication number Publication date
CN112131355A (zh) 2020-12-25
US20200410007A1 (en) 2020-12-31
JP2021005179A (ja) 2021-01-14

Similar Documents

Publication Publication Date Title
US11782915B2 (en) Searchable index
JP6680763B2 (ja) 結果文書セットに関する推定関連性指示子を表示するため及びクエリ可視化を表示するためのシステム及び方法
AU2005201890B2 (en) Query to task mapping
US7788261B2 (en) Interactive web information retrieval using graphical word indicators
US20160283560A1 (en) Query disambiguation
US10402490B1 (en) Edit distance based spellcheck
JP2020027649A (ja) エンティティ関係データ生成方法、装置、機器、及び記憶媒体
US8983965B2 (en) Document rating calculation system, document rating calculation method and program
JP2019505057A (ja) 概念スタックを含むグラフィカルユーザインターフェイスを用いてデータベースを検索するためのシステム及び方法
EP3513328A1 (en) Method and apparatus for ranking electronic information by similarity association
KR20150032586A (ko) 소셜-그래프 정보에 기반한 구조화된 검색 질의
CN109241243B (zh) 候选文档排序方法及装置
US10942973B2 (en) Automatically generating and evaluating candidate terms for trademark clearance
CN113204621B (zh) 文档入库、文档检索方法,装置,设备以及存储介质
US20180322166A1 (en) System and method of extracting data from structured and unstructured sources of data using automated joins
US9690858B1 (en) Predicting categorized completions of a partial search term
JP5980520B2 (ja) 効率的にクエリを処理する方法及び装置
JP2011203776A (ja) 類似画像検索装置、方法及びプログラム
KR101505673B1 (ko) 단어의 의미를 기반으로 하는 다국어 검색 시스템, 다국어 검색 방법 및 이를 이용한 이미지 검색 시스템
JP7326920B2 (ja) 検索装置、検索システム、及び検索プログラム
US20230214441A1 (en) Dual search system
US20230334244A1 (en) Fact correction of natural language sentences using data tables
TW201430594A (zh) 用於非正規語彙網路文章之檢索方法
JP2018101283A (ja) Webページを構成する成分キーワードの評価プログラム
KR20150027841A (ko) 온라인 소셜 네트워크에 대한 개인 맞춤형 구조화된 검색 질의

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220228

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230425

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230704

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230717

R150 Certificate of patent or registration of utility model

Ref document number: 7326920

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150