JP7243196B2 - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP7243196B2
JP7243196B2 JP2019003505A JP2019003505A JP7243196B2 JP 7243196 B2 JP7243196 B2 JP 7243196B2 JP 2019003505 A JP2019003505 A JP 2019003505A JP 2019003505 A JP2019003505 A JP 2019003505A JP 7243196 B2 JP7243196 B2 JP 7243196B2
Authority
JP
Japan
Prior art keywords
search
words
user
word
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019003505A
Other languages
English (en)
Other versions
JP2020113046A (ja
Inventor
信嗣 島村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2019003505A priority Critical patent/JP7243196B2/ja
Publication of JP2020113046A publication Critical patent/JP2020113046A/ja
Application granted granted Critical
Publication of JP7243196B2 publication Critical patent/JP7243196B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理装置及びプログラムに関する。
所望の情報(コンテンツ)を検索により取得したい場合、ユーザは、その情報と関連性が高いと考える検索キーワードを検索条件に指定して検索を実行する。もし、検索結果に所望の情報が含まれていない場合、あるいは検索結果に所望の情報が含まれていたとしても検索結果が多すぎて見つけられない場合、検索条件に指定する検索キーワードを代えたり、追加したりして検索を再度試みる。
特開2005-010880号公報 特開2005-182280号公報
再度検索する際に指定する語句として適切な語句が指定できないと、ユーザは、結果として所望する情報を見つけ出すことができない可能性が生じてくる。
本発明は、検索条件に含まれる複数の語句に基づく検索結果の中から複数の語句と関連性の高い検索結果が見つけにくい場合に再度検索させる際の語句を提示することを目的とする。
本発明に係る情報処理装置は、ユーザにより指定された検索条件に含まれる複数の語句に基づき検索を実行する実行手段と、前記実行手段による検索結果と前記検索条件に含まれる複数の語句との関連性を示す指標値が所定の閾値に満たない場合、前記検索条件に含まれる複数の語句をユーザに選択可能に表示させると共に、当該複数の語句の中からユーザによりいずれかの語句が選択されると、複数の語句を意味的な関係性で関連付けることにより構造化された知識情報に設定されている当該選択された語句の下位層に位置する語句を、当該選択された語句と差し替える検索語句候補として表示させるよう制御する表示制御手段と、を有することを特徴とする。
また、前記表示制御手段は、前記実行手段による検索結果と前記検索条件に含まれる複数の語句との関連性を示す指標値が所定の閾値を満たす場合であっても、前記実行手段による検索結果に、前記検索条件に含まれる複数の語句それぞれに基づく検索結果数に所定の条件に合致する偏りがある場合には、前記検索条件に含まれる複数の語句をユーザに選択可能に表示させるよう制御することを特徴とする。
また、前記所定の条件は、前記検索条件に含まれる複数の語句それぞれに基づく検索結果数の最大値と最小値に所定の差異がある場合であることを特徴とする。
また、前記所定の条件は、前記検索条件に含まれる複数の語句それぞれに基づく検索結果数の最小値が所定の閾値に満たない場合であることを特徴とする。
また、前記表示制御手段は、前記選択された語句から所定階層数下位に位置する語句までを検索語句候補として表示させるよう制御することを特徴とする。
また、前記表示制御手段は、前記検索語句候補として表示される語句に基づく検索結果数に対する、当該検索語句候補として表示される語句及び前記検索条件に含まれる複数の語句の中からユーザにより選択された語句以外の語句の全てに基づく検索結果数を合致率として、当該検索語句候補に関連付けて表示させることを特徴とする。
また、前記実行手段は、表示されている前記検索語句候補の中からユーザにより選択された語句で前記選択された語句を差し替えてから検索を再度実行することを特徴とする。
また、前記実行手段は、表示されている前記検索条件に含まれる複数の語句の中からユーザにより選択された語句を検索条件から削除して検索を再度実行することを特徴とする。
また、前記表示制御手段は、前記実行手段による検索結果数が所定の閾値に満たない場合、前記検索条件に含まれる複数の語句をユーザに選択可能に表示させると共に、当該複数の語句の中からユーザによりいずれかの語句が選択されると、前記知識情報に設定されている当該選択された語句の上位層に位置する語句を、当該選択された語句に差し替える検索語句候補として表示させるよう制御することを特徴とする。
本発明に係るプログラムは、コンピュータを、ユーザにより指定された検索条件に含まれる複数の語句に基づき検索を実行する実行手段、前記実行手段による検索結果と前記検索条件に含まれる複数の語句との関連性を示す指標値が所定の閾値に満たない場合、前記検索条件に含まれる複数の語句をユーザに選択可能に表示させると共に、当該複数の語句の中からユーザによりいずれかの語句が選択されると、複数の語句を意味的な関係性で関連付けることにより構造化された知識情報に設定されている当該選択された語句の下位層に位置する語句を、当該選択された語句と差し替える検索語句候補として表示させるよう制御する表示制御手段、として機能させる。
請求項1に記載の発明によれば、検索条件に含まれる複数の語句に基づく検索結果の中から複数の語句と関連性の高い検索結果が見つけにくい場合に再度検索させる際の語句を提示することができる。
請求項2に記載の発明によれば、検索条件に含まれるいずれかの語句に対する偏りの少ない検索結果がより表示されやすくする。
請求項3に記載の発明によれば、検索条件に含まれる複数の語句の検索結果数に偏りがある場合に異なる語句を検索語句候補として表示させることができる。
請求項4に記載の発明によれば、検索条件に含まれる複数の語句の中に検索結果数の少ない語句が含まれる場合に異なる語句を検索語句候補として表示させることができる。
請求項5に記載の発明によれば、選択された語句の直下の語句と限定することなく所定階層数下位に位置する語句までまとめて表示させることができる。
請求項6に記載の発明によれば、検索語句候補の中から絞込検索に用いる語句をユーザに選定させる際の指標として合致率を提示することができる。
請求項7に記載の発明によれば、ユーザにより選択された語句に基づき検索を実行する。
請求項8に記載の発明によれば、検索結果数を減らすことが可能となる。
請求項9に記載の発明によれば、検索結果数を所定の閾値以上に増やすことが可能となる。
請求項10に記載の発明によれば、検索条件に含まれる複数の語句に基づく検索結果の中から複数の語句と関連性の高い検索結果が見つけにくい場合に再度検索させる際の語句を提示することができる。
本発明に係る情報処理装置の一実施の形態を示したブロック構成図である。 本実施の形態における語句関連情報記憶部に設定登録される語句関連情報に含まれる各語句の関係性を模式的に示す図である。 本実施の形態における表示制御部が表示対象とする検索サービス画面の概略的な画面構成の一例を示す図である。 本実施の形態において利用する関連度の概念を説明するための図である。 本実施の形態において検索語句をユーザに変更させる際に検索語句設定領域に表示される検索語句の表示例を示す図である。 本実施の形態において検索語句をユーザに設定させる際に検索語句設定領域に表示される語句の表示例を示す図である。 本実施の形態において検索語句をユーザに設定させる際に検索語句設定領域に表示される語句の他の表示例を示す図である。 本実施の形態において検索語句をユーザに削除させる際に検索語句設定領域に表示される語句の他の表示例を示す図である。 本実施の形態において検索語句をユーザに設定させる際に検索語句設定領域に表示される語句の他の表示例を示す図である。
以下、図面に基づいて、本発明の好適な実施の形態について説明する。
本実施の形態における情報処理装置は、パーソナルコンピュータ(PC)等の従前から存在する汎用的なハードウェア構成で実現できる。すなわち、情報処理装置は、CPU、ROM、RAM、ハードディスクドライブ(HDD)等の記憶手段、ユーザインタフェースを内部バスに接続して構成される。ユーザインタフェースとしては、マウスやキーボード等の入力手段、ディスプレイ等の表示手段で構成される。もちろん、タッチパネル等入力手段と表示手段を兼用するユーザインタフェースで構成してもよい。
また、記憶手段は、情報処理装置に内蔵された構成要素に限定する必要はなく、LAN(Local Area Network)やインターネット等のネットワークに接続された他の装置に設けられていてもよい。この場合、接続するネットワークに適合するネットワークインタフェースを内部バスに接続することになる。
図1は、本発明に係る情報処理装置の一実施の形態を示したブロック構成図である。本実施の形態における情報処理装置10は、入出力部11、入力解析部12、検索語句特定部13、検索実行部14、検索結果解析部15、表示制御部16、制御部17、コンテンツデータベース(DB)18及び語句関連情報記憶部19を有している。なお、本実施の形態において説明に用いない構成要素については図から省略している。
入出力部11は、上記ユーザインタフェースを介してデータの入出力を行う。入出力部11に含まれる入力受付部111は、ユーザから入力されたデータを受け付ける。受け付けるデータは、質問文やユーザ操作等である。表示部112は、表示制御部16による制御のもと検索実行部14による検索処理の実行結果(以下、「検索結果」という)等を表示する画面や表示中の画面に情報の追加表示や表示内容の変更等の表示制御を行う。本実施の形態では、情報処理装置10に接続されるディスプレイを表示先とし、情報処理装置10に接続されるマウスやキーボード等を入力手段と想定して説明するが、外部の装置、例えばユーザ端末からインターネットを介して情報処理装置10を利用させる場合、入出力部11は、ネットワークインタフェースを介してデータを送受信することになる。
入力解析部12は、入力受付部111により受け付けられたデータを解析して、ユーザにより行われた操作やデータの内容を認識する。検索語句特定部13は、ユーザにより検索条件として質問文が入力された場合、その質問文から語句を抽出することによって、あるいはユーザ操作に応じて検索語句を特定する。「検索語句」というのは、検索実行部14が検索を実行する際に用いる語句のことをいう。
「検索条件」というのは、検索実行部14に検索を実行させる際にユーザが入力指定する条件である。基本的には、検索条件には、検索語句が指定される。検索範囲や情報の種類(例えば、画像等)等の付加的な設定が可能かもしれないが、本実施の形態では、付加的な設定は特に必要ないので、説明の便宜上、語句に限定して説明する。ユーザは、検索条件として、1又は複数の検索キーワードを指定する場合もあるが、本実施の形態では、自然文で指定されることを想定している。なお、本実施の形態では、検索語句を含む検索文は、質問文と同義であり、ユーザは検索語句を自然文に含めて入力するため、自然文とも同義である。
検索語句特定部13は、原則、語句関連情報記憶部19に設定登録されている語句と合致する語句を、検索実行部14が用いる検索語句として特定する。検索実行部14は、検索語句特定部13により特定された検索語句に基づき検索処理を実行する。本実施の形態では、自然文から抽出された語句によって検索実行部14が検索処理を実行することになる。なお、「語句」というのは、語や句を意味する。語句関連情報記憶部19には、単なる語(単語)のみならず句も登録されることから、検索実行部14は、句に基づき検索を実行する場合もあり得る。本実施の形態では、このような場合を考慮して「語句」と表現している。
検索結果解析部15は、検索結果を解析することで各種情報を取得する。各種情報として関連度、検索結果数及び合致率を取得するために、検索結果解析部15は、関連度算出部151、検索結果数集計部152及び合致率算出部153を有している。各種情報の具体的な内容については後述する。
表示制御部16は、制御部17による制御のもと、表示部112に、検索条件に含まれる複数の語句をユーザに選択可能に表示させるよう制御する。また、ユーザによる所定項目の選択操作によって、表示された複数の語句の中からいずれかの語句が選択されると、語句関連情報に設定されている当該選択された語句の下位層に位置する語句を、当該選択された語句と差し替える検索語句候補として表示させるよう制御する。制御部17は、後述する処理が実行されるよう各構成要素11~16を制御する。
コンテンツデータベース18は、膨大な量の情報(コンテンツ)が蓄積されている記憶手段である。検索実行部14は、インターネットを介して外部にあるコンテンツを検索するようにしてもよいが、本実施の形態ではコンテンツデータベース18が検索実行部14による検索先となる。
図2は、本実施の形態における語句関連情報記憶部19に設定登録されている語句関連情報に含まれる各語句の関係性を模式的に示す図である。語句関連情報は、オントロジーに相当する辞書であり、複数の概念を意味的な関係性で関連付けることにより構造化された知識情報である。語句は、オントロジーによって定義される概念を表す名前である。図2に示すように、各語句は、語句間の意味的な関係性によって直接又は間接的に紐付けられ、この紐付けによって示される階層関係によって階層構造(すなわち、階層上の上下関係)が示される。なお、語句関連情報には、他の語句と階層を形成しない語句が存在してもよい。語句関連情報において、階層の上位にある語句は、汎用的一般的な語句と認識され、階層の下位に位置する語句ほど専門性の高い語句と認識される。また、語句は、下位層に紐付く語句の総称、すなわち例えば下位層に位置する語句のグループ名(「クラス名」ともいう)などのように上位概念に相当する語句の場合がある。また、語句によっては、複数の直上の語句から紐付けられる場合がある。つまり、語句の中には、複数の異なる階層に組み込まれる場合がある。図2は、語句の関係性を示すための模式図であって、語句の実際の関係性や登録数、階層数はこれに限るものではない。
前述したように、検索語句特定部13は、ユーザにより入力された質問文の中から1又は複数の語句を抽出し、その抽出した語句を検索実行部14による検索語句として特定することになるが、検索語句特定部13が抽出する語句は、語句関連情報に登録されている必要がある。なお、検索語句特定部13が抽出する語句と、語句関連情報に登録されている語句とが完全に一致していなくても、類義語等の関係で同じ語句とみなすことができるのであれば、検索語句特定部13が抽出する語句は語句関連情報に登録されているとみなすようにしてもよい。コンテンツデータベース18に登録されている情報が検索結果として選出されるためには、当該コンテンツに含まれている語句を洗い出すことによって抽出し、その抽出した語句と他の語句との関係性を定義して語句関連情報記憶部19に登録する必要がある。このように、語句関連情報に設定する語句と、コンテンツデータベース18に登録されているコンテンツに含まれている語句とを関連付けるためには、語句関連情報をコンテンツデータベース18に登録されているコンテンツを参照して生成するのが好ましい。
情報処理装置10における各構成要素11~17は、情報処理装置10を形成するコンピュータと、コンピュータに搭載されたCPUで動作するプログラムとの協調動作により実現される。また、各記憶手段18,19は、情報処理装置10に搭載されたHDDにて実現される。あるいは、RAM又は外部にある記憶手段をネットワーク経由で利用してもよい。
また、本実施の形態で用いるプログラムは、通信手段により提供することはもちろん、CD-ROMやUSBメモリ等のコンピュータ読み取り可能な記録媒体に格納して提供することも可能である。通信手段や記録媒体から提供されたプログラムはコンピュータにインストールされ、コンピュータのCPUがプログラムを順次実行することで各種処理が実現される。
図3は、本実施の形態における表示制御部16が表示対象とする検索サービス画面の概略的な画面構成の一例を示す図である。検索サービス画面20には、質問文入力領域21、検索結果表示領域22、対話表示領域23及び検索語句設定領域24が含まれている。質問文入力領域21は、ユーザが検索を行うために検索条件を入力するための領域である。ユーザは、検索条件として検索キーワードを入力してもよいが、本実施の形態では、前述したように質問文を入力する。検索結果表示領域22は、検索実行部14による検索結果を表示するための領域である。本実施の形態では、ユーザと対話形式にて検索サービスを提供するが、対話表示領域23は、そのユーザとシステム(すなわち、情報処理装置10)との入出力部11を介した対話の内容を表示するための領域である。例えば、ユーザに質問文の入力を促すメッセージ、ユーザが質問文入力領域21から入力した質問文、その質問文から抽出された検索語句、その検索語句に基づく検索結果数(コンテンツ数)、検索語句の追加、指定変更等を促すメッセージ等が対話形式にて表示される。
そして、検索語句設定領域24は、質問文に含まれる複数の語句をユーザに選択可能に表示すると共に、再度検索を行う場合に検索語句をユーザに変更させるための領域である。検索語句設定領域24には、所定の条件を満たない場合に表示されることになるが、ここでいう、所定の条件というのは、検索実行部14による検索結果と質問文に含まれる複数の語句との関連性を示す指標値が所定の閾値以上ということである。つまり、指標値が所定の閾値に満たない場合に検索語句設定領域24に所定の情報を表示して、再度検索を行う場合に検索語句をユーザが変更できるようにしている。本実施の形態では、その指標値として関連度を用いる例を示すが、関連度については後述する。
次に、本実施の形態において、ユーザ操作に応じて検索サービスを提供しているときの動作について説明する。
前述したように、ユーザは、検索サービス画面20を利用することで情報処理装置10と対話形式にて検索を実行することができる。ユーザは、検索を実行したい場合、所定の画面表示操作を行う。表示制御部16は、ユーザの画面表示操作に応じて図3に示す検索サービス画面20を画面表示させる。そして、ユーザは、検索サービス画面20の質問文入力領域21から自然文を入力することで検索を実行させる。
なお、ユーザが検索を実行するというのは、情報処理装置10が提供する検索サービスを利用して検索を行うことを意味する。一方、情報処理装置10の検索実行部14が検索を実行するというのは、検索処理アプリケーションを実行することによりユーザの指定に基づく検索語句と関連性の高い情報(コンテンツ)を抽出し、その抽出したコンテンツを検索結果としてユーザに提示するという検索サービス(検索処理)を実行することを意味する。
入力受付部111は、質問文入力領域21から入力された自然文を受け付けると、入力解析部12は、入力された内容を解析して情報の種類を特定する。ここでは、入力受付部111が受け付けた情報は質問文入力領域21から入力された情報であることから検索語句を含む自然文であると特定できる。自然文の場合、検索語句特定部13は、自然文を解析して検索語句を抽出する。このようにして、入力された自然文の中に含まれている検索語句が特定されると、検索実行部14は、その検索語句に基づき検索処理を実行する。表示制御部16は、検索実行部14による検索結果を、検索サービス画面20の検索結果表示領域22に表示させる。
なお、以上の処理の過程において、ユーザにより入力された自然文、自然文から抽出された検索語句、検索実行部14による検索により得られた情報(コンテンツ)の数(検索結果数)等は、時系列順に対話表示領域23に表示される。
ところで、表示制御部16は、検索実行部14による検索結果(すなわち、コンテンツのリスト)を、関連度の高い順に並べて検索結果表示領域22に表示させる。ここで、関連度算出部151が算出する「関連度」について図4を用いて説明する。
図4には、自然文で入力された検索文と、その検索文から抽出された語句に基づき検索によりたどり着くコンテンツとの関係が示されている。コンテンツは、コンテンツデータベース18に格納されている。図4に示す語句とコンテンツとの関係によると、検索文からは、「消費税額」及び「特例」という2つの語句が検索語句として抽出されていることからコンテンツにたどり着くまで2経路存在する。そして、各経路においてコンテンツにたどり着くまでに語句関連情報記憶部19を経由する語句の数(以下、「ホップ数」という)を求める。まず、「消費税額」からのホップ数は、「消費税額」、「税額」及び「所得税額」の3である。一方、「特例」からのホップ数は、「特例」のみで1である。
関連度は、経路数が同じ場合、ホップ数が小さいほど関連度が高くなり、関連度が高いほど検索文とコンテンツとの関連性が高いということができる。従って、関連度の高い検索結果が得られているということは、ユーザが所望する検索結果(コンテンツ)が得られていると推測できるので、本実施の形態では、再度の検索を促さないようにした。一方、関連度が低い検索結果しか得られていない場合、ユーザが所望する検索結果が得られていると推測して、検索語句設定領域24に後述する情報を表示して、再度の検索を促すようにすると共に、検索語句の再設定の便宜を図れるようにした。なお、関連度の高低は、所定の閾値との比較で判定する。すなわち、算出される関連度が閾値以上の場合には関連度が高いと判定し、算出される関連度が閾値に満たない場合には関連度が低いと判定する。
検索実行部14による検索の実行の結果、検索結果が所定の条件を満たさなかった場合、すなわち検索結果として関連度が所定の閾値以上のコンテンツが得られなかった場合、本実施の形態では、質問文(に含まれる検索語句)との関係性が高くないコンテンツが得られただけで、ユーザが所望するコンテンツが得られていないとして後述する検索語句再設定処理を実行する。
一方、関連度が所定の閾値以上のコンテンツが得られた場合、質問文入力領域21から入力された自然文に基づく検索処理は終了する。なお、検索結果表示領域22には、コンテンツのリストが表示されるだけであって、「コンテンツが得られた」とはいっても、実際にはコンテンツ自体が表示されるわけではない。ただ、本実施の形態では、説明の便宜上、検索実行部14による検索結果の中にユーザが所望するコンテンツが含まれている場合を「コンテンツが得られた」と説明する。
ところで、関連度が所定の閾値以上のコンテンツが得られた場合であっても以下の再検索条件に合致する場合、質問文に含まれる検索語句を検索語句設定領域24に選択可能に表示して、以下に説明する検索語句再設定処理を実行する。
なお、検索実行部14による検索結果として、質問文に含まれる複数の検索語句のANDとなる情報、すなわち質問文に含まれる複数の語句の全てと関係性のあるコンテンツに限定して得るのではなく、複数の語句のORとなる情報、すなわち複数の語句のうち少なくとも1つとでも関係性のある情報を得る場合を想定している。
まず、再検索条件として、検索実行部14による検索結果に、質問文に含まれる複数の検索語句それぞれに基づく検索結果数(コンテンツ数)に所定の検索数間条件に合致する偏りがある場合である。
図5についての詳細は追って説明するが、図5にはユーザにより入力された自然文(検索文)の中から「貨物」、「消費税」、「課税」及び「輸入」が検索語句として特定された場合の例が示されている。そして、各検索語句に付随して表示される数値は、当該検索語句の検索結果数である。
得られる検索結果として、理想的には、検索語句のバランスを考慮すると各検索語句に対する検索結果数に差異が少ないのが望ましいとも考えられる。従って、所定の検索数間条件として、検索文に含まれる複数の検索語句それぞれの検索結果数の最大値と最小値に所定の差異がある場合に、検索実行部14による検索結果に偏りがあると判断する。
また、検索数の最小値が極めて小さいのも検索語句のバランスに問題があるようにも考えられる。従って、所定の検索数間条件として、検索文に含まれる複数の検索語句の検索結果数のうち最小となる検索結果数(すなわち、最小値)が所定の閾値に満たない場合に、検索実行部14による検索結果に偏りがあると判断する。
このように、前述した検索数間条件に合致する偏りがある場合、再検索条件に合致するものとして検索語句再設定処理を実行する。
また、再検索条件として、検索結果数が所定数以上の場合、所望のコンテンツが見つけにくい表示状態にあると推定して検索語句再設定処理を実行するようにしてもよい。
ところで、ユーザが所望するコンテンツが得られていたとしても、換言すると検索結果に含まれていたとしてもコンテンツが見つけにくい場合がある。「コンテンツが見つけにくい」というのは、検索の実行によりユーザが所望するコンテンツが得られていたとしても、換言すると検索結果に含まれていたとしても検索結果数が多くて、ユーザが所望するコンテンツが検索結果表示領域22に表示されていない場合、若しくは検索結果表示領域22に表示されていても上位に表示されない場合である。また、本実施の形態では、ユーザが所望するコンテンツが検索結果として得られていない場合も見つけにくいに該当するものとする。このように、関連度と所定の閾値との関係にかかわらず、コンテンツが見つけにくい場合には検索語句再設定処理を実行する。
図5乃至図9は、検索語句設定領域24への表示例を示す図であり、以下、これらの表示例を用いて本実施の形態において特徴的な検索語句再設定処理について説明する。
情報処理装置10は、検索語句再設定処理を実行することで、ユーザに検索語句を設定変更させるなどして関連度が所定の閾値以上のコンテンツが得られ、また上位に表示されるようにすることを試みる。
図5には、ユーザにより入力された自然文から得られた検索語句を検索語句設定領域24に表示させたときの表示例が示されている。表示制御部16は、検索語句再設定処理の実行が開始されると、図5に示す表示内容を検索語句設定領域24に表示させる。但し、「貨物」に対応付けされているコンテキストメニューは、表示開始時点では表示されない。図5は、「貨物の輸入において、消費税は課税されませんか?」とユーザにより質問文入力領域21に入力された場合において、その入力された自然文の中から「貨物」、「消費税」、「課税」及び「輸入」が検索語句として抽出された場合を想定した表示例である。各検索語句には、当該検索語句の検索結果数が対応付けして表示される。各検索語句の検索結果数は、検索結果数集計部152による集計処理により得られる。
図5に示す数値例によると、検索結果のうち「貨物」という語句と関係のある検索結果数(コンテンツ数)は70であり、「輸入」という語句と関係のある検索結果数は22であることを示している。なお、本実施の形態では、質問文に含まれる複数の語句を関係のある検索結果数の多い順に並べて表示させる例を示している。これにより、絞込対象とすべき語句を見つけやすくしているが、この表示例に限る必要はない。例えば、質問文の登場順に並べて表示させてもよい。
この検索結果数の数値例に基づき説明すると、ユーザは、検索結果が多すぎて所望の情報を見つけにくい場合、それは「貨物」と関連する検索結果数が多いからであり、語句関連情報において「貨物」をより下位の用語(すなわち、専門性のある用語)に差し替えれば検索結果数を絞り込めると推測できる。
このような推測に基づくと、ユーザは、例えば右クリックなどの所定の選択操作を行うことで「貨物」を選択する。この所定の選択操作に応じて、表示制御部16は、コンテキストメニューを表示部112にポップアップ表示させる。ここでは、コンテキストメニューに、この時点で選択可能な「検索語句から削除する」と「子要素を開く」を含めているが、他の選択肢を含めてもよい。
ここで、ユーザが「貨物」に対応して表示されるコンテキストメニューの中から「子要素を開く」を選択すると、表示制御部16は、語句関連情報記憶部19に登録されている語句関連情報を参照して、「貨物」に紐付けられている直下の語句を読み出す。図3に示す語句の関係性を参照すると、語句関連情報において、「貨物」の直下には「外国貨物」、「内国貨物」及び「特例申告貨物」という語句が紐付けられているのがわかる。従って、表示制御部16は、その直下に紐付けられている語句を読み出して、検索語句設定領域24に表示させる。このときの画面表示例を図6に示す。但し、「外国貨物」に対応付けされているコンテキストメニューは、図6の表示内容が表示された時点では表示されない。
ここで、ユーザは、検索に用いる語句として「貨物」を「外国貨物」に差し替えたい場合、前述したように、「外国貨物」を右クリックなどの所定の選択操作を行うことで選択する。この所定の選択操作に応じて、図6に示すように「外国貨物」に対応させてコンテキストメニューが表示される。そして、ユーザは、コンテキストメニューの中から「検索語句に設定する」を選択することで検索語句を「貨物」から「外国貨物」に差し替えることが確定される。
「外国貨物」から更に下位に位置する用語を表示させたい場合、「外国貨物」を右クリックしてコンテキストメニューを表示させ、その中から「子要素を開く」を選択すればよい。
なお、本実施の形態では、上記説明したように、語句に対応して表示されるコンテキストメニューから「子要素を開く」が選択されると、選択された語句の直下の語句のみを表示対象として語句関連情報から読み出していたが、選択された語句から下位に位置する語句の全て、あるいは予め設定されている、若しくはユーザに別途指定されている所定階層まで下位に位置する語句をまとめて表示させるようにしてもよい。これにより、下位層に位置する語句を表示させる際の「子要素を開く」の選択回数を減らせることができる。
図6では、「貨物」が「外国貨物」に差し替える場合の例であるが、図7では、「消費税」を「内国消費税」に差し替える場合の例を示している。
「検索語句に設定する」の選択操作、換言すると検索語句の差し替えの確定操作に応じて、制御部17は、検索実行部14に検索処理の実行を自動的に開始させてもよいが、複数の語句を同時に変更できるように、例えば「貨物」を「外国貨物」に、「消費税」を「内国消費税」に、それぞれ差し替えてから再度検索が実行できるようにしてもよい。例えば、検索語句設定領域24内にユーザが選択可能な表示部品として検索実行ボタンを表示させ、その検索実行ボタンが操作された時点で検索実行部14により検索処理が実行されるようにしてもよい。この場合、検索実行部14は、当初「貨物」、「消費税」、「課税」及び「輸入」を検索語句として検索を実行していたところを、「外国貨物」、「内国消費税」、「課税」及び「輸入」を検索語句として検索を実行することになる。
このようにして、検索実行部14により検索が再度実行されると、その検索結果で検索結果表示領域22の表示内容は更新される。
異なる検索語句にて検索が再度実行されると、検索語句が変更されていることから得られる検索結果には、直前の検索結果と同じコンテンツと異なるコンテンツが混在することが想定できる。この場合、検索結果に新たに含まれることになったコンテンツに対して、その旨をユーザに知らせることができるように、換言すると新たに表示されることになったコンテンツをユーザが見つけやすいように、何らかの識別子、例えば“New”等の文字を付加して表示したり、該当するコンテンツの表示形態を他と異ならせたりしてもよい。また、再検索により所定数(例えば、1)以上上位に表示されることになったコンテンツに対しては、識別子として“↑”等の表示を付加して表示したり、該当するコンテンツの表示形態を他と異ならせたりしてもよい。
前述したように、本実施の形態では、検索結果としてORとなる情報、すなわち複数の検索語句のうち少なくとも1つと関連性のあるコンテンツを検索結果として得ている。この場合、検索結果には、いずれかの検索語句とは関係のないコンテンツが含まれることになり、検索結果数が膨大になる可能性が大きくなる。そこで、本実施の形態では、検索語句を削除できるようにした。
図8は、コンテキストメニューを除くと図6と同じ図である。ここで、ユーザが検索語句から「輸入」を削除したい場合、前述したように、「輸入」を右クリックなどの所定の選択操作をすることで選択する。この所定の選択操作に応じて、図8に示すように「輸入」に対応させてコンテキストメニューが表示される。そして、ユーザがコンテキストメニューの中から「検索語句から削除する」を選択すると、検索語句特定部13は、「輸入」を検索語句から外す。
なお、図5,7と図6,8とで同じ選択操作をしても異なる項目を含むコンテキストメニューが表示された。これは、図5,7において、「貨物」及び[輸入]は、検索語句として確定されている語句であることからコンテキストメニューに「検索語句から削除する」という項目を含めている。一方、図6,8において「外国貨物」及び「内国消費税」は、検索語句の候補であって検索語句として確定されていない。そのためコンテキストメニューに「検索語句に設定する」という項目が含まれることになる。
ところで、図5乃至図8では、各検索語句に対して当該検索語句に基づく検索結果数を対応付けて表示させる例を示した。つまり、本実施の形態では、検索語句を変更させる際に指標値として検索結果数をユーザに提供している。ユーザは、この検索結果数を参照することで、検索を再度実行させる際に絞り込み対象とする検索語句が選出しやすくなる。ただ、検索結果数は、多い場合に限らず少ない場合も考えられる。例えば、ユーザが専門性の高い語句を検索文で用いたことにより所望数のコンテンツが得られない場合もあり得る。
そこで、検索実行部14による検索結果数が所定の閾値に満たない場合、表示制御部16は、図5に例示したように複数の検索語句をユーザに選択可能に表示させる。そして、表示されている複数の検索語句の中からユーザによりいずれかの検索語句が右クリック等の所定の選択操作により選択されると、表示制御部16は、その所定の選択操作に応じてコンテキストメニューを選択された検索語句(以下、「選択検索語句」)に対応させて表示させる。コンテキストメニューの中には、「親要素を開く」という項目が含まれており、ユーザがコンテキストメニューの中から「親要素を開く」を選択すると、表示制御部16は、語句関連情報記憶部19に登録されている語句関連情報を参照して、選択検索語句に紐付けられている直上の語句を読み出す。そして、表示制御部16は、読み出した選択検索語句紐付けられている直上の語句を読み出して、検索語句設定領域24に表示させる。
このように、図6を用いて説明した場合とは逆に、表示制御部16は、選択された検索語句の上位層に位置する語句を検索語句候補として表示させるよう制御する。
また、検索語句を変更させる際に指標値として、検索結果数に代えて、あるいは検索結果数と共に合致率を検索語句に対応付けて表示させるようにしてもよい。検索結果数に代えて合致率が表示される例を図9に示す。
「合致率」というのは、ユーザにより選択された検索語句に紐付く語句であって語句関連情報の中から抽出され検索語句候補として検索語句設定領域24に表示される語句に基づく検索結果数に対する、当該検索語句候補として表示される語句及び質問文に含まれる複数の検索語句の中からユーザにより選択された検索語句以外の語句の全てに基づく検索結果数である。合致率は、合致率算出部153により算出される指標値である。
図9を用いて具体的に説明すると、図9に示すようにユーザにより選択された検索語句というのは「貨物」である。これにより、ユーザにより選択された検索語句以外の語句というのは「消費税」、「課税」及び「輸入」となる。語句関連情報において、ユーザにより選択された「貨物」の直下に位置する「外国貨物」、「内国貨物」及び「特例申告貨物」は、検索語句候補となり得る。ここで、「外国貨物」に注目すると、「外国貨物」に基づく検索結果数(コンテンツ数)を100とし、「外国貨物」、「消費税」、「課税」及び「輸入」を全て含む検索結果数(コンテンツ数)を80とすると、「外国貨物」における合致率は80/100=80%となる。
合致率を参照すると、「外国貨物」を含むコンテンツの80%には、「消費税」、「課税」及び「輸入」が含まれていることから、合致率が高い組合せの検索語句に基づき検索されたコンテンツは、検索語句との関連度が高いコンテンツであり、ユーザが所望するコンテンツである可能性が高いといえる。従って、ユーザは、合致率の高い語句を検索語句に設定するのが好適である。
なお、合致率の算出に用いる検索結果数は、検索を実行することで得られる値であることから検索結果表示領域22に表示しないものの、検索実行部14により検索を実行させる必要が生じてくる。
また、本実施の形態では、検索実行部14による検索結果(コンテンツのリスト)を、関連度の高い順に並べて検索結果表示領域22に表示させるようにしたが、コンテンツの並び順を関連度以外の指標、例えば、tf-idf(Term Frequency Inverse Document Frequency)などの指標に基づき決定してもよい。
10 情報処理装置、11 入出力部、12 入力解析部、13 検索語句特定部、14 検索実行部、15 検索結果解析部、16 表示制御部、17 制御部、18 コンテンツデータベース(DB)、19 語句関連情報記憶部、20 検索サービス画面、21 質問文入力領域、22 検索結果表示領域、23 対話表示領域、24 検索語句設定領域、111 入力受付部、112 表示部、151 関連度算出部、152 検索結果数集計部、153 合致率算出部。

Claims (10)

  1. ユーザにより指定された検索条件に含まれる複数の語句に基づき検索を実行する実行手段と、
    前記実行手段による検索結果と前記検索条件に含まれる複数の語句との関連性を示す指標値が所定の閾値に満たない場合、前記検索条件に含まれる複数の語句をユーザに選択可能に表示させると共に、当該複数の語句の中からユーザによりいずれかの語句が選択されると、複数の語句を意味的な関係性で関連付けることにより構造化された知識情報に設定されている当該選択された語句の下位層に位置する語句を、当該選択された語句と差し替える検索語句候補として表示させるよう制御する表示制御手段と、
    を有することを特徴とする情報処理装置。
  2. 前記表示制御手段は、前記実行手段による検索結果と前記検索条件に含まれる複数の語句との関連性を示す指標値が所定の閾値を満たす場合であっても、前記実行手段による検索結果に、前記検索条件に含まれる複数の語句それぞれに基づく検索結果数に所定の条件に合致する偏りがある場合には、前記検索条件に含まれる複数の語句をユーザに選択可能に表示させるよう制御することを特徴とする請求項1に記載の情報処理装置。
  3. 前記所定の条件は、前記検索条件に含まれる複数の語句それぞれに基づく検索結果数の最大値と最小値に所定の差異がある場合であることを特徴とする請求項2に記載の情報処理装置。
  4. 前記所定の条件は、前記検索条件に含まれる複数の語句それぞれに基づく検索結果数の最小値が所定の閾値に満たない場合であることを特徴とする請求項2に記載の情報処理装置。
  5. 前記表示制御手段は、前記選択された語句から所定階層数下位に位置する語句までを検索語句候補として表示させるよう制御することを特徴とする請求項1に記載の情報処理装置。
  6. 前記表示制御手段は、前記検索語句候補として表示される語句に基づく検索結果数に対する、当該検索語句候補として表示される語句及び前記検索条件に含まれる複数の語句の中からユーザにより選択された語句以外の語句の全てに基づく検索結果数を合致率として、当該検索語句候補に関連付けて表示させることを特徴とする請求項1に記載の情報処理装置。
  7. 前記実行手段は、表示されている前記検索語句候補の中からユーザにより選択された語句で前記選択された語句を差し替えてから検索を再度実行することを特徴とする請求項5又は6に記載の情報処理装置。
  8. 前記実行手段は、表示されている前記検索条件に含まれる複数の語句の中からユーザにより選択された語句を検索条件から削除して検索を再度実行することを特徴とする請求項1記載の情報処理装置。
  9. 前記表示制御手段は、前記実行手段による検索結果数が所定の閾値に満たない場合、前記検索条件に含まれる複数の語句をユーザに選択可能に表示させると共に、当該複数の語句の中からユーザによりいずれかの語句が選択されると、前記知識情報に設定されている当該選択された語句の上位層に位置する語句を、当該選択された語句に差し替える検索語句候補として表示させるよう制御することを特徴とする請求項1に記載の情報処理装置。
  10. コンピュータを、
    ユーザにより指定された検索条件に含まれる複数の語句に基づき検索を実行する実行手段、
    前記実行手段による検索結果と前記検索条件に含まれる複数の語句との関連性を示す指標値が所定の閾値に満たない場合、前記検索条件に含まれる複数の語句をユーザに選択可能に表示させると共に、当該複数の語句の中からユーザによりいずれかの語句が選択されると、複数の語句を意味的な関係性で関連付けることにより構造化された知識情報に設定されている当該選択された語句の下位層に位置する語句を、当該選択された語句と差し替える検索語句候補として表示させるよう制御する表示制御手段、
    として機能させるためのプログラム。
JP2019003505A 2019-01-11 2019-01-11 情報処理装置及びプログラム Active JP7243196B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019003505A JP7243196B2 (ja) 2019-01-11 2019-01-11 情報処理装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019003505A JP7243196B2 (ja) 2019-01-11 2019-01-11 情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2020113046A JP2020113046A (ja) 2020-07-27
JP7243196B2 true JP7243196B2 (ja) 2023-03-22

Family

ID=71666312

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019003505A Active JP7243196B2 (ja) 2019-01-11 2019-01-11 情報処理装置及びプログラム

Country Status (1)

Country Link
JP (1) JP7243196B2 (ja)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000076279A (ja) 1998-08-31 2000-03-14 Mitsubishi Electric Corp 情報検索システム、情報検索方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000207422A (ja) 1999-01-13 2000-07-28 Fujitsu Ltd 概念シソ―ラスを用いた文書の検索及び格付けシステム並びに方法
JP2005309666A (ja) 2004-04-20 2005-11-04 Konica Minolta Holdings Inc 情報検索装置
JP2006190023A (ja) 2005-01-05 2006-07-20 Canon Inc 電子文書管理装置
JP2006251935A (ja) 2005-03-08 2006-09-21 Ricoh Co Ltd 文書検索装置、文書検索方法、および文書検索プログラム
JP2007179490A (ja) 2005-12-28 2007-07-12 Research Organization Of Information & Systems 情報資源検索装置、情報資源検索方法及び情報資源検索プログラム
JP2008192110A (ja) 2007-01-12 2008-08-21 Fujifilm Corp コンテンツ検索装置、およびコンテンツ検索方法
JP2010009251A (ja) 2008-06-25 2010-01-14 Internatl Business Mach Corp <Ibm> 文書データの検索を支援する装置及び方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05128157A (ja) * 1991-11-08 1993-05-25 Ricoh Co Ltd 文書検索装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000076279A (ja) 1998-08-31 2000-03-14 Mitsubishi Electric Corp 情報検索システム、情報検索方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000207422A (ja) 1999-01-13 2000-07-28 Fujitsu Ltd 概念シソ―ラスを用いた文書の検索及び格付けシステム並びに方法
JP2005309666A (ja) 2004-04-20 2005-11-04 Konica Minolta Holdings Inc 情報検索装置
JP2006190023A (ja) 2005-01-05 2006-07-20 Canon Inc 電子文書管理装置
JP2006251935A (ja) 2005-03-08 2006-09-21 Ricoh Co Ltd 文書検索装置、文書検索方法、および文書検索プログラム
JP2007179490A (ja) 2005-12-28 2007-07-12 Research Organization Of Information & Systems 情報資源検索装置、情報資源検索方法及び情報資源検索プログラム
JP2008192110A (ja) 2007-01-12 2008-08-21 Fujifilm Corp コンテンツ検索装置、およびコンテンツ検索方法
JP2010009251A (ja) 2008-06-25 2010-01-14 Internatl Business Mach Corp <Ibm> 文書データの検索を支援する装置及び方法

Also Published As

Publication number Publication date
JP2020113046A (ja) 2020-07-27

Similar Documents

Publication Publication Date Title
US9519636B2 (en) Deduction of analytic context based on text and semantic layer
US20180075013A1 (en) Method and system for automating training of named entity recognition in natural language processing
JP5939588B2 (ja) 関連ノードを探索する方法、並びに、そのコンピュータ、及びコンピュータ・プログラム
JP2010003015A (ja) 文書検索システム
JP2021101361A (ja) イベントトピックの生成方法、装置、機器及び記憶媒体
CN111091006B (zh) 一种实体意图体系的建立方法、装置、设备和介质
JP2007011604A (ja) 不具合診断システム及びプログラム
JPWO2003034279A1 (ja) 情報検索方法、情報検索プログラム、情報検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2014010758A (ja) ファイル管理装置、ファイル管理方法、及びプログラム
JP4084647B2 (ja) 情報検索システム、情報検索方法及び情報検索プログラム
JP4699909B2 (ja) キーワード対応関係分析装置及び分析方法
JP7243196B2 (ja) 情報処理装置及びプログラム
WO2014064777A1 (ja) 文書評価支援システム、及び文書評価支援方法
JP2007257369A (ja) 情報検索装置
JP7238411B2 (ja) 情報処理装置及びプログラム
JP3743204B2 (ja) データ分析支援方法および装置
JP2005128872A (ja) 文書検索システム及び文書検索プログラム
JP7340952B2 (ja) テンプレート検索システムおよびテンプレート検索方法
JP2005122509A (ja) 階層構造データ分析方法、分析装置および分析プログラム
JP4877930B2 (ja) 文書処理装置及び文書処理方法
JP6549173B2 (ja) 計算機システム及び文章データの検索方法
JP2008135057A (ja) 検索処理方法及びプログラム
JP2014146076A (ja) 文字列抽出方法、文字列抽出装置、および文字列抽出プログラム
JP2020113045A (ja) 情報処理装置及びプログラム
US20230143297A1 (en) Production knowledge management system, production knowledge management method, and production knowledge management program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211220

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20221017

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230123

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230207

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230220

R150 Certificate of patent or registration of utility model

Ref document number: 7243196

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150