以下、図面に基づいて、本願の開示する情報出力システム、情報出力方法および情報出力プログラムの実施例を詳細に説明する。なお、本実施例により、開示技術が限定されるものではない。また、以下の実施例は、矛盾しない範囲で適宜組みあわせてもよい。
図1は、実施例の情報出力システムの構成の一例を示すブロック図である。図1に示す情報出力システム1は、端末装置10と、サーバ100とを有する。なお、図1では、端末装置10の数が1つの例を示したが、端末装置10の数は限定されず、任意の数の端末装置10を有してもよい。また、図1では、サーバ100は、1つの装置としたが、サーバ100の各機能部および各記憶部は、SaaS(Software as a Service)等のクラウドコンピューティングサービスを用いて構成されてもよい。なお、本実施例では、コンテンツの一例として書籍を用いて説明する。
端末装置10およびサーバ100の間は、ネットワークNを介して相互に通信可能に接続される。かかるネットワークNには、有線または無線を問わず、インターネットを始め、LAN(Local Area Network)やVPN(Virtual Private Network)などの任意の種類の通信網を採用できる。
端末装置10は、例えば、書店の店員(以下、作業者ともいう。)が用いる端末装置であり、図示しない表示部に表示された入力画面において、選書に用いるキーワードおよび重視度情報が入力される。端末装置10は、入力されたキーワードおよび重視度情報を、第1のキーワードおよび重視度情報として、ネットワークNを介してサーバ100に送信する。また、端末装置10は、サーバ100からネットワークNを介して選書の結果を含む出力画面を受信する。端末装置10は、受信した出力画面を図示しない表示部に表示させる。
ここで、第1のキーワードとしては、例えば、選書テーマに関連する語群であればよく、単語の他に、作業者がピックアップした書籍のあらすじが入力されてもよい。また、重視度情報は、例えば、意外性(セレンディピティ性)、売上重視度、著者人気重視度、対象ジャンルおよび対象出版年といった項目である。意外性、売上重視度および著者人気重視度は、例えば、高中低の3段階から選択可能とすることができる。
ここで、意外性とは、例えば、キーワードから想起し易いか否か、即ち、キーワードと直接的に関係するキーワードを含むか否かを示す項目である。売上重視度とは、例えば、売上額または売上数を重視するか否かを示す項目である。著者人気重視度とは、例えば、その著者による書籍の売上額または売上数を重視するか否かを示す項目である。意外性が「高」と指定された場合は「低」と指定された場合と比較して、キーワードと直接的に関係しないキーワードまで含む書籍まで選択されやすくなるように検索処理を実行する。売上重視度が「高」と指定された場合は「低」と指定された場合と比較して、売上額または売上数が多い書籍ほど、より選択されやすくなるように検索処理を実行する。著者人気重視度が「高」と指定された場合は「低」と指定された場合と比較して、その著者による書籍の売上額または売上数が大きい書籍ほど、より選択されやすくなるように検索処理を実行する。
また、対象ジャンルは、小説、評論等のジャンルを選択可能とすることができる。さらに、対象出版年は、例えば、西暦で入力可能とすることができる。
端末装置10の一例としては、タブレット端末を採用できる。端末装置10には、上記のタブレット端末等の可搬型の端末のみならず、据置型のパーソナルコンピュータを端末装置10として採用することもできる。また、端末装置10は、可搬型の端末としては、上記のタブレット端末の他にも、例えば、可搬型のパーソナルコンピュータや、スマートフォン、携帯電話機等の移動体通信端末等を採用することもできる。
サーバ100は、端末装置10から第1のキーワードおよび重視度情報を受信する。なお、第1のキーワードは、処理対象とする第1のキーワードの一例である。また、重視度情報は、第1のキーワードとともに処理対象にする第2のキーワード群に含める範囲を特定する情報の一例である。サーバ100は、処理対象とする第1のキーワードの入力と、第1のキーワードとともに処理対象にする第2のキーワード群に含める範囲を特定する情報の入力とを受け付ける。サーバ100は、2つのキーワード間の関係の近さを示す値と対応付けてキーワード同士の階層的な関係を示す関連語データを記憶する第1の記憶部を参照し、第1のキーワードを起点として、範囲を特定する情報により特定される階層までにあるキーワード群を抽出して第2のキーワード群に設定する。サーバ100は、コンテンツごとにコンテンツに関する情報を要約情報として記憶する第2の記憶部を参照し、第1のキーワードと、第2のキーワード群とに対する合致度が所定以上のコンテンツの情報を抽出する。サーバ100は、抽出したコンテンツの情報の一覧、例えば選書の結果のデータを出力画面として端末装置10に送信して出力する。これにより、情報出力システム1は、出力されるデータの意外性を高めることができる。換言すれば、作業者にとって意外性が高く感じられるであろう情報を検索結果に含ませる可能性を高めることができる。そして、そのような検索結果に示される書籍を、書籍の企画コーナーに配置すれば、書店の利用者から見ても、意外性に富み、興味を惹かれる品揃えである企画コーナーとすることができる。
本実施例では、キーワードとして入力される単語について、従来用いられているジャンルによる分類に加えて、購入時の気分、価値観、背景といった単語を用いて消費者の購入理由を捉える。例えば、従来用いられているジャンルとしては、「コミック」、「ノンフィクション」、「フィクション」、「実用書」などが一例として挙げられる。購入時の気分に関する単語としては、「笑いたいとき」、「泣きたいとき」などが一例として挙げられる。価値観に関する単語としては、「アウトドア」、「インドア」などが一例として挙げられる。背景に関する単語としては、「出産したとき」、「結婚したとき」などが一例として挙げられる。また、本実施例では、既存ジャンルについても、興味を細分化することで、より細かく消費者の購入理由を捉える。
次に、図2を用いて、自動選書と人手による選書との比較について説明する。図2は、自動選書と人手による選書との比較の一例を示す図である。図2に示すように、選書の対象となる書籍数は、自動選書が全書籍を母数とした選書が可能であるのに対し、人手による選書では、選書冊数に応じた作業量が発生するので、当該作業量に応じた冊数を母数とした選書となる。また、ジャンル等の偏りは、自動選書が優先する観点をパラメータ(重視度情報)により設定可能であるのに対し、人手による選書では、ジャンルや出版年代等の作業者の知識や得意分野に応じた偏りが発生する。さらに、売上や著者人気重視度の考慮度合いは、自動選書がパラメータを用いてロジックに織り込むことができるのに対し、人手による選書では、例えば売上であれば、正確な売上の考慮には都度情報の参照が求められる。
続いて、サーバ100の構成について説明する。図1に示すように、サーバ100は、通信部110と、記憶部120と、制御部130とを有する。なお、サーバ100は、図1に示す機能部以外にも既知のコンピュータが有する各種の機能部、例えば各種の入力デバイスや音声出力デバイス等の機能部を有することとしてもかまわない。
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。通信部110は、ネットワークNを介して端末装置10と有線または無線で接続され、端末装置10との間で情報の通信を司る通信インタフェースである。通信部110は、端末装置10から第1のキーワードおよび重視度情報を受信する。通信部110は、受信した第1のキーワードおよび重視度情報を制御部130に出力する。また、通信部110は、制御部130から入力された入力画面および出力画面等を端末装置10に送信する。
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ等の半導体メモリ素子、ハードディスクや光ディスク等の記憶装置によって実現される。記憶部120は、関連語辞書記憶部121と、書誌情報記憶部122と、単語情報記憶部123と、売上情報記憶部124と、書誌マスタ記憶部125とを有する。また、記憶部120は、制御部130での処理に用いる情報を記憶する。
関連語辞書記憶部121は、関連語データを記憶する。関連語辞書記憶部121は、第1の記憶部の一例である。関連語データは、2つのキーワード間の関係の近さを示す値と対応付けて、キーワード同士の階層的な関係を示すデータである。なお、階層的な関係とは、関連語辞書記憶部121の参照時に、階層的アクセスが可能であることである。図3は、関連語辞書記憶部の一例を示す図である。図3に示すように、関連語辞書記憶部121は、関連語データとして、縦軸および横軸のキーワード、ならびに、縦軸のキーワードと横軸のキーワードとの関係の近さを表す数値である単語間類似度を記憶する。
図3の例では、1行目の「真実」に対して、各列の「事実」、「過去」、「驚愕」、「衝撃」のそれぞれについて、例えば、単語間類似度を0〜1の範囲で表している。例えば、「真実」と「事実」とは、単語間類似度が「0.91」であることを示す。なお、各列のキーワードは、単語間類似度が高い順にソートされている。
図1の説明に戻って、書誌情報記憶部122は、書籍名と当該書籍のあらすじとを対応付けて記憶する。書誌情報記憶部122は、第2の記憶部の一例である。図4は、書誌情報記憶部の一例を示す図である。図4に示すように、書誌情報記憶部122は、「書籍名」、「あらすじ」といった項目を有する。書誌情報記憶部122は、例えば、書籍名ごとに1レコードとして記憶する。
「書籍名」は、書籍の名称を示す情報である。「あらすじ」は、書籍のあらすじ、つまり書誌情報を示す情報である。なお、書誌情報は、要約情報の一例である。図4の1行目の例では、書籍名「科学捜査班xxx」と、あらすじ「過去からよみがえる驚愕の真実。・・・」とが対応付けて記憶されている。
図1の説明に戻って、単語情報記憶部123は、ベクトル化された単語情報を記憶する。単語情報記憶部123は、第3の記憶部の一例である。図5は、単語情報記憶部の一例を示す図である。図5に示すように、単語情報記憶部123は、「単語」、「v1」、「v2」、「v3」・・・「v100」といった項目を有する。単語情報記憶部123は、例えば、単語ごとに1レコードとして記憶する。
「単語」は、書誌情報、つまりあらすじ等から抽出された単語を示す情報である。「v1」、「v2」、「v3」・・・「v100」は、ベクトル化された単語情報である。ベクトル化された単語情報の「v」の後の数字は、ベクトルの軸を表す数値である。単語のベクトル化については、例えば、文献「Mikolovら:Distributed Representations of Words and Phrases and their Compositionality (2013)」の手法を用いることができる。
図1の説明に戻って、売上情報記憶部124は、書籍ごとの売上冊数を、例えば、月ごとに記憶する。図6は、売上情報記憶部の一例を示す図である。図6に示すように、売上情報記憶部124は、「書籍名」、「売上冊数」といった項目を有する。売上情報記憶部124は、例えば、書籍名ごとに1レコードとして記憶する。
「書籍名」は、書籍の名称を示す情報である。「売上冊数」は、例えば、1ヶ月ごとに売り上げた冊数を示す情報である。図6の1行目の例では、書籍名「科学捜査班xxx」は、2016年1月に「258」冊売り上げ、2016年2月に「357」冊売り上げたことを示す。
図1の説明に戻って、書誌マスタ記憶部125は、書籍名と、書籍の出版年、著者およびジャンルとを対応付けて記憶する。図7は、書誌マスタ記憶部の一例を示す図である。図7に示すように、書誌マスタ記憶部125は、「書籍名」、「出版年」、「著者」、「ジャンル」といった項目を有する。書誌マスタ記憶部125は、例えば、書籍名ごとに1レコードとして記憶する。
「書籍名」は、書籍の名称を示す情報である。「出版年」は、書籍が出版された年を示す情報である。「著者」は、書籍の著者を示す情報である。「ジャンル」は、例えば、小説、評論といった書籍のジャンルを示す情報である。図7の1行目の例では、書籍名「科学捜査班xxx」は、「2005」年に出版され、著者は「田中○○」、ジャンルは「評論」であることを示す。
図1の説明に戻って、制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、内部の記憶装置に記憶されているプログラムがRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されるようにしてもよい。制御部130は、受付部131と、算出部132と、設定部133と、優先度算出部134と、抽出部135と、出力制御部136とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図1に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
受付部131は、通信部110およびネットワークNを介して、端末装置10に入力画面を送信する。受付部131には、通信部110およびネットワークNを介して、端末装置10から入力画面において入力された、第1のキーワードおよび重視度情報が入力される。受付部131は、入力された第1のキーワードを処理対象として受け付ける。また、受付部131は、入力された重視度情報を、第1のキーワードとともに処理対象にする第2のキーワード群に含める範囲を特定する情報として受け付ける。なお、以下の説明では、範囲を特定する情報を重視度情報ともいう。受付部131は、受け付けた第1のキーワードを算出部132および設定部133に出力する。また、受付部131は、受け付けた重視度情報を設定部133および優先度算出部134に出力する。
算出部132は、書誌情報記憶部122に記憶された書籍の書誌情報について、書誌情報に含まれる単語をベクトル化して単語情報記憶部123に記憶する単語情報生成処理を一度実行する。すなわち、単語情報生成処理は、検索対象の全書籍の書誌情報に基づいて、自動選書を行う際に用いる関連語辞書の基となる単語情報を生成する。
算出部132は、単語情報生成処理として、書誌情報記憶部122から全書籍の書誌情報を取得する。算出部132は、取得した書誌情報に含まれる単語をベクトル化する。算出部132は、単語とベクトルとを対応付けて単語情報記憶部123に記憶する。つまり、算出部132は、ベクトル化された単語情報を単語情報記憶部123に記憶する。
算出部132は、受付部131から第1のキーワードが入力されると、単語情報記憶部123を参照し、第1のキーワードに対応するベクトル化された単語情報の値を読み出す。算出部132は、読み出したベクトル化された単語情報の値に基づいて、単語間類似度を算出する。言い換えると、算出部132は、キーワードごとに複数の所定の項目に関する度合を示す値を記憶する単語情報記憶部123を参照し、第1のキーワードを含んだ複数のキーワードのそれぞれについて対応付けて記憶されている当該値を読み出す。また、算出部132は、読み出した当該値に基づいて、第1のキーワードを含んだ各キーワード間の関係の近さを示す値を算出する。ここで、キーワードごとに複数の所定の項目に関する度合を示す値は、ベクトル化された単語情報の値に対応し、各キーワード間の関係の近さを示す値は、単語間類似度に対応する。
算出部132は、算出した単語間類似度に基づいて関連語データを生成する。すなわち、算出部132は、第1のキーワードに対応する関連語データを生成する。算出部132は、生成した関連語データを関連語辞書記憶部121に記憶する。これは、書誌情報に含まれる全ての単語について関連語データを生成すると、関連語データが膨大な量となってしまうためである。このため、算出部132は、処理に用いる第1のキーワードに対応するベクトル化された単語情報に基づいて、部分的な関連語データを生成する。
言い換えると、算出部132は、算出した単語間類似度に基づいて、第1のキーワードと関係を有する他のキーワードとの階層的な関係を生成する。すなわち、算出部132は、算出した関係の近さを示す値に基づいて、第1のキーワードと関係を有する他のキーワードとの階層的な関係を生成する生成部の一例である。なお、算出部132は、生成した関連語データを出力制御部136に出力し、出力制御部136が関連語データを関連語辞書記憶部121に記憶するようにしてもよい。また、算出部132は、生成した関連語データを関連語辞書記憶部121に記憶すると、設定部133に設定指示を出力する。
設定部133には、受付部131から第1のキーワードおよび重視度情報が入力される。設定部133は、算出部132から設定指示が入力されると、関連語辞書記憶部121を参照し、入力された第1のキーワードを起点として、重視度情報のうち、意外性に基づいて特定される階層までにあるキーワード群を抽出する。なお、意外性は、例えば、高中低の3段階とすることができる。意外性における階層的アクセスは、例えば、意外性が高であれば「幅:5、深さ:5」とし、意外性が中であれば「幅:4、深さ:3」とし、意外性が低であれば「幅:3、深さ:1」とすることができる。すなわち、意外性は、高とすると関連する単語が多く抽出され、低とすると関連する単語が少なめに抽出される。なお、意外性は、幅と深さとが作業者によって直接指定されるようにしてもよい。
設定部133は、抽出したキーワード群を第2のキーワード群に設定する。すなわち、設定部133は、第1のキーワードと階層的な関係を有する第2のキーワード群を設定する。設定部133は、第1のキーワードおよび第2のキーワード群を抽出部135に出力する。
ここで、図8を用いて階層的な関係を用いた階層的アクセスについて説明する。図8は、階層的アクセスの一例を示す図である。図8の例は、第1のキーワードとして「真実」が入力され、重視度情報に基づく階層が「深さ:2、1階層目の幅:3、2階層目の幅:2」である場合におけるアクセス範囲を示すものである。設定部133は、例えば、図3に示す関連語辞書記憶部121を参照し、「真実」に対する単語間類似度が高い順に、「1階層目の幅:3」に対応する「事実」、「過去」、「驚愕」を抽出する。
さらに、設定部133は、抽出した「事実」、「過去」、「驚愕」に対する単語間類似度が高い順に、それぞれ、「2階層目の幅:2」に対応する単語を抽出する。設定部133は、「事実」に対する単語間類似度が高い順では、「理由」、「記憶」を抽出する。設定部133は、「驚愕」に対する単語間類似度が高い順では、「驚く」、「衝撃」を抽出する。設定部133は、「過去」に対する単語間類似度が高い順では、「忌まわしい」、「真相」を抽出する。設定部133は、1階層目および2階層目の抽出した単語、つまり、「事実」、「過去」、「驚愕」、「理由」、「記憶」、「驚く」、「衝撃」、「忌まわしい」、「真相」を第2のキーワード群に設定する。
図1の説明に戻って、優先度算出部134は、受付部131から重視度情報が入力されると、売上情報記憶部124および書誌マスタ記憶部125を参照し、重視度情報のうち、売上重視度、著者人気重視度、対象ジャンル、対象出版年等の情報に基づいて、書籍ごとの優先度を算出する。すなわち、優先度算出部134は、売上情報記憶部124および書誌マスタ記憶部125に記憶された全ての書籍について優先度を算出する。なお、優先度は、例えば売上に基づく場合には、全ての書籍の売上冊数をグラフ化し、さらにグラフを直線化して、当該直線の傾きによって優先度を算出する。また、優先度の算出では、売上の重視度を上げる場合には直線の傾きを大きくし、重視度を下げる場合には直線の傾きを小さくする。なお、優先度は、例えば0〜1の範囲の数値で表される。優先度算出部134は、算出した書籍ごとの優先度を抽出部135に出力する。
抽出部135は、設定部133から第1のキーワードおよび第2のキーワード群が入力されると、書誌情報記憶部122を参照し、第1のキーワードと、第2のキーワード群とに対する合致度を書籍ごとに算出する。すなわち、抽出部135は、書誌情報記憶部122に記憶された全ての書籍について合致度を算出する。言い換えると、抽出部135は、検索キーワードとして、第1のキーワードに第2のキーワード群を追加したキーワード群を用いる。なお、合致度は、例えば0〜1の範囲の数値で表される。
また、抽出部135は、優先度算出部134から書籍ごとの優先度が入力されると、書籍ごとに合致度と優先度とを足し合わせて抽出用スコアを算出する。抽出部135は、抽出用スコアを算出すると、書誌情報記憶部122を参照し、算出した抽出用スコアが所定以上の書籍の情報を抽出する。ここで、抽出用スコアが所定以上とは、例えば、上位3つの抽出用スコアが抽出される値とすることができる。なお、書籍の情報には、例えば、書籍名と、あらすじと、抽出用スコアとが含まれる。なお、抽出用スコアは、1を超えていてもよく、降順や昇順にソートができればよい。抽出部135は、抽出した書籍の情報を出力制御部136に出力する。
なお、第1のキーワードは、複数のキーワードを含む第1のキーワード群であってもよい。この場合には、抽出部135は、第1のキーワード群と、第2のキーワード群とに示されるキーワードの数に応じて、合致度が所定以上の書籍の情報の抽出の仕方を切り替える。抽出部135は、例えば、キーワード数が多い場合には、ナイーブベイズモデルを用いて抽出し、キーワード数が少ない場合には、文章間の距離を用いて抽出することができる。さらに、抽出部135は、複数種類の抽出の仕方のそれぞれで、合致度が所定以上の書籍の情報を抽出するようにしてもよい。なお、これらの場合における合致度は、上述の抽出用スコアを用いてもよい。また、合致度が所定以上とは、例えば、上位3つの合致度が抽出される値とすることができる。また、抽出部135は、書籍の情報の抽出の仕方を切り替えた場合には、抽出に用いたアルゴリズムを抽出した書籍の情報とともに出力制御部136に出力して出力画面に表示させてもよい。
出力制御部136は、抽出部135から抽出した書籍の情報が入力されると、入力された書籍の情報、つまり選書の結果を含む出力画面を生成する。出力制御部136は、生成した出力画面を通信部110およびネットワークNを介して端末装置10に送信し、端末装置10の図示しない表示部に表示させる。また、出力制御部136は、抽出部135において、複数種類の抽出の仕方で書籍の情報の抽出を行った場合には、複数種類の抽出の仕方のそれぞれによる抽出の結果を合せて出力画面を生成する。
ここで、図9を用いて出力結果について説明する。図9は、出力結果の一例を示す図である。図9は、第1のキーワードとして「真実」が入力された場合の出力結果の一例である。図9の1行目、つまり、最もスコアが高い書籍は「科学捜査班xxx」であり、あらすじには、第1のキーワードである「真実」と、第2のキーワード群のうち「過去」および「驚愕」が含まれている。また、図9の2行目の書籍「中国経済のxxx」は、あらすじには、第2のキーワード群のうち「衝撃」および「事実」が含まれている。つまり、書籍「中国経済のxxx」は、第1のキーワードである「真実」は含まれていないが、第2のキーワード群に属する単語が含まれているので、抽出、つまり選書されている。
また、他の例としては、例えば第1のキーワードとして「サッパリ」および「整頓」が入力された場合、選書の出力結果として、掃除に関する実用本の他に、「子ネズミのおおそうじ」のような児童書や、「サッパリ」に関係を持つ別ジャンルからヨガやフィットネス関連の本等も選書される。すなわち、本実施例では、意外性を含んだ選書の出力結果となる。そのような出力結果に示される書籍を、書籍の企画コーナーに配置すれば、書店の利用者から見ても意外性に富み、興味を惹かれたり、来店時には購入意志は無かったが店頭で新たに興味を持ち購入したりすることを期待できる企画コーナーとすることができる。
続いて、図10および図11を用いて、入力画面および出力画面について説明する。図10は、入力画面の一例を示す図である。図10に示す入力画面30は、端末装置10の図示しない表示部に表示され、検索を行う単語または書籍名を入力するための入力欄31と、重視度情報を入力するための入力欄32と、選書を実行する選書実行ボタン33とを有する。入力画面30では、例えば、作業者によって入力欄31に単語が入力され、入力欄32の各項目のチェックボックスがチェックされた後に、選書実行ボタン33が押下される。端末装置10は、選書実行ボタン33が押下されると、入力欄31の単語を第1のキーワードとし、入力欄32の入力内容を重視度情報として、サーバ100に送信する。
図11は、出力画面の一例を示す図である。図11に示す出力画面40は、端末装置10の図示しない表示部に表示され、検索に用いた単語または書籍名を編集可能に表示する入力欄41と、検索に用いた重視度情報を編集可能に表示する入力欄42とを有する。また、出力画面40は、選書に使用された関連単語を表示する関連単語欄43と、入力欄41、入力欄42および関連単語欄43において内容が編集された場合に選書を再度実行する選書再実行ボタン44とを有する。また、出力画面40は、選書の出力結果を表示する出力結果欄45を有する。入力欄41および入力欄42には、入力画面30で入力された内容が表示される。作業者は、出力結果欄45の選書の出力結果に対して、例えば、入力欄42の各項目のチェックボックスを変更したり、関連単語欄43の関連単語をクリックすることで除外したりすることで、条件を変更して選書を再度実行することができる。
次に、実施例の情報出力システム1の動作について説明する。まず、単語情報生成処理について説明する。図12は、実施例の単語情報生成処理の一例を示すフローチャートである。
サーバ100の算出部132は、例えばサーバ100の管理者から単語情報生成処理を実行する旨の指示を受け付けると、単語情報生成処理を一度実行する。算出部132は、書誌情報記憶部122から全書籍の書誌情報を取得する(ステップS1)。算出部132は、取得した書誌情報に含まれる単語をベクトル化する(ステップS2)。算出部132は、単語とベクトルとを対応付けて単語情報記憶部123に記憶する(ステップS3)。これにより、サーバ100は、自動選書を行う際に用いる関連語辞書の基となる単語情報を生成できる。
続いて、情報出力処理について説明する。図13は、実施例の情報出力処理の一例を示すフローチャートである。
サーバ100の受付部131は、端末装置10に入力画面を送信する。端末装置10は、入力画面を受信すると、受信した入力画面を図示しない表示部に表示させ、作業者からのキーワードおよび重視度情報の入力を受け付ける。端末装置10は、入力されたキーワードおよび重視度情報を、第1のキーワードおよび重視度情報として、サーバ100に送信する。サーバ100の受付部131は、受信して入力された第1のキーワードと、重視度情報とを処理対象として受け付ける(ステップS11)。受付部131は、受け付けた第1のキーワードを算出部132および設定部133に出力する。また、受付部131は、受け付けた重視度情報を設定部133および優先度算出部134に出力する。
算出部132は、受付部131から第1のキーワードが入力されると、単語情報記憶部123を参照し、第1のキーワードに対応する単語間類似度を算出する(ステップS12)。算出部132は、算出した単語間類似度に基づいて関連語データを生成する。算出部132は、生成した関連語データを関連語辞書記憶部121に記憶する(ステップS13)。算出部132は、生成した関連語データを関連語辞書記憶部121に記憶すると、設定部133に設定指示を出力する。
設定部133は、算出部132から設定指示が入力されると、関連語辞書記憶部121を参照し、入力された第1のキーワードを起点として、重視度情報のうち、意外性に基づいて特定される階層までにあるキーワード群を抽出する。設定部133は、抽出したキーワード群を第2のキーワード群に設定する(ステップS14)。設定部133は、第1のキーワードおよび第2のキーワード群を抽出部135に出力する。
抽出部135は、設定部133から第1のキーワードおよび第2のキーワード群が入力されると、書誌情報記憶部122を参照し、第1のキーワードと、第2のキーワード群とに対する合致度を書籍ごとに算出する(ステップS15)。
優先度算出部134は、受付部131から重視度情報が入力されると、売上情報記憶部124および書誌マスタ記憶部125を参照し、重視度情報に基づいて、書籍ごとの優先度を算出する(ステップS16)。優先度算出部134は、算出した書籍ごとの優先度を抽出部135に出力する。
抽出部135は、優先度算出部134から書籍ごとの優先度が入力されると、書籍ごとに合致度と優先度とに基づいて抽出用スコアを算出する(ステップS17)。抽出部135は、抽出用スコアを算出すると、書誌情報記憶部122を参照し、算出した抽出用スコアが所定以上の書籍の情報を抽出する(ステップS18)。抽出部135は、抽出した書籍の情報を出力制御部136に出力する。
出力制御部136は、抽出部135から抽出した書籍の情報が入力されると、入力された書籍の情報を含む出力画面を生成する。出力制御部136は、生成した出力画面を端末装置10に送信して出力し、端末装置10の図示しない表示部に表示させる(ステップS19)。これにより、情報出力システム1は、出力されるデータの意外性を高めることができる。すなわち、情報出力システム1は、全あらすじ情報から関連語辞書を生成して関連語も含めた選書が可能となるので、より曖昧度の高いテーマに対応する選書が可能となる。また、情報出力システム1は、関連語辞書に指定された幅や深さをもとに階層的にアクセスするので、関連語の参考度合いを変化させ、選書の出力結果における意外性の度合いをコントロールできる。さらに、情報出力システム1は、入力される単語数に応じて合致度を算出するアルゴリズムを切り替えたり、優先度と合致度とを合算できたりするので、作業者の求める選書の意外性に対応できる。
このように、情報出力システム1は、処理対象とする第1のキーワードの入力と、第1のキーワードとともに処理対象にする第2のキーワード群に含める範囲を特定する情報の入力とを受け付ける。また、情報出力システム1は、2つのキーワード間の関係の近さを示す値と対応付けてキーワード同士の階層的な関係を示す関連語データを記憶する第1の記憶部を参照し、第1のキーワードを起点として、範囲を特定する情報により特定される階層までにあるキーワード群を抽出して第2のキーワード群に設定する。また、情報出力システム1は、コンテンツごとにコンテンツに関する情報を要約情報として記憶する第2の記憶部を参照し、第1のキーワードと、第2のキーワード群とに対する合致度が所定以上のコンテンツの情報を抽出する。また、情報出力システム1は、抽出したコンテンツの情報の一覧を出力する。その結果、出力されるデータの意外性を高めることができる。
また、情報出力システム1では、コンテンツは、書籍である。また、情報出力システム1は、書籍ごとに書籍に関する情報を書誌情報として記憶する第2の記憶部を参照し、第1のキーワードと、第2のキーワード群とに対する合致度が所定以上の書籍の情報を抽出する。その結果、選書の出力結果として出力されるデータの意外性を高めることができる。
また、情報出力システム1は、さらに、第1のキーワードの入力を受け付けると、キーワードごとに複数の所定の項目に関する度合を示す値を記憶する第3の記憶部を参照し、第1のキーワードを含んだ複数のキーワードのそれぞれについて対応付けて記憶されている値を読み出し、読み出した値に基づいて、第1のキーワードを含んだ各キーワード間の関係の近さを示す値を算出する。また、情報出力システム1は、算出した関係の近さを示す値に基づいて、第1のキーワードと関係を有する他のキーワードとの階層的な関係を生成する。また、情報出力システム1は、生成した階層的な関係を、関連語データとして第1の記憶部に出力する。その結果、最小限の関連語データに基づく関連語辞書を参照するので、選書の処理時間を短縮できる。
また、情報出力システム1では、第1のキーワードは、複数のキーワードを含む第1のキーワード群である。また、情報出力システム1は、第1のキーワード群と、第2のキーワード群とに示されるキーワードの数に応じて、合致度が所定以上のコンテンツの情報の抽出の仕方を切り替える。その結果、キーワードの数に応じて適切な抽出の仕方を取ることができる。
また、情報出力システム1は、複数種類の抽出の仕方のそれぞれで、合致度が所定以上のコンテンツの情報を抽出する。また、情報出力システム1は、複数種類の抽出の仕方のそれぞれによる抽出の結果を合せて出力する。その結果、作業者に対して抽出の仕方に応じた出力結果を提示できる。
また、情報出力システム1は、合致度に、売上重視度、著者人気重視度、ジャンル、および、日付のうち1つ以上に基づいて算出されたコンテンツごとの優先度を足し合わせたスコアが所定以上のコンテンツの情報を抽出する。その結果、これらの項目をどの程度参考にするかを設定できる。
また、上記実施例では、作業者として書店の店員を挙げたが、これに限定されない。例えば、各書店に書籍を配本する出版取次が、書店に対して書籍を提案する際に用いてもよい。
また、上記実施例では、コンテンツの一例として、書籍を挙げて説明したが、コンテンツは、これに限定されない。例えば、コンテンツとして、書籍以外の商品でもよいし、WebサイトやコールセンタのログまたはQ&A検索等に対して適用してもよい。Webサイトの場合には、Web記事をそのまま要約情報として用いてもよい。著者人気としては、Webサイトの記事執筆者に対するフォロー読者数を利用してもよい。売上としては、PV(Page View)数を利用してもよい。日付としては、Webページの公開年月日等を用いることができる。つまり、Webサイトの場合には、Web記事や商品に対するタグ付与、および、新たな軸での分類等を行うことができる。コールセンタの場合には、問い合わせ情報やQ&Aに基づく要約情報を用い、重視度情報として、アクセス回数、問い合わせ年月日等を用いることができる。つまり、コールセンタの場合には、曖昧度の高いキーワードでの検索を行って、参照する問い合わせ情報やQ&Aを絞り込むことができる。
また、図示した各部の各構成要素は、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各部の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、受付部131と算出部132とを統合してもよい。例えば、記憶部120に記憶されているデータの全部または一部を、サーバ100と通信可能に接続されている他のコンピュータの記憶部に格納させてもよい。また、図示した各処理は、上記の順番に限定されるものではなく、処理内容を矛盾させない範囲において、同時に実施してもよく、順序を入れ替えて実施してもよい。
さらに、各装置で行われる各種処理機能は、CPU(またはMPU、MCU(Micro Controller Unit)等のマイクロ・コンピュータ)上で、その全部または任意の一部を実行するようにしてもよい。また、各種処理機能は、CPU(またはMPU、MCU等のマイクロ・コンピュータ)で解析実行されるプログラム上、またはワイヤードロジックによるハードウェア上で、その全部または任意の一部を実行するようにしてもよいことは言うまでもない。
ところで、上記の各実施例で説明した各種の処理は、予め用意されたプログラムをコンピュータで実行することで実現できる。そこで、以下では、上記の各実施例と同様の機能を有するプログラムを実行するコンピュータの一例を説明する。図14は、情報出力プログラムを実行するコンピュータの一例を示す図である。
図14に示すように、コンピュータ200は、各種演算処理を実行するCPU201と、データ入力を受け付ける入力装置202と、モニタ203とを有する。また、コンピュータ200は、記憶媒体からプログラム等を読み取る媒体読取装置204と、各種装置と接続するためのインタフェース装置205と、他の情報処理装置等と有線または無線により接続するための通信装置206とを有する。また、コンピュータ200は、各種情報を一時記憶するRAM207と、ハードディスク装置208とを有する。また、各装置201〜208は、バス209に接続される。
ハードディスク装置208には、図1に示した受付部131、算出部132、設定部133、優先度算出部134、抽出部135および出力制御部136の各処理部と同様の機能を有する情報出力プログラムが記憶される。また、ハードディスク装置208には、関連語辞書記憶部121、書誌情報記憶部122、単語情報記憶部123、売上情報記憶部124、書誌マスタ記憶部125、および、情報出力プログラムを実現するための各種データが記憶される。入力装置202は、例えば、コンピュータ200の管理者から操作情報等の各種情報の入力を受け付ける。モニタ203は、例えば、コンピュータ200の管理者に対して出力画面等の各種画面を表示する。インタフェース装置205は、例えば印刷装置等が接続される。通信装置206は、例えば、図1に示した通信部110と同様の機能を有しネットワークNと接続され、端末装置10と各種情報をやりとりする。
CPU201は、ハードディスク装置208に記憶された各プログラムを読み出して、RAM207に展開して実行することで、各種の処理を行う。また、これらのプログラムは、コンピュータ200を図1に示した受付部131、算出部132、設定部133、優先度算出部134、抽出部135および出力制御部136として機能させることができる。
なお、上記の情報出力プログラムは、必ずしもハードディスク装置208に記憶されている必要はない。例えば、コンピュータ200が読み取り可能な記憶媒体に記憶されたプログラムを、コンピュータ200が読み出して実行するようにしてもよい。コンピュータ200が読み取り可能な記憶媒体は、例えば、CD−ROMやDVDディスク、USB(Universal Serial Bus)メモリ等の可搬型記録媒体、フラッシュメモリ等の半導体メモリ、ハードディスクドライブ等が対応する。また、公衆回線、インターネット、LAN等に接続された装置にこの情報出力プログラムを記憶させておき、コンピュータ200がこれらから情報出力プログラムを読み出して実行するようにしてもよい。
以上、本実施例を含む実施の形態に関し、さらに以下の付記を開示する。
(付記1)処理対象とする第1のキーワードの入力と、前記第1のキーワードとともに処理対象にする第2のキーワード群に含める範囲を特定する情報の入力とを受け付ける受付部と、
2つのキーワード間の関係の近さを示す値と対応付けてキーワード同士の階層的な関係を示す関連語データを記憶する第1の記憶部を参照し、前記第1のキーワードを起点として、前記範囲を特定する情報により特定される階層までにあるキーワード群を抽出して前記第2のキーワード群に設定する設定部と、
コンテンツごとに前記コンテンツに関する情報を要約情報として記憶する第2の記憶部を参照し、前記第1のキーワードと、前記第2のキーワード群とに対する合致度が所定以上のコンテンツの情報を抽出する抽出部と、
抽出した前記コンテンツの情報の一覧を出力する出力制御部と、
を有することを特徴とする情報出力システム。
(付記2)前記コンテンツは、書籍であり、
前記抽出部は、前記書籍ごとに前記書籍に関する情報を書誌情報として記憶する前記第2の記憶部を参照し、前記第1のキーワードと、前記第2のキーワード群とに対する合致度が所定以上の書籍の情報を抽出する、
ことを特徴とする付記1に記載の情報出力システム。
(付記3)さらに、前記第1のキーワードの入力を受け付けると、キーワードごとに複数の所定の項目に関する度合を示す値を記憶する第3の記憶部を参照し、前記第1のキーワードを含んだ複数のキーワードのそれぞれについて対応付けて記憶されている前記値を読み出し、読み出した前記値に基づいて、前記第1のキーワードを含んだ各キーワード間の関係の近さを示す値を算出する算出部と、
算出した前記関係の近さを示す値に基づいて、前記第1のキーワードと関係を有する他のキーワードとの階層的な関係を生成する生成部と、
を有し、
前記出力制御部は、生成した前記階層的な関係を、前記関連語データとして前記第1の記憶部に出力する、
ことを特徴とする付記1または2に記載の情報出力システム。
(付記4)前記第1のキーワードは、複数のキーワードを含む第1のキーワード群であり、
前記抽出部は、前記第1のキーワード群と、前記第2のキーワード群とに示されるキーワードの数に応じて、前記合致度が所定以上のコンテンツの情報の抽出の仕方を切り替える、
ことを特徴とする付記1〜3のいずれか1つに記載の情報出力システム。
(付記5)前記抽出部は、複数種類の抽出の仕方のそれぞれで、前記合致度が所定以上のコンテンツの情報を抽出し、
前記出力制御部は、前記複数種類の抽出の仕方のそれぞれによる抽出の結果を合せて出力する、
ことを特徴とする付記1〜4のいずれか1つに記載の情報出力システム。
(付記6)前記抽出部は、前記合致度に、売上重視度、著者人気重視度、ジャンル、および、日付のうち1つ以上に基づいて算出された前記コンテンツごとの優先度を足し合わせたスコアが所定以上のコンテンツの情報を抽出する、
ことを特徴とする付記2〜5のいずれか1つに記載の情報出力システム。
(付記7)処理対象とする第1のキーワードの入力と、前記第1のキーワードとともに処理対象にする第2のキーワード群に含める範囲を特定する情報の入力とを受け付け、
2つのキーワード間の関係の近さを示す値と対応付けてキーワード同士の階層的な関係を示す関連語データを記憶する第1の記憶部を参照し、前記第1のキーワードを起点として、前記範囲を特定する情報により特定される階層までにあるキーワード群を抽出して前記第2のキーワード群に設定し、
コンテンツごとに前記コンテンツに関する情報を要約情報として記憶する第2の記憶部を参照し、前記第1のキーワードと、前記第2のキーワード群とに対する合致度が所定以上のコンテンツの情報を抽出し、
抽出した前記コンテンツの情報の一覧を出力する、
処理をコンピュータが実行することを特徴とする情報出力方法。
(付記8)前記コンテンツは、書籍であり、
前記抽出する処理は、前記書籍ごとに前記書籍に関する情報を書誌情報として記憶する前記第2の記憶部を参照し、前記第1のキーワードと、前記第2のキーワード群とに対する合致度が所定以上の書籍の情報を抽出する、
ことを特徴とする付記7に記載の情報出力方法。
(付記9)さらに、前記第1のキーワードの入力を受け付けると、キーワードごとに複数の所定の項目に関する度合を示す値を記憶する第3の記憶部を参照し、前記第1のキーワードを含んだ複数のキーワードのそれぞれについて対応付けて記憶されている前記値を読み出し、読み出した前記値に基づいて、前記第1のキーワードを含んだ各キーワード間の関係の近さを示す値を算出し、
算出した前記関係の近さを示す値に基づいて、前記第1のキーワードと関係を有する他のキーワードとの階層的な関係を生成する、
処理をコンピュータが実行し、
前記出力する処理は、生成した前記階層的な関係を、前記関連語データとして前記第1の記憶部に出力する、
ことを特徴とする付記7または8に記載の情報出力方法。
(付記10)前記第1のキーワードは、複数のキーワードを含む第1のキーワード群であり、
前記抽出する処理は、前記第1のキーワード群と、前記第2のキーワード群とに示されるキーワードの数に応じて、前記合致度が所定以上のコンテンツの情報の抽出の仕方を切り替える、
ことを特徴とする付記7〜9のいずれか1つに記載の情報出力方法。
(付記11)前記抽出する処理は、複数種類の抽出の仕方のそれぞれで、前記合致度が所定以上のコンテンツの情報を抽出し、
前記出力する処理は、前記複数種類の抽出の仕方のそれぞれによる抽出の結果を合せて出力する、
ことを特徴とする付記7〜10のいずれか1つに記載の情報出力方法。
(付記12)前記抽出する処理は、前記合致度に、売上重視度、著者人気重視度、ジャンル、および、日付のうち1つ以上に基づいて算出された前記コンテンツごとの優先度を足し合わせたスコアが所定以上のコンテンツの情報を抽出する、
ことを特徴とする付記8〜11のいずれか1つに記載の情報出力方法。
(付記13)処理対象とする第1のキーワードの入力と、前記第1のキーワードとともに処理対象にする第2のキーワード群に含める範囲を特定する情報の入力とを受け付け、
2つのキーワード間の関係の近さを示す値と対応付けてキーワード同士の階層的な関係を示す関連語データを記憶する第1の記憶部を参照し、前記第1のキーワードを起点として、前記範囲を特定する情報により特定される階層までにあるキーワード群を抽出して前記第2のキーワード群に設定し、
コンテンツごとに前記コンテンツに関する情報を要約情報として記憶する第2の記憶部を参照し、前記第1のキーワードと、前記第2のキーワード群とに対する合致度が所定以上のコンテンツの情報を抽出し、
抽出した前記コンテンツの情報の一覧を出力する、
処理をコンピュータに実行させることを特徴とする情報出力プログラム。
(付記14)前記コンテンツは、書籍であり、
前記抽出する処理は、前記書籍ごとに前記書籍に関する情報を書誌情報として記憶する前記第2の記憶部を参照し、前記第1のキーワードと、前記第2のキーワード群とに対する合致度が所定以上の書籍の情報を抽出する、
ことを特徴とする付記13に記載の情報出力プログラム。
(付記15)さらに、前記第1のキーワードの入力を受け付けると、キーワードごとに複数の所定の項目に関する度合を示す値を記憶する第3の記憶部を参照し、前記第1のキーワードを含んだ複数のキーワードのそれぞれについて対応付けて記憶されている前記値を読み出し、読み出した前記値に基づいて、前記第1のキーワードを含んだ各キーワード間の関係の近さを示す値を算出し、
算出した前記関係の近さを示す値に基づいて、前記第1のキーワードと関係を有する他のキーワードとの階層的な関係を生成する、
処理をコンピュータに実行させ、
前記出力する処理は、生成した前記階層的な関係を、前記関連語データとして前記第1の記憶部に出力する、
ことを特徴とする付記13または14に記載の情報出力プログラム。
(付記16)前記第1のキーワードは、複数のキーワードを含む第1のキーワード群であり、
前記抽出する処理は、前記第1のキーワード群と、前記第2のキーワード群とに示されるキーワードの数に応じて、前記合致度が所定以上のコンテンツの情報の抽出の仕方を切り替える、
ことを特徴とする付記13〜15のいずれか1つに記載の情報出力プログラム。
(付記17)前記抽出する処理は、複数種類の抽出の仕方のそれぞれで、前記合致度が所定以上のコンテンツの情報を抽出し、
前記出力する処理は、前記複数種類の抽出の仕方のそれぞれによる抽出の結果を合せて出力する、
ことを特徴とする付記13〜16のいずれか1つに記載の情報出力プログラム。
(付記18)前記抽出する処理は、前記合致度に、売上重視度、著者人気重視度、ジャンル、および、日付のうち1つ以上に基づいて算出された前記コンテンツごとの優先度を足し合わせたスコアが所定以上のコンテンツの情報を抽出する、
ことを特徴とする付記14〜17のいずれか1つに記載の情報出力プログラム。