JP4949012B2 - 説明文章選択装置、説明文章選択方法、説明文章解析装置および説明文章解析方法 - Google Patents

説明文章選択装置、説明文章選択方法、説明文章解析装置および説明文章解析方法 Download PDF

Info

Publication number
JP4949012B2
JP4949012B2 JP2006353301A JP2006353301A JP4949012B2 JP 4949012 B2 JP4949012 B2 JP 4949012B2 JP 2006353301 A JP2006353301 A JP 2006353301A JP 2006353301 A JP2006353301 A JP 2006353301A JP 4949012 B2 JP4949012 B2 JP 4949012B2
Authority
JP
Japan
Prior art keywords
user
characteristic
selection
genre
abstraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006353301A
Other languages
English (en)
Other versions
JP2008165437A (ja
Inventor
貴子 福田
満広 浦
亮介 松岡
太美夫 百瀬
政博 浅尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Denso Ten Ltd
Fujitsu Advanced Engineering Ltd
Original Assignee
Denso Ten Ltd
Fujitsu Advanced Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Denso Ten Ltd, Fujitsu Advanced Engineering Ltd filed Critical Denso Ten Ltd
Priority to JP2006353301A priority Critical patent/JP4949012B2/ja
Publication of JP2008165437A publication Critical patent/JP2008165437A/ja
Application granted granted Critical
Publication of JP4949012B2 publication Critical patent/JP4949012B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

この発明は、ジャンル毎に分類された複数の対象物についてそれぞれ説明する複数の説明文章から利用者に提示する説明文章の候補を選択する説明文章選択装置、説明文章選択方法、またジャンル毎に分類された複数の対象物についてそれぞれ説明する複数の説明文章を解析する説明文章解析装置、説明文章解析方法に関し、特に利用者の選択傾向に沿った説明文章を選択する説明文章選択装置、説明文章選択方法、利用者の選択傾向を適切に分析するための説明文章解析装置および説明文章解析方法に関する。
近年、情報処理技術の向上とネットワーク基盤の普及によって、利用者が取得可能な情報は膨大な量となっている。そのため、利用者による情報選択を補助する技術が各種考案されている。
例えば、インターネットの検索エンジンでは、利用者が入力したキーワード(単語)と情報コンテンツとの一致検索を行なって、その単語が含まれるあらゆるジャンルの情報を検索結果として出力する。
ここで単独の単語で検索を行なうなどによって大量の検索結果が出力されると、利用者はキーワードの追加や変更によって検索操作を繰り返し、目的の情報を探すことになる。また、このキーワードの選択が適切でなければ、利用者が求める情報に辿り着けない場合も多い。
このようなキーワード検索における利用者の操作の煩雑さや目的の情報を探しきれない状況が発生する問題に対して、ユーザの嗜好を学習することで利用者に提示する情報を予めフィルタリングする技術も考案されている。
かかるフィルタリング手法では、例えばコンテンツ内の単語の発生頻度やキーワードによりコンテンツに対して特徴づけを行なって、その特徴で検索ができるように予め準備をするとともに、過去にその利用者が選択したコンテンツから特徴を抽出し、選択頻度の高い特徴を利用者の嗜好として学習し、学習した利用者の嗜好との一致度合いが高いコンテンツを利用者に提供することが行なわれている。
従来の技術の具体例として、例えば、特許文献1は、利用者に対する情報の提供回数を計数して情報の優先度を設定し、優先度の高い情報を選択して提供する技術を開示している。また、特許文献2は、利用者の興味があるキーワードと興味がないキーワードを登録し、広告に含まれるキーワードの頻度から利用者の嗜好を判定して情報を提供する技術を開示している。
特開2006−107136号公報 特開2001−134581号公報
しかしながら、同一の単語であってもジャンル毎に異なる意味で用いられる場合があり、選択可能なコンテンツ群からキーワードによって網羅的に検索を行なうと、利用者の嗜好とは異なる検索結果を大量に出力するという問題が生じる。
また、検索において特定のキーワードが存在するか否かで検索を行なうと、キーワードに類似した意味合いを持つ単語を含むコンテンツは、利用者の嗜好に近くとも出力から排除されるという問題がある。
そのため、検索に使用するキーワードと類似の意味を持つ単語をさらにキーワードに含める場合、ジャンルによる意味合いの差が検索結果に大きく影響を与える。例えば、ある画家の名前が量販店の名称として使われる場合、利用者が画家について検索しているのか、量販店について検索しているのかによってキーワードに含めるべき類似の単語は変化する。
従来の技術では、このようなジャンルに依存する単語の意味合いの違いを考慮していないために、利用者の嗜好の適切な解析を行なうことができず、特に利用者の選択傾向に沿った文章の選択を精度よく行なうことができないという問題点があった。
特に車両用の装置などのように安全上の観点から利用者の操作量低減が強く求められる場合には、かかる問題は重要であり、利用者の選択傾向を精度よく分析してその嗜好に合致した情報を提供できる技術の実現が必要とされていた。
本発明は、上述した従来技術における問題点を解消し、課題を解決するためになされたものであり、利用者の嗜好に合致した情報を提供できる説明文章選択装置、説明文章選択方法、また、利用者の嗜好を高精度に分析するための説明文章解析装置および説明文章解析方法を提供することを目的とする。
上述した課題を解決し、目的を達成するため、本発明に係る説明文章選択装置および説明文章選択方法は、ジャンル毎に分類された複数の対象物についてそれぞれ説明する複数の説明文章から単語を抽出し、当該単語から生成されて前記ジャンル内における対象物の位置付けを示す指標を抽象化特性として記憶する。そして、利用者が過去に選択した説明文章を選択履歴として記憶し、選択履歴として記憶された説明文章の抽象化特性を用いて、複数の説明文章から前記利用者に提示する説明文章の候補を選択する。
本発明によれば説明文章選択装置および説明文章選択方法は、ジャンル毎に分類された対象物の説明文章から、ジャンル内における対象物の位置付けを示す指標である抽象化特性を生成し、利用者の選択履歴の抽象化特性を用いて、複数の説明文章から利用者に提示する説明文章の候補を選択するので、利用者の嗜好に合致した情報を提供できる説明文章選択装置、説明文章選択方法を得ることができるという効果を奏する。
また、本発明によれば説明文章解析装置および説明文章解析方法は、ジャンル毎に分類された対象物の説明文章から単語を抽出し、抽出した単語を用いて説明文章を特徴付ける特性情報を抽出し、特性情報を抽象化してジャンル内における対象物の位置付けを示す指標である抽象化特性を生成するので、利用者の嗜好を高精度に分析するための説明文章解析装置および説明文章解析方法を得ることができるという効果を奏する。
以下に添付図面を参照して、この発明に係る説明文章選択装置、説明文章選択方法、説明文章解析装置および説明文章解析方法の好適な実施例について詳細に説明する。
まず、本発明における説明文章の解析について説明する。本発明では、ジャンル別に分類された対象物について説明する文章を解析の対象としている。例えば、車両用のナビゲーション装置において、利用者(すなわち運転者などの車両乗員)に対して「食事」、「レジャー」、「ショッピング」などのジャンルに分類された対象物を行き先の候補として提示する状況を想定している。
ここで、食事のジャンルに分類される対象物はレストラン、ラーメン屋などの飲食店であり、レジャーに分類される対象物は遊園地や公園、美術館などの施設、ショッピングに分類される対象物は店舗である。
さらに、ジャンルについては多層化してもよい。例えば、食事のジャンルの下に洋食、ラーメン、寿司、サンドイッチなどのジャンルを設ける、レジャーのジャンルの下に遊園地や美術館などを下層のジャンルとして設ける、などのようにしてもよい。
このようにジャンル分けされた対象物について説明する説明文章に対し、本発明では図1に示すように単語抽出を行なう。そして、抽出された単語を用いて、カテゴリと特性を作成する。
ここで、カテゴリとは説明文章の中で対象物について説明する項目や属性、特性はそのカテゴリにおける性質、特性などの情報である。例えば、対象物がある店舗であれば、説明する項目(カテゴリ)として、その店舗の規模や販売品目、営業時間、駐車場の有無などがあり、各項目(カテゴリ)の具体的な情報が特性となる。特性の内容は、説明文書の元のカテゴリの範囲内に収まるものとする。
また、特性から、カテゴリやジャンルを越えた性質や特性が得られる場合は、この情報を関連特性とする。そして、カテゴリ、特性、関連特性を特性抽出辞書として記憶する。
さらに、特性から、そのジャンル内において対象物の位置付けを示すことのできる指標、基準を作成し、これを抽象化特性として記憶する。ここで、抽象化特性においては元の単語とは異なる単語や語句であってよい。しかし、その内容は、説明文章の元のジャンルの範囲内に収まるものとする。
このようにして得られた抽象化特性を用い、本発明では、図2に示すように利用者の嗜好に合致した説明文章を選択する。まず、利用者が特定のジャンル内で過去に選択した説明文章を選択履歴として記憶し、選択履歴の説明文章から抽出した抽象化特性を選択傾向とする。
そして、同ジャンルからの情報提供を利用者が指示した場合、そのジャンルに含まれる複数の説明文章について、各説明文章の抽象化特性と選択傾向を比較する。この時、各説明文章について、その説明文章が有する抽象化特性のうち、選択傾向と一致する比率が所定値以上であるものを検索して選択する。
例えば、一致率が68%以上の説明文章を選択する場合、抽象化特性を5つ有する説明文章は、そのうちの4つ以上が選択傾向に含まれれば選択される。また、抽象化特性を2つ有する説明文章は、その両方が選択傾向に含まれれば選択され、抽象化特性を4つ有する説明文章は、そのうちの3つ以上が選択傾向に含まれれば選択される。
このように、検索を受ける側である説明文章の抽象化特性において選択傾向に含まれる比率を算出することで、文章が長く、多様な単語を含む説明文章が本来の文章の意味以上に高頻度に選択されることを防ぐことができる。
さらに理解を深めるため、カテゴリ、特性、関連特性、抽象化特性導出の目的・背景について詳しく説明する。
ユーザに対して、その嗜好に合致した情報を自動的に検索して提示する場合、ユーザがよく選択する説明文章中に出現した単語(キーワード)とその出現回数を記録・学習し、その学習結果をキーに文章検索を行なう手法では、単語(キーワード)が大量に抽出されてしまうという第1の問題と、同じ特徴を持つ対象物であっても説明文章中に同じ単語が出現しないとヒットできなくなるという第2の問題がある。
これらの問題を解決するため、説明文章中に現れた単語(キーワード)を記録・学習するのではなく、その対象物の特徴を記録・学習することとした。これによって記録・学習する単語をその対象物の特徴を説明する単語に絞ることができ、記録・学習する単語を大幅に減らすことができた。
しかし、対象物の特徴を表現する単語は、似た特徴であっても説明文章により(人により)様々に表現されており、説明文章中の単語をそのまま記録・学習しても、上で述べた第2の問題は解決できない。
そこで、対象物の特徴を様々に表現している単語を、特性抽出辞書を使って共通化した単語(表現)に変換し、記録・学習、文章検索を行なうものとした。
これにより、第2の問題はある程度は解決できたが、カテゴリと特性の抽出だけでは、基本的には説明文章中の単語を共通化しただけであり、第2の問題に対する根本的な解決には至らない。具体的には、次の問題点が明確になった。
ある程度学習ができているにも関わらず、特性だけでは殆どヒットできない場合がある。
ヒットできても、その説明文章を見ると学習結果とは異なる違和感のある説明文章が検索される場合がある。これは、学習した特性を実装してはいるが、フレーズ中に出現した複数の特性から連想されるイメージが、学習結果とは異なっていることに起因していた。
そこで、さらに関連特性を追加して定義すると、ヒットできないという問題は解決できた。しかし、逆に絞込みができないという問題も発生した。関連特性は、例えば後述するような南フランス、乳加工品など、非常に幅広く定義するものであり、関連特性を用いることでヒットしないという状況は回避できても、特性が1つも一致しないにも関わらず関連特性だけでヒットしてしまい、絞込み、ソートができないという問題が発生した。
また、ヒットした説明文章のフレーズ中に出現した特性から連想されるイメージが学習結果とは異なり、違和感のある対象物を検索してしまうという点に対しては、関連特性の追加では解決にならない。
すなわち、フレーズ全体を人間が読んだときに連想される対象物(特徴)のイメージを記録・学習し、そのイメージで検索・絞込みを行なわないと、上記の問題点の解決には至らない。
しかし、当然に人間が連想するイメージそのものを機械化することはできないので、人間が連想するイメージと同等なレベルでの機械的な代替手段として、抽象化特性を導出した。なお、ユーザに提示するのは検索結果であって、イメージを代替した抽象化特性を提示する必要はない。イメージと同等のレベルで記録・学習でき、その学習結果で検索・絞込みができれば、ユーザが連想するイメージと抽象化特性の内容が異なってもなんら問題はない。
以上のように、抽象化特性、すなわち「対象物のこの特徴は、このジャンル内において、この指標、基準上でここに位置する。」という観点でその対象物の特徴を抽象化する特性を導出した。これにより、様々に表現される特徴をジャンル内での位置付けという基準で集約することが可能となり、その抽象化・集約結果で学習・検索することで、「だいたいイメージが似たもの」を最初にピックアップすることが可能となった。
また、最初に「だいたいイメージの似たもの」をピックアップし、その中で「特性」「関連特性」でさらに絞込みやソートを行なうことで、「非常に似たもの」の抽出が可能となった。
すなわち、本発明では、人間の連想するイメージを機械的に代替する手段として抽象化特性を導出し、これを学習・検索することでユーザの嗜好を高精度に分析し、その嗜好に合致した情報を検索して提供することができる。
つづいて、図3を参照し、本発明の実施例である説明文章選択装置1の概要構成を説明する。同図に示すように、説明文章選択装置1は、その内部に対象物登録部11、対象物記憶部12、対象物データベース13、情報検索提供部14、ユーザインターフェース部15、嗜好学習部16、履歴データベース17、ユーザ嗜好データベース18を有する。
対象物登録部11は、対象物についての説明文章の入力を受け付け、その文章データを対象物記憶部12に登録するとともに、説明文章より特性抽出辞書、抽象化特性抽出辞書、検索用インデックスを作成して対象物データベース13に登録する処理を行なう。
ユーザインターフェース15は、ユーザ(利用者)からの操作入力受付、およびユーザに対する情報出力を行なう装置群であり、具体的にはスイッチやタッチパネル、ディスプレイなどによって実現され、ユーザからの情報要求、情報確認、情報選択に使用される。
嗜好学習部16は、ユーザが選択した対象物(説明文章)の番号を取得し、履歴データベース17に情報選択履歴として記録し、必要に応じて取得する。また、情報選択履歴に示された説明文章から選択傾向および共通化嗜好を作成し、ユーザ嗜好データベース18に記録する。
情報検索提供部14は、ユーザ嗜好データベース18の記録内容を用いて、対象物データベース13を検索し、ユーザに提示する説明文章の候補を選択する。そして、選択した説明文章の候補の文章データを対象物記憶部12から読み出し、検索情報としてユーザに提供する。
つづいて、図4を参照し、特性抽出辞書と抽象化特性辞書の作成について具体例を挙げて説明する。まず、ジャンルが「サンドイッチ」、対象物が「ハムサンド」で説明文章が「当店のハムサンドは、バターの香りがして具にはハムとレタスが入っている」である場合について考える。
この説明文章に対し、対象物登録部11は、単語の抽出を行なう。抽出する単語は、単語を単独で行なっても良いし、複数の単語の組み合わせを語句として抽出しても良い。ただし複数の単語を語句として抽出する場合、係り受け関係にある単語の組合せとする。また、対象物の説明文章を前提としているので、ここでは否定表現のフレーズは無条件に除外する。
文章中から単語を抽出する形態素解析技術、フレーズの抽出、係り受け関係および否定表現の解析といった構文解析技術については、既存の技術を用いればよい。
同図に示した例では、説明文章から「バターの香り」という語句、「具」−「ハム」という単語の組み合わせ、「具」−「レタス」という単語の組み合わせが得られている。
語句「バターの香り」は、対象物の香りという項目について説明しているので、この語句のカテゴリは「香り」、特性は「バターの香り」である。ここで、特性を「バター」とせずに「バターの香り」としているのは、特性をジャンルおよびカテゴリの範囲内に納めるためである。
すなわち、ここで説明文章が説明しているのは、対象物であるハムサンドの香りという項目についてのみであり、バターの使用量などとは関係が無い。極端に言えば、実際にバターを使っているかどうかにも無関係である。そこで特性が示す情報をカテゴリの範囲内に納めるように、特性の内容を決定している。
一方で、バターの香りを好む利用者は、実際にはバター自体も好んでいる可能性が高く、また、乳加工品全体を好んでいる可能性も有る。そこで、特性からジャンルやカテゴリを越えて設定する関連特性として、「バター」および「乳加工品」を設定している。
つぎに、「具」−「ハム」という単語の組み合わせ、「具」−「レタス」という単語の組み合わせは、対象物の具という項目について説明しているので、これらのカテゴリは「具」、特性はそれぞれ「具はハム」、「具はレタス」である。
特性については既に説明したようにカテゴリの範囲内に収まるように設定している。また単語「具」、「ハム」、「レタス」を単独ではなく組み合わせて使ったのは、ジャンル(ここではサンドイッチ)の範囲内に収まるようにするためである。すなわち、ジャンルがサンドイッチである以上、具は必ず存在するのであり、「具」という単語を単独で使用してもユーザの嗜好を示すことはできない。また、「ハム」「レタス」については、ここではサンドイッチの具としての対象であるので、ハム全般、レタス全般と区別するべく、「具」と組み合わせて使用している。
そして、ジャンルやカテゴリを越える「ハム」や「豚肉加工品」、「レタス」や「葉野菜」などの単語は、関連特性として設定している。
このように、特性抽出辞書に格納された特性は、対象物のあるカテゴリについてその性質や特性を説明しており、関連特性は、カテゴリやジャンルを越えて、例えば人間がある言葉や物から連想するように、関連する性質や特性を指定している。
つぎに、抽象化特性辞書では説明文章中に出現した単語から様々に抽出した特性を、抽象化して集約することを目的とし、そのジャンル内での対象物の位置付けを示すことのできる指標、基準を指定する。
抽象化特性の作成時には、1もしくは複数の特性を指定し、カテゴリや関連特性を補助的に使用して、理解・連想される当該ジャンルにおける対象物の位置付けを設定する。
図4に示した例では、「具はハム」「具はレタス」という特性から、「低カロリー/高カロリー」という指標、基準を用いて対象物の抽象化特性を「低カロリーのサンドイッチ」とした。
ここで、抽象化特性を作成する場合には、抽象化特性がジャンルの範囲内に収まるようにすること、対象物を特定するような固有名詞のようなキーワードは使用しないこと、を条件とする必要がある。
これは、抽象化特性をジャンル内でのユーザの嗜好、選択傾向の分析に用いるために必要な条件である。抽象化特性をジャンル内に限定することで、同一の単語が異なるジャンルで異なる意味に用いられている場合であってもユーザの嗜好を高精度に分析することができる。また、固有名詞のようにジャンル内で対象となる説明文章が特定される抽象化特性では、ユーザの嗜好の分析には使えないため、ジャンル内に含まれる全ての対象物が有する性質についての指標であることが望まれる。
これまで説明した対象物、ジャンル、対象物の説明文章の特徴を示す特徴要素(カテゴリ、特性、関連特性、抽象化特性)の相関を図5に示す。同図に示すように、対象物はジャンルX,Yのいずれかに必ず属している。
そして、カテゴリおよび特性については、特性は常にカテゴリに内包され、対象物はカテゴリに内包された特性に紐づけられている。また、カテゴリおよび特性は、ジャンル内に含まれる場合と、ジャンル外に存在する場合がある。
関連特性は、カテゴリ範囲外の特性であるため、カテゴリの外側となる。また、関連特性はジャンル範囲内の場合と、ジャンル外に存在する場合がある。
抽象化特性は、ジャンル範囲内で抽出されるので、ジャンルに内包される。また、抽象化特性は、必ず1または複数の特性と紐づく。さらにカテゴリや関連属性が紐づく場合もある。
また、ジャンル範囲外の関連特性、カテゴリおよび特性は複数のジャンル間で共通の場合がある。
つづいて、ユーザ嗜好の学習について説明する。説明文章選択装置1では、あるジャンルにおいてユーザが過去に選択した対象物の説明文章より、「特性抽出辞書」、「抽象化特性抽出辞書」を介し抽出した対象物の特性を、「選択傾向」としてその選択回数とともに記録する。この選択傾向が、対象のジャンルにおけるユーザ嗜好の学習結果となる。
ここで、ユーザが過去に選択した対象物の全ての説明文章から選択傾向を記録すると、ユーザ嗜好が変化した場合であっても変化前の嗜好が反映され続け、変化後のユーザの嗜好とは乖離した説明文章を選択する可能性がある。
そこで嗜好学習部16は、ユーザが選択した説明文章を、ジャンルごとに直近10件分を情報選択履歴として記録し、この10件の対象物の説明文章から抽出される特徴要素とその選択回数を選択傾向として記録する。なお、ここでは10件分を記録する場合について説明するが、この値は適宜変更することができ、またジャンル毎に異なる値としてもよい。
図6に情報選択履歴の具体例を示す。同図では、ジャンルごと(例えばレストランなど)にユーザが選択した対象物の説明文章を識別できる番号(対象物番号)と、その説明文章を選択した時刻を記録している。
また、図7は、選択傾向の具体例を示す図である。同図では、ジャンルごと(例えばサンドイッチなど)にカテゴリ、特性、関連特性、抽象化特性のそれぞれについて選択された内容とその選択回数を記録している。
さらに選択傾向において、複数のジャンル間で共通するカテゴリ、特性、関連特性については、ユーザがジャンルを超えて高い頻度で選択するキーワードと捉えることができるので、嗜好学習部16は、図8に示すように複数のジャンル間で共通するカテゴリ、特性、関連特性を共通化嗜好として記録する。
つづいて、ユーザ嗜好に合致した情報の選択について説明する。ユーザ嗜好に合った情報提供では、ユーザ嗜好の学習で記録した選択傾向に基づいて、予め情報提供を目的に準備した説明文章から対象物の絞込検索を行ない、絞り込んだ対象物の説明文章を情報として提供する。
選択傾向では、複数の抽象化特性が過去の選択回数とともに記録されている。この選択傾向における抽象化特性について全出現回数の所定比率、例えば上位68%(1シグマ)内の抽象化特性を、そのユーザがそのジャンルにおいてよく選択する抽象化特性として選出する。
例えば、図9に示した例では、全出現回数が19回であり、このうち68%にあたる13回までの抽象化特性、「西洋の絵画」、「西洋の美術品」、「日本画」、「浮世絵」を選出している。
つぎに、選出した抽象化特性により絞込みを行なう。このとき、選出した抽象化特性がどの対象物に含まれているかといった単純な一致検索を行なうのではなく、既に述べたように検索対象の説明文章から抽出した抽象化特性のうちどれだけが選択傾向から抽出した抽象化特性と一致するかによって絞り込む。
一般的に、100〜200文字程度の説明文章から数個(2〜5個程度)の抽象化特性が得られる。この数個の抽象化特性のうち、何割が選択傾向から選出した抽象化特性と一致するかを説明文章ごとで調査し、例えば7割以上一致する説明文章に絞り込む。
このような手法を用いることで、例えば検索対象の説明文章から得られた抽象化特性のうち一つだけが一致して、他の抽象化特性は一致しないような説明文章をはじくことができる。
この説明文章の絞込みの具体例を図10に示す。同図は、選択傾向の上位68%に「西洋の絵画」、「西洋の美術品」、「日本画」、「浮世絵」が含まれ、説明文章A〜Cから抽象化特性が6割以上一致するように絞り込む場合を示している。
説明文章Aは、抽象化特性として「西洋の絵画」、「西洋の美術品」、「中国の古美術」3つを有し、このうちの2つ「西洋の絵画」と「西洋の美術品」が選択傾向と一致するので一致率は6割を超える。また、説明文章Bは、抽象化特性として「日本画」「浮世絵」の2つを有し、双方が抽象化特性と一致するので一致率は100%である。しかし説明文章Cは、「江戸の文化」「浮世絵」「歌舞伎」「日本の歴史」の4つの抽象化特性のうち、選択傾向と一致するのは「浮世絵」の一つのみで一致率は25%である。従って、この例では説明文章Cがはじかれることとなる。
ところで、説明文章Aの一致率は66%、説明文章Bの一致率が100%であり、一致率は説明文章Bの方が高いが、実際に一致している抽象化特性は選択傾向の中でも選択頻度の低いものであり、実際の内容は説明文章Aの方が説明文章Bに比してユーザの嗜好に近いと考えられる。
そこで、さらに各選択文章とユーザ嗜好との類似度を得点化し、類似度の高い順に情報を提供する。
ユーザの選択傾向には、複数のカテゴリ、特性、関連特性が選択回数とともに記録されている。類似度の算出では、抽象化特性に加え、これらの特徴要素を用いる。これらのカテゴリ、特性、関連特性についても抽象化特性と同様に、それぞれ全出現回数の上位68%を選出する。
類似得点の算出では、図11に示すように検索対象である説明文章の特徴要素(抽象化特性、カテゴリ、特性、関連特性)が選択傾向から選出した特徴要素と一致した場合に、その選択傾向の選択回数を得点として計数し、各特徴要素の計数結果に重み付けをして合計した値を類似得点とする。
重み付けを行なうことで、説明文章から抽出される特徴要素の出現率の違いを吸収することができる。一般的な文章では、抽象化特性、カテゴリ、関連特性は概ね同数が抽出されるが、特性は抽象化特性、カテゴリ、関連特性の5〜6倍検出され、さらに特性はジャンル範囲外の場合もある。そこで特性の重みを他に比して下げ、ジャンル範囲内に限定されている抽象化特性の重みを上げることで、抽象化特性、カテゴリ、特性、関連特性から得られた計数結果を適切に合計することができる。
なお、重み付けの具体的な値は、適宜設定可能とし、特にジャンルごとに異なる値を設定することができるようにすることが望ましい。
つぎに、類似得点からの類似度の算出について図12を参照して説明する。類似度の算出では、まず選択傾向から選出した特徴要素(抽象化特性、カテゴリ、特性、関連特性)を一つの対象物と見なして類似得点を算出する。これは選択傾向に対して選択傾向自身の類似得点を算出することであり、当然に最高得点となる。この選択傾向の類似得点に対する、検索対象である説明文章の類似得点の割合を、その説明文章の類似度とする。
このように類似得点から類似度を算出することで、選択傾向から選出した抽象化特性、カテゴリ、特性、関連特性の数への依存を排除し、汎用性の高い判断基準として類似度を算出することができる。
以上説明したように、ユーザの選択履歴があるジャンル、すなわち学習済みのジャンルについてはユーザから情報提供を要求された場合、過去の選択傾向から選出した抽象化特性で同ジャンルの説明文章を絞り込み、その後、特徴要素(抽象化特性、カテゴリ、特性、関連特性)によって類似度を算出して類似度の高い上位N件を情報提供することで、ユーザの嗜好に合致した説明文章を提示することができる。なお、ここでのNの値は、システム環境やユーザニーズに合わせて適宜変更することができる。
つぎに、ユーザの選択履歴がない、もしくは選択履歴の数が不十分なジャンル、すなわち未学習のジャンルについて情報提供を行なう場合について説明する。ユーザから未学習のジャンルに対する情報提供を要求された場合、説明文章選択装置1は、ジャンル間で共通の内容である共通化嗜好に基づいて、図13に示すように未学習のジャンルにおけるユーザの嗜好を類推し、説明文章の絞込み・情報提供を行なう。
具体的には、まず、選択傾向からの抽象化特性、カテゴリ、特性、関連特性の選出と同様に、共通化嗜好から選択回数が上位68%以内のカテゴリ、関連特性、特性を選出する。
そして、共通化嗜好から選出した特徴要素(カテゴリ、特性、関連特性)が含まれている対象物(説明文章)に絞り込み、さらに特徴要素(カテゴリ、関連特性、特性)から共通化嗜好に対する類似度を算出し、類似度の高い順にソートして情報提供する。
共通化嗜好に対する類似度の算出は、選択傾向に対する類似度の算出と同様に行なう。但し、共通化嗜好には抽象化特性が含まれないため、カテゴリ、特性、関連特性で類似度を算出することとなる。
このように、共通化嗜好を用いてユーザの嗜好を類推することで、未学習のジャンルに対してもユーザの嗜好に合致した対象物を選択して提示することが可能となる。
また、さらなる情報提供の手法として、既に学習済みのジャンルについていつもとは違う情報提供を行なうこともできる。すなわち、ユーザの基本的な嗜好を守りつつ、過去にユーザに提供した情報とは異なる新たな情報を提供して、常に同一の情報が提示され続けることによるユーザの飽きを防ぎ、ユーザが興味を持つことのできる情報を提示する。
これを実現するため、まず選択傾向および共通化嗜好で対象物の絞込み(ピックアップ)を行なうことで、ユーザの基本的な嗜好に合致した対象物群を選んだ後、選択傾向に対する類似度が低い順に情報提供する。
これによって図14に示したように、学習済みのジャンル内において、ユーザの基本的な嗜好を守った対象物群Xaから選択傾向に対する類似度が高いいつもの情報に相当する対象物群Xbを除いた「いつもとちょっと違う情報」に相当する対象物群「Xa−Xb」を選んでユーザに提示することができる。
なお、対象物群Xaの絞込みにおいては、広範囲の対象物をピックアップするため、選択傾向および共通化嗜好において選択回数が1以上の特徴要素(カテゴリ、特性、関連特性、抽象化特性)を選出し、選出した特徴要素のうちいずれか一つが含まれている選択文章をピックアップすることが望ましい。
また、類似度の算出において、ユーザ嗜好に合致した情報提供では選択傾向の全出現回数の上位68%の抽象化特性、カテゴリ、特性、関連特性を選出したが、ここでは100%の抽象化特性、カテゴリ、特性、関連特性を選出する。これは68%の選出を行なうと、残りの32%に前回、前々回など比較的最近に提供した情報が含まれ、この情報を再度提示してしまう可能性があるためである。
かかる手法によれば、例えばグルメ情報の提供などで同一のメニューが表示されてユーザが飽きる、もしくはユーザが情報提示を求めなくなることを防ぐことができる。また、情報の選択履歴を所定回数のみ(例えば10件分)としているので、その回数を経過すると以前提示した情報が再度ピックアップされることとなり、「またあれが食べたい」といったニーズにも対応できる。
また、抽出される特徴要素が少ないジャンルなどでは、「いつもとちょっと違う情報」に相当する対象物群「Xa−Xb」がほとんど無いといった問題が考えられるが、いつもの情報に対応する対象物群Xbを除外するのではなく、提示する優先順位を落としているだけである。そのため、「Xa−Xb」が少ない場合にはいつもの情報(対象物群Xb)の中で選択頻度の低い特徴要素を持つ対象物がピックアップされてくることになり、特長要素が少ないジャンルにも対応できる。
一方で、抽出される特徴要素が多い場合、「いつもとちょっと違う情報」に相当する対象物群「Xa−Xb」が大きくなり、類似度の低い説明文章から提示するとユーザの嗜好から乖離しすぎる場合も考えられる。このような場合には、いつもの情報に対応する対象物群Xb以外で類似度の高いものを優先して提示するようにしても良い。
つづいて、情報検索提供部14による処理動作について説明する。図15は、学習済みジャンルからユーザ嗜好に合致した説明文章を提示する場合の処理動作を示すフローチャートであり、この処理動作はユーザからジャンルを指定されて情報提供の要求を受け、指定されたジャンルが学習済みでかつユーザから「いつもとちょっと違う情報」を求める指示が無い場合に開始される。
同図に示したように、情報検索提供部14は、まず、選択傾向から絞込に使用する抽象化特性(上位68%)を選出(ステップS101)し、選出した抽象化特性で対象物を絞り込む(ステップS102)。
つぎに、選択傾向から類似度の算出に使用する特徴要素(それぞれ上位68%)を選出し(ステップS103)、対象物毎に選択傾向に対する類似度を算出する(ステップS104)。
そして、算出した類似度の高い順にソートし(ステップS105)、上位N件の情報をユーザインターフェース部15に提供する(ステップS106)。
図16は、未学習ジャンルからユーザ嗜好に近い説明文章を提示する場合の処理動作を示すフローチャートであり、この処理動作はユーザからジャンルを指定されて情報提供の要求を受け、指定されたジャンルが未学習である場合に開始される。
同図に示したように、情報検索提供部14は、まず、共通化嗜好から絞込に使用する特徴要素(それぞれ上位68%)を選出(ステップS201)し、選出した特徴要素で対象物を絞り込む(ステップS202)。
つぎに、共通化嗜好から類似度の算出に使用する特徴要素(それぞれ上位68%)を選出し(ステップS203)、対象物毎に共通化嗜好に対する類似度を算出する(ステップS204)。
そして、算出した類似度の高い順にソートし(ステップS205)、上位N件の情報をユーザインターフェース部15に提供する(ステップS206)。
図17は、学習済みジャンルから「いつもと違う」説明文章を提示する場合の処理動作を示すフローチャートであり、この処理動作はユーザからジャンルを指定されて情報提供の要求を受け、指定されたジャンルが学習済みでかつユーザから「いつもとちょっと違う情報」を求める指示がある場合に開始される。
同図に示したように、情報検索提供部14は、まず、選択傾向および共通化嗜好から絞込に使用する特徴要素(上位100%)を選出(ステップS301)し、選出した特徴要素で対象物を絞り込む(ステップS302)。
つぎに、選択傾向から類似度の算出に使用する特徴要素(それぞれ100%)を選出し(ステップS303)、対象物毎に選択傾向に対する類似度を算出する(ステップS304)。
そして、算出した類似度の低い順にソートし(ステップS305)、上位N件の情報をユーザインターフェース部15に提供する(ステップS306)。
つづいて、対象物データベース13に格納される検索用インデックスについて説明する。説明文章選択装置1において検索用インデックスは、特徴要素から対象物の説明文章を検索する目的と、対象物から特徴要素を検索する目的の2つの目的で使用される。
この2つの目的の双方に使用可能とするため、検索用インデックスは図18に示すように特性抽出辞書と抽象化特性抽出辞書の行番号が、どの対象物の説明文章に含まれているか、具体的には、2つの辞書の行番号と対象物番号との一覧表として構成している。
そして、特徴要素から対象物の説明文章を検索する場合には、まず検索を行なう特徴要素が抽象化特性か否かを判断する。そして、抽象化特性である場合は、抽象化特性辞書のどの行に記述されているかを検索し、抽象化特性辞書の行番号(2XXX)を取得する。この時、行番号は複数取得される場合がある。
そして、取得した抽象化特性辞書の行番号をキーに検索用インデックスを検索し、対象の対象物番号を取得する。
一方、検索を行なう特徴要素が抽象化特性以外であった場合、その特性が特性抽出辞書のどの行に記述されているかを検索し、特性抽出辞書の行番号を取得する。ただし、この時の検索範囲は、キーと同一種類の特徴要素のみとする。すなわち、検索キーが関連特性であれば、特性抽出辞書の関連特性のみを対象に検索を行なう。
そして、特性抽出辞書の検索によって得られた行番号(1XXX)をキーに検索用インデックスを検索し、対象の対象物番号を取得する。
対象物から特徴要素を検索する場合、対象物番号で検索用インデックスを検索し、辞書行番号を取得する。ここでは、特性抽出辞書の行番号の先頭を1、抽象化特性抽出辞書の行番号の先頭を2としているので、取得した辞書行番号が1XXXであれば特性抽出辞書をその行番号で検索し、その行に記述されている各特徴要素を取得する。また、取得した辞書行番号が2XXXであれば抽象化特性抽出辞書をその行番号で検索し、その行に記述されている抽象化特性を取得する。
つづいて、嗜好学習部16の処理について説明する。嗜好学習部16は、ユーザが選択した対象物番号をユーザインターフェース部15から受け取り、受け取った対象物番号を情報選択履歴に記録する。この時、直近10件から選択傾向および共通化嗜好を記録するので、情報選択履歴が10件を越えた場合は最も古い履歴を消去する。
つぎに、嗜好学習部16は、情報選択履歴に示された対象物番号を全て取得し、この番号をキーに検索用インデックスを選択して辞書番号を取得する。そして、辞書番号で特性抽出辞書および抽象化特性抽出辞書を検索して特徴要素を取得し、選択傾向および共通化嗜好に選択回数とともに記録する。
つづいて、対象物登録部11の処理について説明する。対象物登録部11では、新たな対象物の説明文章について、検索用インデックスの登録を行なう。検索用インデックスには、既に説明したようにその説明文章から取得される辞書行番号を対象物番号とともに登録する。従って、新たな説明文章に新たな特徴要素が含まれていた場合は、その特性を特性抽出辞書や抽象化特性辞書に追加登録した上で、検索用インデックスに辞書行番号を登録することとなる。
この登録手順の詳細について、図19を参照して説明する。同図に示した対象物入力部は、新たに登録する対象物の説明文章の入力を受け付ける処理部である。この入力の受け付けは、具体的には例えば画面上に表示された文章をキーボードやマウスで選択する、その文章が格納されているファイル名を指定する、キーボードから文章入力する、などの任意の方法によって行なわれ、入力された説明文章には新たに対象物番号が付されて単語抽出部へ渡される。
単語抽出部は、対象物入力部より渡された新規の説明文章から単語を抽出する。具体的には、渡された説明文章のフレーズ単位に肯定表現か否定表現かを判断し、否定表現のフレーズは除外して肯定表現のフレーズから単語を抽出し、フレーズ単位で説明文章とともに特徴要素設定部に渡す。
特徴要素設定部では、抽出した単語で既存の辞書を検索し、検索結果として得られた各種特徴要素を表示する。また、辞書に登録されていなかった単語についても画面表示し、必要に応じて新たな特徴要素を入力する。
この特徴要素の設定について図20を参照してさらに説明する。同図に示した例では、ある美術館についての説明文章「この美術館では、ピカソやゴッホといった世界的に有名な絵画を展示すると共に、ロダンの彫刻も豊富に展示している、さらに江戸時代の浮世絵、東洋美術などの展示も揃え、見応え十分の美術館となっている。」を新規に入力した場合を示している。
この説明文章が入力されると、説明文章自体がまず画面表示される。そして、特性抽出辞書の各行単位に、単語抽出部より渡された単語群に対してフレーズ単位で一致検索を行なって、一致した特性抽出辞書の当該行に記述されている行番号、単語、ジャンル、カテゴリ、特性、関連特性を画面表示する。
また、単語抽出部から渡された単語で、特性抽出辞書に登録されていなかった単語も表示する。この場合、行番号、特徴要素は表示されない。
さらに、抽象化特性抽出辞書の行単位に、特性抽出辞書から抽出された特徴要素に対してフレーズ毎に一致検索を行ない、一致した抽象化特性辞書の当該行に記述されている行番号、特性、ジャンル、抽象化特性を画面表示する。
そして、既存の特性抽出辞書に登録されていなかった単語に対し、ユーザによる特徴要素(カテゴリ、特性、関連特性、抽象化特性)の入力を促し、入力された内容を辞書に登録して行番号を付す。また、辞書の内容変更に合わせて検索用インデックスについても更新する。
ここで、フレーズの一致検索の具体例について図21を参照して説明する。フレーズの一致検索では、特性抽出辞書(もしくは抽象化特性抽出辞書)から1行を取り出し、その行に記述されている単語を取り出す。この時、例えば単語TA−2,TA−3のように、同一行に複数の単語が記述されていれば、その全てを取得する。
一方で、単語抽出部から渡された単語群(この単語群はフレーズ単位で区切られている)。に対し、特性抽出辞書から取り出した単語が全て含まれているフレーズが内かをチェックする。全て含まれているフレーズが存在した場合、特性抽出辞書から取り出した当該行が一致したと判定する。この一致検索を特性抽出辞書の全行に対して実施する。
したがって、図21では、フレーズFAには行番号100101が一致し、フレーズFCには行番号100301が一致したと判定することとなる。
上述してきたように、本実施例にかかる説明文章選択装置1は、ユーザ嗜好の分析ターゲットをジャンルに分類された対象物について説明する説明文章に限定し、説明文章中の単語を解析することで、対象物の特徴を説明するカテゴリ、特性、関連特性、抽象化特性を特徴要素として抽出する。そのため、特徴要素と説明文章を対応付ける簡易な辞書でユーザ嗜好を高精度に分析し、ユーザ嗜好に合致した説明文章を選択して提示することができる。
また、対象となる文章から抽象化特性を抽出し、そのうちのどれだけがユーザの選択傾向に合致するかを判定することで、その説明文章がユーザ嗜好に合致するか否かを高精度に判断することができる。
さらに、基本的にユーザ嗜好に合致する説明文章に絞り込んだのち、ユーザの選択傾向への類似度を算出し、この類似度が高いものや低いものを優先的に提示するので、類似度が高いものを提示すればユーザ嗜好に高精度に適合する情報を、類似度が低いものを提示すればユーザがいつも選ぶ内容とは少し変化をつけた情報を、それぞれ提示することが可能である。
なお、本実施例は発明内容を説明するための一例に過ぎず、本発明はその構成や動作を適宜変更して実施することができることは言うまでもない。
たとえば、複数のユーザが使用する場合には、ユーザごとに情報選択履歴、選択傾向、共通化嗜好を記憶する必要がある。この場合、ユーザインターフェースにおいてユーザIDを入力させるなどの方法でユーザを識別すればよい。
また、説明文章自体は必ずしも装置内部に記憶する必要は無い。例えば、説明文章についてはネットワークアドレスなどを格納すると共に任意の説明文章を取得可能な手段を設け、必要に応じてその都度ネットワーク経由で取得するようにしてもよい。
また、本実施例ではユーザの嗜好に合致した説明文章を自動的に選択して提示する場合を説明したが、必要に応じてユーザが嗜好の学習結果を用いることなく手動で目的の説明文章を探すこともできる。その場合、例えばカテゴリを大分類、抽象化特性を小分類とみなして、ジャンルが指定された後カテゴリ、抽象化特性の順にメニュー形式で特徴要素を選択させて説明文章を絞りこめばよい。
なお、説明文章選択装置1は、例えば、カーナビゲーション装置等の車載装置や、パーソナルコンピュータ等の電子装置で構成されてもよいし、ユーザIF部を車載装置や電子装置のユーザIFで構成し、その他の構成を、サーバ等の車載装置や電子装置と通信可能な外部装置としてもよい。
以上のように、本発明にかかる説明文章選択装置、説明文章選択方法、説明文章解析装置および説明文章解析方法は、ユーザに提示する情報の自動選択に有用であり、特にユーザ嗜好に合致した対象物の説明文章の選択に適している。
本発明における説明文章の解析について説明する説明図である。 本発明における説明文章の選択について説明する説明図である。 本発明の実施例にかかる説明文章選択装置の概要構成を示す概要構成図である。 特性抽出辞書と抽象化特性辞書の作成について説明する説明図である。 対象物、ジャンル、特徴要素の関係について説明する説明図である。 情報選択履歴について説明する説明図である。 選択傾向について説明する説明図である。 共通化嗜好について説明する説明図である。 選択傾向からの抽象化特性選出について説明する説明図である。 説明文章の絞込みについて説明する説明図である。 類似得点の算出について説明する説明図である。 類似特典からの類似度の算出について説明する説明図である。 未学習のジャンルにおけるユーザ嗜好の学習について説明する説明図である。 いつもと違う情報の提示について説明する説明図である。 学習済みジャンルからユーザ嗜好に合致した説明文章を提示する場合の処理動作を説明するフローチャートである。 未学習のジャンルからユーザ嗜好に近い説明文章を提示する場合の処理動作を説明するフローチャートである。 学習済みのジャンルからいつもと違う説明文章を提示する場合の処理動作を説明するフローチャートである。 検索用インデックスについて説明する説明図である。 説明文章の新規登録について説明する説明図である。 特徴要因の登録について説明する説明図である。 フレーズの一致検索について説明する説明図である。
符号の説明
1 説明文章選択装置
11 対象物登録部
12 対象物記憶部
13 対象物データベース
14 情報検索提供部
15 ユーザインターフェース部
16 嗜好学習部
17 履歴データベース
18 ユーザ嗜好データベース18

Claims (9)

  1. ジャンル毎に分類された複数の対象物についてそれぞれ説明する複数の説明文章から単語を抽出し、当該単語から生成されて前記ジャンル内における対象物の位置付けを示す指標を抽象化特性として記憶する抽象化特性記憶手段と、
    用者が過去に選択した説明文章を対応する対象物のジャンル毎に選択履歴として記憶する選択履歴記憶手段と、
    前記選択履歴に対応する対象物の位置付けを示す抽象化特性であって前記抽象化特性記憶手段から抽出された抽象化特性を前記利用者の選択傾向として前記ジャンル毎に記憶する利用者嗜好記憶手段と、
    ジャンルが指定された情報提供の要求を前記利用者から受け付ける受付手段と、
    前記指定されたジャンルの対象物を説明する前記説明文章に対応する複数の抽象化特性のうち、前記利用者嗜好記憶手段に記憶され、かつ前記指定されたジャンルに対応する前記利用者の選択傾向と一致する抽象化特性の数または当該数の比率に基づいて、前記複数の説明文章から前記利用者に提示する説明文章の候補を選択する選択手段と、
    を備えたことを特徴とする説明文章選択装置。
  2. 前記選択手段は、前記利用者の選択傾向と一致する抽象化特性の数の比率が所定の比率以上である説明文章を利用者に提示する説明文章の候補として選択することを特徴とする請求項に記載の説明文章選択装置。
  3. ジャンル毎に分類された複数の対象物について説明する項目と当該項目における内容を対応付けた特性情報を、それぞれ対応する前記対象物を説明する説明文章に含まれる単語に関連付けて記憶する特性情報記憶手段と、
    前記選択履歴に対応する対象物について説明する項目と当該項目における内容を対応付けた特性情報を、前記説明文章から抽出された単語に基づいて前記特性情報記憶手段から抽出する特性情報抽出手段と、
    をさらに備え、
    前記利用者嗜好記憶手段は、前記選択履歴に対応する対象物について説明する項目および特性情報であって前記選択履歴から抽出された単語に基づいて前記特性情報記憶手段から抽出された項目および特性情報を前記選択履歴のジャンル毎に記憶し、
    前記選択手段は、前記利用者の選択傾向と一致する抽象化特性の数または当該数の比率に加え、さらに、前記指定されたジャンルに属し前記特性情報記憶手段に記憶された前記対象物に対応する複数の項目および特性情報のうち、前記選択履歴の項目および特性情報と一致する特性情報および項目の数または当該数の比率に基づいて、前記利用者に提示する説明文章の候補を選択する
    ことを特徴とする請求項1または2に記載の説明文章選択装置。
  4. 前記特性情報から前記項目および/または前記ジャンルの範囲を超えて対象物を特徴付ける関連特性がさらに作成され、前記選択手段は前記特性情報、前記関連特性、前記抽象化特性のうち少なくとも一つを用いて前記利用者に提示する説明文章を選択することを特徴とする請求項に記載の説明文章選択装置。
  5. 前記選択手段は、前記選択履歴のない、もしくは所定数以下のジャンルについて前記利用者に対して提示する説明文章の候補を選択する場合には、前記他ジャンルにおける選択履歴に示された説明文章の関連特性と選択対象であるジャンルの各説明文章における関連特性とを比較して類似度の高い説明文章を前記利用者に提示する説明文章の候補として選択することを特徴とする請求項に記載の説明文章選択装置。
  6. 前記選択手段は、前記選択履歴に基づいて前記利用者に提示する説明文章の候補を絞り込んだ後、前記選択履歴に示された前記利用者の選択傾向との類似度が低い説明文章を優先して前記利用者に提示する説明文章の候補を選択することを特徴とする請求項1〜のいずれか一つに記載の説明文章選択装置。
  7. ジャンル毎に分類された複数の対象物についてそれぞれ説明する複数の説明文章から単語を抽出し、当該単語から生成されて前記ジャンル内における対象物の位置付けを示す指標を抽象化特性として抽象化特性記憶手段へ記憶する抽象化特性記憶工程と、
    用者が過去に選択した説明文章を対応する対象物のジャンル毎に選択履歴として選択履歴記憶手段へ記憶する選択履歴記憶工程と、
    前記選択履歴に対応する対象物の位置付けを示す抽象化特性であって前記抽象化特性記憶手段から抽出された抽象化特性を前記利用者の選択傾向として前記ジャンル毎に利用者嗜好記憶手段へ記憶する利用者嗜好記憶工程と、
    ジャンルが指定された情報提供の要求を前記利用者から受け付ける受付工程と、
    前記指定されたジャンルの対象物を説明する前記説明文章に対応する複数の抽象化特性のうち、前記利用者嗜好記憶手段に記憶され、かつ前記指定されたジャンルに対応する前記利用者の選択傾向と一致する抽象化特性の数または当該数の比率に基づいて、前記複数の説明文章から前記利用者に提示する説明文章の候補を選択する選択工程と、
    を含んだことを特徴とする説明文章選択方法。
  8. ジャンル毎に分類された複数の対象物について説明する項目と当該項目における内容を対応付けた特性情報を、それぞれ対応する前記対象物を説明する説明文章に含まれる単語に関連付けて記憶する特性情報記憶手段と、
    ジャンル内における前記対象物の位置付けを示す指標を抽象化特性として前記特性情報に関連付けて記憶する抽象化特性情報記憶手段と、
    利用者から説明文章の入力を受け付ける受付手段と、
    前記受付手段によって受け付けた説明文章から単語を抽出する単語抽出手段と、
    前記単語抽出手段によって抽出された単語に関連付けられた特性情報を前記特性情報記憶手段から抽出する特性情報抽出手段と、
    前記特性情報抽出手段によって抽出された前記特性情報に関連付けられた抽象化特性を前記抽象化特性情報記憶手段から抽出する抽象化特性抽出手段と、
    を備えたことを特徴とする説明文章解析装置。
  9. 利用者から説明文章の入力を受け付ける受付工程と、
    前記受付工程によって受け付けた説明文章から単語を抽出する単語抽出工程と、
    ジャンル毎に分類された複数の対象物について説明する項目と当該項目における内容を対応付けた特性情報を、それぞれ対応する前記対象物を説明する説明文章に含まれる単語に関連付けて記憶する特性情報記憶手段から、前記単語抽出工程によって抽出された単語に関連付けられた特性情報を抽出する特性情報抽出工程と、
    ジャンル内における前記対象物の位置付けを示す指標を抽象化特性として前記特性情報に関連付けて記憶する抽象化特性情報記憶手段から、前記特性情報抽出工程によって抽出された前記特性情報に関連付けられた抽象化特性を抽出する抽象化特性抽出工程と、
    を含んだことを特徴とする説明文章解析方法。
JP2006353301A 2006-12-27 2006-12-27 説明文章選択装置、説明文章選択方法、説明文章解析装置および説明文章解析方法 Expired - Fee Related JP4949012B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006353301A JP4949012B2 (ja) 2006-12-27 2006-12-27 説明文章選択装置、説明文章選択方法、説明文章解析装置および説明文章解析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006353301A JP4949012B2 (ja) 2006-12-27 2006-12-27 説明文章選択装置、説明文章選択方法、説明文章解析装置および説明文章解析方法

Publications (2)

Publication Number Publication Date
JP2008165437A JP2008165437A (ja) 2008-07-17
JP4949012B2 true JP4949012B2 (ja) 2012-06-06

Family

ID=39694865

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006353301A Expired - Fee Related JP4949012B2 (ja) 2006-12-27 2006-12-27 説明文章選択装置、説明文章選択方法、説明文章解析装置および説明文章解析方法

Country Status (1)

Country Link
JP (1) JP4949012B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4524327B1 (ja) * 2009-03-25 2010-08-18 キャンバスマップル株式会社 情報検索装置、及び情報検索プログラム
JP5455997B2 (ja) * 2011-09-29 2014-03-26 株式会社東芝 営業管理システム及び入力支援プログラム
US9536001B2 (en) * 2012-11-13 2017-01-03 Microsoft Technology Licensing, Llc Intent-based presentation of search results

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002041670A (ja) * 2000-05-17 2002-02-08 Matsushita Electric Ind Co Ltd 情報推薦装置、及び情報推薦システム
JP2004070504A (ja) * 2002-08-02 2004-03-04 Hewlett Packard Co <Hp> 個人プロファイル情報に基づく情報検索方法及びシステム
JP4547596B2 (ja) * 2002-12-12 2010-09-22 ソニー株式会社 情報処理装置および情報処理方法、並びにプログラム
JP4671164B2 (ja) * 2004-11-11 2011-04-13 日本電気株式会社 文書クラスタリング装置、クラスタリング方法及びクラスタリングプログラム

Also Published As

Publication number Publication date
JP2008165437A (ja) 2008-07-17

Similar Documents

Publication Publication Date Title
US7783644B1 (en) Query-independent entity importance in books
US9836511B2 (en) Computer-generated sentiment-based knowledge base
KR101078864B1 (ko) 질의/문서 주제 범주 변화 분석 시스템 및 그 방법과 이를 이용한 질의 확장 기반 정보 검색 시스템 및 그 방법
JP5311378B2 (ja) 特徴語自動学習システム、コンテンツ連動型広告配信コンピュータシステム、検索連動型広告配信コンピュータシステム、およびテキスト分類コンピュータシステム、並びにこれらのコンピュータプログラムおよび方法
JP2000172701A (ja) 文書データ提供装置、文書データ提供システム、文書データ提供方法及び文書データを提供するプログラムを記録した記録媒体
US8983965B2 (en) Document rating calculation system, document rating calculation method and program
JP2003167914A (ja) マルチメディア情報検索方法、プログラム、記録媒体及びシステム
JPH09153066A (ja) 文書検索装置
JP3820878B2 (ja) 情報検索装置,スコア決定装置,情報検索方法,スコア決定方法及びプログラム記録媒体
JP4361526B2 (ja) 評判情報処理装置、評判情報処理方法、評判情報処理プログラム、及び記録媒体
JP5455232B2 (ja) 画像選定装置、方法及びプログラム
JP4949012B2 (ja) 説明文章選択装置、説明文章選択方法、説明文章解析装置および説明文章解析方法
JP2006134183A (ja) 情報分類方法及び装置及びプログラム及びプログラムを格納した記憶媒体
WO2014057965A1 (ja) フォレンジックシステムおよびフォレンジック方法並びにフォレンジックプログラム
JP3921837B2 (ja) 情報判別支援装置、情報判別支援プログラムを記録した記録媒体及び情報判別支援方法
JP2003157271A (ja) テキストマイニング装置および方法
JP2005128872A (ja) 文書検索システム及び文書検索プログラム
JP4009937B2 (ja) 文書検索装置、文書検索プログラム及び文書検索プログラムを記録した媒体
JP3693514B2 (ja) 文書検索・分類方法および装置
JP2002092004A (ja) 情報分類装置
CN111831884B (zh) 一种基于信息查找的匹配系统与方法
JP5368900B2 (ja) 情報提示装置、情報提示方法およびプログラム
JP2006286026A (ja) 意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラム
JP4134975B2 (ja) 話題文書提示方法及び装置及びプログラム
JP7238411B2 (ja) 情報処理装置及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20091001

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111202

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111220

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120306

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120307

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150316

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4949012

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees