JP4368336B2 - カテゴリ設定支援方法及び装置 - Google Patents

カテゴリ設定支援方法及び装置 Download PDF

Info

Publication number
JP4368336B2
JP4368336B2 JP2005204192A JP2005204192A JP4368336B2 JP 4368336 B2 JP4368336 B2 JP 4368336B2 JP 2005204192 A JP2005204192 A JP 2005204192A JP 2005204192 A JP2005204192 A JP 2005204192A JP 4368336 B2 JP4368336 B2 JP 4368336B2
Authority
JP
Japan
Prior art keywords
data
category
storage unit
product
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005204192A
Other languages
English (en)
Other versions
JP2007025868A (ja
Inventor
大悟 井上
寛治 内野
宏弥 稲越
宏和 半野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2005204192A priority Critical patent/JP4368336B2/ja
Priority to US11/247,803 priority patent/US20070016581A1/en
Priority to CNB2005101271745A priority patent/CN100472518C/zh
Publication of JP2007025868A publication Critical patent/JP2007025868A/ja
Application granted granted Critical
Publication of JP4368336B2 publication Critical patent/JP4368336B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ユーザによる、データのカテゴリ設定を支援するための技術に関する。
インターネットが社会的なインフラになりつつある現在、その上で様々な情報が発信されている。従って、ユーザにとっては所望の情報に容易にたどり着くため、情報提供者にとってはユーザに対して必要な情報を適切に提供するため、情報の分類整理は非常に重要である。従来、ルールベースや機械学習をベースにした情報の分類技術は存在するが、システムを運用していくためには、ルールベースのルールのメンテナンスや機械学習の基となる正解データの作成が欠かせない。また、精度100%の正解データとのマッチングにてカテゴリを特定するためには、正解データの拡充が欠かせない。しかしながら、正解データの作成は、システム管理者が手作業で行うものであるから、非常にコストが高いものとなってしまう。
また、情報が商品の情報であったりする場合には、日々新たな商品情報が膨大な量追加され、サービス時間外の限られた時間でそれらに対応する正解データを作成するのは不可能である。また、商品ははやり廃りが激しいので、正解データを作成しても直ぐに用いられなくなってしまうこともあり、結果的に作業が無駄となる場合も多い。
なお、米国特許第6654744号には、分類対象の情報の内容、量にかかわらず、分類精度を高めるための技術が開示されている。具体的には、サンプルテキスト群と複数の分類カテゴリとが予め対応付けられた分類サンプルデータに含まれる複数のサンプルテキストのそれぞれから分類カテゴリ毎に特徴素を抽出する特徴素抽出部と、分類サンプルデータに基づいて、複数の分類方法の中から最も分類精度が高い分類方法を決定する分類方法決定部と、分類方法決定部により決定された分類方法に従って、特徴素抽出部により抽出された特徴素に基づいて、分類カテゴリ毎の特徴を表す分類学習情報を生成する分類学習情報生成部と、分類方法決定部により決定された分類方法および分類学習情報に従って、分類対象である新規テキスト群を分類カテゴリ毎に分類する自動分類部とを備えている。但し、正解データについては触れられていない。
米国特許第6654744号
このように正解データを効率よく作成する必要があるが、従来技術ではこの点につき検討されていない。正解データは、分類の必要のある情報に対して直接システム管理者などがカテゴリを設定することで得られる。
従って、本発明の目的は、効率的にデータに対してカテゴリを設定することができるようにするための技術を提供することである。
本発明に係るカテゴリ設定支援方法は、データ格納部に格納された複数のデータ項目に対するカテゴリの設定を支援するカテゴリ設定支援方法であって、データ格納部に格納された複数のデータ項目の各々について、当該データ項目に対してカテゴリの設定を行う影響度を、予め定められた関連事項に基づき算出し、データ項目に対応してデータ格納部に格納するステップと、データ格納部に格納された影響度に基づいて各データ項目についてカテゴリの設定優先順位を決定し、当該設定優先順位に基づきカテゴリの設定のための表示を表示装置に対して行う表示ステップとを含む。このようにすれば、システム管理者などのユーザが効率的にデータ項目に対してカテゴリを設定することができるようになる。
また、上で述べた影響度が、データ項目の利用頻度と、データ項目に対してカテゴリの設定を行うことにより得られ且つ他のデータ項目に対するカテゴリの設定に用いられる正解データの将来利用度とに基づき決定されるようにしてもよい。また、データ項目の利用頻度が、各データ項目に対するアクセスログが格納されているアクセスログ格納部に格納されているデータを用いることにより特定される、データ項目のアクセス量及びアクセス増加量、並びにネットワークにおいて提供されている検索エンジンにおけるデータ項目の該当件数のうち少なくともいずれかによって算出されるようにしてもよい。利用頻度が高いデータ項目から順にカテゴリの設定を行うことによりデータ項目の閲覧者に正しいカテゴリで当該データ項目を提示することができるようになる。また、作成される正解データの将来利用度が高いデータ項目の順にカテゴリの設定を行うことにより、他のデータ項目に対するカテゴリの設定が正確且つ自動的に行われやすくなる。
さらに、上で述べた将来利用度が、データ項目の特定属性に含まれる名詞の出現度と、データ項目の特定属性に含まれる名詞の一般性を表す指標との少なくともいずれかにより算出されるようにしてもよい。例えば商品名は単純な名詞だけで構成される場合だけではなくキャッチフレーズのようなものも商品名として設定される場合があり、このような場合には名詞に着目すると、将来利用度が高い一般的な名詞を多く含む商品名を属性として含むデータ項目の影響度を上げることができる。そして、一般的な名詞が登録されるデータベースを参照すれば、上記データ項目の特定属性に含まれる名詞が一般的なものか否かを判断することができ、例えば一般的な名詞の割合を上記指標として用いる。
また、各データ項目について、カテゴリの自動判断処理を行い、データ項目に対応してデータ格納部に格納するカテゴリ判断ステップをさらに含むようにしてもよい。その場合、カテゴリ判断ステップにおいて、各データ項目について、信頼度の異なる複数の自動判断処理を実施し、最初に特定されたカテゴリをデータ格納部に格納する。また、表示ステップにおいて、各データ項目についてカテゴリの自動判断処理結果を表示し、データ項目が、影響度とカテゴリを特定した自動判断処理の信頼度に応じた指標値とに基づき設定優先順位を決定するようにしてもよい。このようにシステム管理者などのユーザの支援を行っている。そして、信頼度が高いものからユーザに設定させるようにすれば、誤りを訂正する頻度が下がり設定効率が向上する。
本発明に係る方法をコンピュータに実行させるためのプログラムを作成することができ、当該プログラムは、例えばフレキシブル・ディスク、CD−ROM、光磁気ディスク、半導体メモリ、ハードディスク等の記憶媒体又は記憶装置に格納される。また、ネットワークを介してディジタル信号にて頒布される場合もある。なお、処理途中のデータについては、コンピュータのメモリ等の記憶装置に一時保管される。
本発明によれば、効率的にデータに対してカテゴリを設定することができるようになる。
図1に本発明の一実施の形態に係るシステム概要図を示す。以下では、カテゴリを設定すべきデータ項目が商品データである場合について説明する。但し、本発明の適用範囲はこれに限定されるものではない。
本実施の形態におけるカテゴリ設定支援装置は、インターネットなどのネットワークに接続しており、商品データを格納する商品データ格納部1と、システム管理者などのユーザにより設定された商品名とカテゴリコードとの対のデータを格納する正解データDB23と、システム管理者などのユーザからの指示に応じて商品データ格納部1と正解データDB23とに格納されたデータを用いて処理を行う第1比較部3と、全カテゴリにおいて頻出する語のデータを格納する頻出語DB13と、第1比較部3からの指示に応じて商品データ格納部1と頻出語DB13とに格納されたデータを用いて処理を行う第2比較部5と、商品のメーカ及び型番と対応するカテゴリコードとを格納する商品DB15と、第2比較部5からの指示に応じて商品DB15と商品データ格納部1とに格納されるデータを用いて処理を行う第3比較部7と、システム管理者などによって設定されたルールのデータを格納するルールベースDB17と、第3比較部7からの指示に応じて商品データ格納部1とルールベースDB17とに格納されたデータを用いて処理を行うルールベース分類部9と、機械学習の結果である分類ルールのデータを格納する分類ルールDB19と、ルールベース分類部9又はユーザからの指示などに応じて商品データ格納部1と分類ルールDB19とに格納されたデータを用いて処理を行う機械学習分類部11と、第2比較部5、第3比較部7、ルールベース分類部9又は機械学習分類部11の処理結果を格納する分類済商品データ格納部25と、サービスサーバ31への外部からのアクセスに応じて生成されるアクセスログを格納するアクセスログDB33から抽出されたアクセスデータを格納するアクセスデータ格納部29と、分類済商品データ格納部25とルールベースDB17とアクセスデータ格納部29とに格納されたデータを用いて処理を行うランキング処理部27と、ランキング処理部27の処理結果を格納するランキング計算結果格納部35と、ランキング計算結果格納部35に格納されたデータを用いてシステム管理者などのユーザにカテゴリの設定を促し且つ設定されたカテゴリに基づき商品データ格納部1及び正解データDB23の更新処理を実施する正解データ設定部37と、正解データDB23に格納されたデータに基づき頻出語DB13、ルールベースDB17及び分類ルールDB19のデータを更新する更新処理部21とを有する。
なお、インターネットなどのネットワークに接続されたサービスサーバ31は、商品データ格納部1に格納されているデータを、ネットワーク経由で要求する端末に対して送信し、アクセスログを生成してアクセスログDB33に格納する。
また、カテゴリコードは、図2に示すように予め定義されており、以下の処理では商品データに対し図2で定義されているカテゴリコードを割り当てる。図2では、カテゴリコードに対してカテゴリ名が対応付けられている。カテゴリコードは階層的に構成されており、例えばファッションとファッションの下位のファッション>レディスについては、カテゴリコードの上位2桁が共通しており、下位のファッション>レディスについてはカテゴリコード下位8桁が異なるようになっている。同様に、生活・インテリア>文具>事務小物>シールと、生活・インテリア>文具>事務小物>はさみと、生活・インテリア>文具>事務小物>シュレッダーとは、カテゴリコード上位7桁が共通しており、下位3桁が異なるようになっている。
商品データ格納部1は、例えば図3に示すようなデータを格納している。図3の例では、商品名と、商品URL(Uniform Resource Locator)と、価格と、商品キーワードと、店舗名と、メーカ名と、商品説明と、商品画像URLと、確定カテゴリコードと仮カテゴリコードとが格納されている。商品名の列に示されているように、商品名は、単純な商品名だけではなく、キャッチフレーズのような商品名や、商品の型番のようなものや、商品名と型番の組み合わせといった様々な態様が存在している。図3の例では、商品データにはメーカ名のみが含まれているが、場合によっては型番も含まれる場合もある。
頻出語DB13は、例えば図4に示すようなデータを格納している。図4の例では、全カテゴリで発生する頻出語の文字列と、その出現数とが格納されている。頻出語は、カテゴリ設定においては注目すべき語ではなく、そのような語が商品名に用いられていないか判断するために用いられる。
商品DB15は、例えば図5に示すようなデータを格納している。図5の例では、型番と、メーカ名と、対応するカテゴリコードとが格納されている。商品DB15における型番とメーカ名が一致する場合、又は型番が一致する場合には、対応するカテゴリコードをその商品データに設定するものである。
ルールベースDB17は、例えば図6に示すようなデータを格納している。図6の例では、カテゴリコードと、システム管理者などによって設定されたキーワード条件式(AND,OR,NOTなどを用いた式)とが格納されている。ルールベース分類部9は、ルールベースDB17に格納されているキーワード条件式を満たすか判断して、キーワード条件式を満たす場合には対応するカテゴリコードを設定する。
分類ルールDB19は、例えば図7に示すようなデータを格納している。図7の例では、他のカテゴリに現れないような特徴語と、カテゴリコードと、相関係数とが格納されている。機械学習分類部11は、分類ルールDB19に格納されている特徴語と相関係数などから、商品データとカテゴリとのベクトル空間における角度を計算し、最も角度が小さいカテゴリコードをその商品データに設定する。このような処理は従来から存在するので、これ以上述べない。
正解データDB23は、例えば図8に示すようなデータを格納している。図8の例では、商品名と、カテゴリコードと、カテゴリ名とが格納されている。正解データは、システム管理者などによって設定されたカテゴリコード及びカテゴリ名と、商品名とを対応付けたものであって、システム管理者などによって設定されているのでキャッチフレーズのような商品名や識別性の無いような商品名であっても正解データとして登録される。
次に、図9乃至図19を用いて図1に示したシステムの処理を説明する。最初に、新規商品の商品データは、既に登録済みの商品データと共に商品データ格納部1に適宜登録される(図9:ステップS1)。但し、この段階では確定カテゴリコードも仮カテゴリコードも設定されていない。次に、第1比較部3は、商品データ格納部1に格納されている商品データの各商品名で正解データDB23を検索することにより、商品データの商品名と正解データの商品名との比較を行う(ステップS3)。なお、商品データ格納部1において確定カテゴリコードが設定されている商品データについてはステップS3以下の処理を行う必要はない。そして、商品データの商品名と正解データのいずれかの商品名とが一致したか判断する(ステップS5)。一致していると判断された商品データについては、当該商品データに対してその正解データのカテゴリコードを付与する(ステップS7)。すなわち、商品データ格納部1において、確定カテゴリコードとして正解データのカテゴリコードを登録する。既に確定カテゴリコードが登録されている商品データについてもステップS3を実施する場合、ステップS7でも同じカテゴリコードが付与される。これは、確定カテゴリコードが登録されている場合には既に対応する正解データも生成されているためである。そして、端子Aを介して処理を終了させる。
一方、商品データの商品名が正解データのいずれの商品名とも一致しないと判断された商品データについては、第1比較部3は第2比較部5に処理開始指示を出力する。第2比較部5は、第1比較部3からの処理開始指示に応じて、商品データ格納部1において確定カテゴリコードが登録されていない商品データについて、その商品データの商品名を形態素解析で分解し、頻出語DB13に登録されている頻出語と同一の語を除去する処理を実施する(ステップS11)。例えば、「激安多機能シュレッダー」であれば、「激安」が頻出語DB13に登録されているので除去されて、ステップS11では「多機能シュレッダー」が生成される。そして、頻出語除去後の商品名で正解データDB23を検索することにより、頻出語除去後の商品名と正解データとの比較を行う(ステップS13)。そして、頻出語除去後の商品名と正解データのいずれかの商品名とが一致したか判断する(ステップS15)。一致していると判断された商品データについては、当該商品データに対してその正解データのカテゴリコードを仮カテゴリコードとして付与する(ステップS17)。すなわち、分類済商品データ格納部25に、仮カテゴリコードとして正解データのカテゴリコードを含む商品データを登録する。また、当該商品データに対して分類コード「2」を設定して、分類済商品データ格納部25に登録する(ステップS19)。そして端子Bを介してステップS37に移行する。
一方、頻出語除去後の商品名が正解データのいずれの商品名とも一致しないと判断された商品データについては、第2比較部5は第3比較部7に処理開始指示を出力する。第3比較部7は、第2比較部5からの処理開始指示に応して、商品データ格納部1に確定カテゴリコードが登録されておらず且つ分類済商品データ格納部25に登録されていない商品データについて、その商品データの商品名以外のデータで商品DB15に格納された既知のメーカ名及び型番と比較を行う(ステップS21)。型番は、商品名として含まれる場合もあるが、商品キーワードや商品説明などに含まれている場合もある。そして、商品データの商品名以外のデータである型番が商品DB15のレコードの型番と一致するか、又は商品データの商品名以外のデータであるメーカ名及び型番が商品DB15のレコードのメーカ名及び型番と一致するか判断する(ステップS23)。一致していると判断された商品データについては、商品DB15において一致したと判断されたレコードのカテゴリコードを仮カテゴリコードとして付与する(ステップS25)。すなわち、分類済商品データ格納部25に、仮カテゴリコードとして商品DB15から取得したカテゴリコードを含む商品データを登録する。また、当該商品データに対して分類コード「3」を設定して、分類済商品データ格納部25に登録する(ステップS27)。そして端子Bを介して図10のステップS37に移行する。また、商品DB15に登録されている型番又はメーカ名及び型番と商品データの商品名以外のデータが一致しないと判断された場合には、端子Cを介して図10のステップS29に移行する。
第3比較部7は、ルールベース分類部9に処理開始指示を出力する。ルールベース分類部9は、第3比較部7からの処理開始指示に応じて、商品データ格納部1において確定カテゴリコードが登録されておらず且つ分類済商品データ格納部25に登録されていない商品データに対して、ルールベースDB17に格納されたキーワード条件式を適用して分類を実施する(図10:ステップS29)。ルールベースDB17に格納されたキーワード条件式によって分類可能な商品データについては(ステップS31:Yesルート)、ルールベースDB17に登録されており且つ合致したキーワード条件式に対応するカテゴリコードを仮カテゴリコードとして付与する(ステップS33)。すなわち、分類済商品データ格納部25に、仮カテゴリコードとしてルールベースDB17から取得したカテゴリコードを含む商品データを登録する。また、当該商品データに対して分類コード「4」を設定して、分類済商品データ格納部25に登録する(ステップS35)。そして、ステップS37に移行する。
一方、ルールベースDB17に登録されているキーワード条件式に合致しない商品データについてはステップS37に移行する。
次に、ルールベース分類部9は、処理開始指示を機械学習分類部11に出力する。機械学習分類部11は、ルールベース分類部9からの処理開始指示に応じて、商品データ格納部1に確定カテゴリコードが登録されていない商品データについて、分類ルールDB19に格納されているデータを用いて周知の機械学習分類処理を実施する(ステップS37)。機械学習分類処理では、必ず何らかのカテゴリが特定される。そして、機械学習分類部11は、分類済商品データ格納部25を参照して分類コードが登録済みの商品データについては(ステップS39:Yesルート)、分類ルールDB19に基づき特定されたカテゴリコードを候補カテゴリコードとして分類済商品データ格納部25に登録する(ステップS41)。候補カテゴリコードは、例えば仮カテゴリコードを確定カテゴリコードとして用いることができない場合においてシステム管理者などの他の選択肢となる。その後端子Dを介して図13の処理に移行する。
一方、分類済商品データ格納部25を参照して分類コードが未登録の商品データについては(ステップS39:Noルート)、分類ルールDB19に基づき特定されたカテゴリコードを仮カテゴリコードとして分類済商品データ格納部25に登録する(ステップS43)。また、当該商品データに対して分類コード「5」を設定して、分類済商品データ格納部25に登録する(ステップS45)。さらに、分類ルールDB19に基づき特定された2位以下のカテゴリを候補カテゴリコードとして分類済商品データ格納部25に登録する(ステップS47)。その後端子Dを介して図13の処理に移行する。
このようにして得られた分類済商品データ格納部25内のデータは、例えば図11に示すようなデータである。図11の例では、商品名と、商品URLと、価格と、商品キーワードと、店舗名と、メーカ名と、商品説明と、商品画像URLと、仮カテゴリコードと、分類コードと、候補カテゴリコードとが格納されている。商品データ格納部1との差は、仮カテゴリコードと、分類コードと、候補カテゴリコードとが追加されている点である。図11の例では、第1レコードの分類コードは「2」であり、第2レコードの分類コードは「3」であり、第3レコードの分類コードは「4」であり、第4レコードの分類コードは「5」である。なお、正解データによってカテゴリコードが特定された商品データについては、分類コード「1」であるとみなす。
一般に、図12に示すように、値の小さな分類コードの分類手法の方が分類精度が高い。また、値の小さな分類コードの分類手法の方が人手によるコントロールのしやすさが高くなる。一方、値の大きな分類コードの分類手法の方が手間がかからない。本実施の形態では、正解データによる1対1マッチングが精度が高く最も好ましい分類手法であるものとして、正解データをできるだけ多く効率的に設定するために必要な手法を以下に説明する。
そのため、ランキング処理部27は、ランキング値計算処理を実施する(図13:ステップS49)。ランキング値計算処理については図14乃至図17を用いて詳細に説明する。なお、アクセスログDB33に格納されたデータのうち必要なデータ(例えば所定期間内のログ。アクセスに関するログ以外のログも含まれる場合には、例えばアクセスに関するログのみ。)を、アクセスデータ格納部29に格納しておく。但し、ランキング処理部27はアクセスログDB33をそのまま用いるようにしても良い。
ランキング処理部27は、アクセスデータ格納部29から、分類済商品データ格納部25に格納されている該当商品iに対するアクセス数Aを取得し、ランキング計算結果格納部35に格納する(ステップS61)。例えば、該当商品i毎にアクセスログの件数を所定期間において計数する。アクセス数は、該当商品iがよく参照されるかどうか、すなわち該当商品iが一般ユーザに注目されているかを表す指標である。アクセス数が大きければ、カテゴリが間違っていた場合その影響は大きい。また、アクセス数が多いということは、商品データの利用頻度が高いというだけではなく、同じような商品が登録される可能性が高く、正解データの利用頻度も高いと予測される。そして、予め定められた関数S1に基づき、該当商品i毎にランキング値R(i)=S1(A)を算出する(ステップS63)。関数S1は、Aが大きな値を有する場合にはそれに応じて大きな値を出力する関数である。
さらに、ランキング処理部27は、アクセスデータ格納部29から、分類済商品データ格納部25に格納されている該当商品iが属するカテゴリ(ここでは仮カテゴリ)に対するアクセス数を取得し、ランキング計算結果格納部35に格納する(ステップS65)。例えば、該当商品iが属するカテゴリを分類済商品データ格納部25から特定し、当該カテゴリのカテゴリコードに基づきアクセスログの件数を所定期間において計数する。例えば、アクセス先のURL等からカテゴリコードを特定できるようにしておき、それに基づきアクセス数を集計する。このアクセス数も、該当商品iを含むカテゴリに対するユーザの注目度合いを表すものである。そして、予め定められた関数S2に基づき、R(i)=R(i)+S2(B)を算出して該当商品i毎にランキング値R(i)を更新する(ステップS67)。関数S2は、Bが大きな値を有する場合にはそれに応じて大きな値を出力する関数である。
また、ランキング処理部27は、例えばインターネットなどにおける外部検索エンジンで該当商品iの商品名を検索し、ヒット件数Cを取得し、ランキング計算結果格納部35に格納する(ステップS69)。そして、ヒット件数C≧閾値Xであるか判断する(ステップS71)。商品名が一般的な名称である場合にはヒット件数が膨大となり、ランキング値算出において不適切なため、閾値Xを設定している。もし、ヒット件数Cが閾値X以上である場合には(ステップS71:Yesルート)、メーカ名及び店舗名などの予め定められた属性を商品名に加えて再度外部検索エンジンで検索し、ヒット件数C'を取得し、ランキング計算結果格納部35に格納する(ステップS73)。ステップS69又はS73のいずれであってもヒット件数は、その商品名の普及度合いを示すものであり、アクセス数と同様に一般ユーザの注目度合いも反映している。そして、予め定められた関数S3に基づき、R(i)=R(i)+S3(C')を算出して該当商品i毎にランキング値R(i)を更新する(ステップS75)。そしてステップS79に移行する。関数S3も、Cが大きな値を有する場合にはそれに応じて大きな値を出力する関数である。
一方、ヒット件数Cが閾値X未満である場合には(ステップS71:Noルート)、予め定められた関数S3に基づき、R(i)=R(i)+S3(C)を算出して該当商品i毎にランキング値R(i)を更新する(ステップS77)。そしてステップS79に移行する。
さらに、ランキング処理部27は、該当商品iの商品名に対して形態素解析を実施する(ステップS79)。
例えば、図11の第1レコード及び第4レコードの商品の商品名に対する形態素解析の結果を図16及び図17に示す。図16は、図11の第1レコードの商品の商品名に対する形態素解析の結果を示す。「激安多機能シュレッダー」の場合には、形態素が3つのところ3つ全てが名詞と判断される。すなわち名詞の割合は3/3=1.0となる。一方、図17は、図11の第4レコードの商品の商品名に対する形態素解析の結果を示す。このようなキャッチフレーズのような商品名については、形態素15のうち名詞の個数は7つであり、名詞の割合は7/15=0.47となる。
商品名において名詞の割合が低い場合には、例えば図17のようなキャッチフレーズのような商品名の可能性が高くなると考えられる。キャッチフレーズのような商品名にわざわざ正解データを設定したとしても、その正解データが他の商品について適用される可能性は非常に低いと考えられる。従って、名詞の割合がある程度高いことが望まれる。
従って、ランキング処理部27は、該当商品iの商品名における名詞の出現割合αを算出する(ステップS81)。また、該当商品iの商品名に含まれる名詞でルールベースDB17を検索し、該当商品iの商品名に含まれる名詞がルールベースで用いられているか確認し、ルールベースで使用されている名詞の割合βを算出する(ステップS83)。図16の例では、シュレッダーのみがルールベースDB17に登録されているので、ルールベースで使用されている名詞の割合βは1/3=0.33となる。また、図17の例では、チョコレートとケーキとがルールベースDB17に登録されているので、ルールベースで使用されている名詞の割合βは2/7=0.28となる。ルールベースで使用されている名詞は一般的な名詞であって、ルールベースに登録されている名詞の割合が低い場合には固有名詞など汎用性の低い名詞の割合が高いことが予測される。従って、汎用性の低い名詞ばかりの商品名に対して正解データを作成しても、その正解データが他の商品について適用される可能性は低いと考えられる。従って、ルールベースに登録されている名詞の割合βがある程度高いことが望まれる。
そして、ランキング処理部27は、該当商品iの名詞出現割合α、ルールベースで使用されている名詞の割合βを用いて、予め定められている関数S4(α,β)(例えば、α及びβが大きいほど大きい値が出力される関数)の値を算出する(ステップS85)。さらに、S4(α,β)≧閾値γであるか判断する(ステップS87)。もし、S4(α,β)が閾値γ以上である場合には、正解データの将来利用度が高いと判断されるので、ランキング値を上げるべく、R(i)=R(i)+S4(α,β)を算出して該当商品i毎にランキング値R(i)を更新する(ステップS89)。一方、S4(α,β)が閾値γ未満である場合には、正解データの将来利用度が低いと判断されるので、ランキング値を下げるべく、R(i)=R(i)−S4(α,β)を算出して該当商品i毎にランキング値R(i)を更新する(ステップS91)。
ステップS89又はステップS91の後に、ランキング処理部27は、アクセスデータ格納部29に格納されているデータを用いて、該当商品iの過去n日間のアクセス増加量Dを取得し、ランキング計算結果格納部35に格納する(ステップS93)。アクセス増加量は、例えば現在アクセス量とn日前のアクセス量との差を算出する。このアクセス増加量も、該当商品iに対するユーザの注目度合いを表すものである。そして、予め定められた関数S5に基づき、R(i)=R(i)+S5(D)を算出して該当商品i毎にランキング値R(i)を更新する(ステップS95)。関数S5も、Dが大きな値を有する場合にはそれに応じて大きな値を出力する関数である。
また、ランキング処理部27は、分類済商品データ格納部25から該当商品iの分類方式の番号(分類コード)Eを取得する(ステップS97)。そして、予め定められた関数S6に基づき、R(i)=R(i)+S6(E)を算出して該当商品i毎にランキング値R(i)を更新する(ステップS99)。図12に示すように、分類コードの値が小さいほど信頼度が高く、関数S6は分類コードの値が小さいほど大きな値を出力するような関数である。本実施の形態では、信頼度が高い仮カテゴリコードについて優先度を高くして、システム管理者などのユーザがあまり手をかけずに、できる限り仮カテゴリコードをそのまま確定カテゴリコードに設定できるようにし、作業効率を向上させるものである。
そしてステップS99で算出された該当商品iのランキング値R(i)をランキング計算結果格納部35に格納する(ステップS101)。なお、図14及び図15の処理フローのいずれかの段階で分類済商品データ格納部25に格納された商品データについては、ランキング計算結果格納部35に格納する。処理は元の処理に戻る。
このようにしてランキング値を該当商品i毎に算出する。ランキング値は、特定の商品について正解データを作成する影響度、すなわち特定の商品データに対してカテゴリを設定する影響度を表しているものと考えられる。ランキング値が大きな値を有する場合には、正解データを作成する、すなわち商品データに対してカテゴリを設定する波及効果が高い。一方、ランキング値が小さな値を有する場合には、正解データを作成する、すなわち商品データに対してカテゴリを設定する波及効果が低い。波及効果は、商品データを参照する一般ユーザに対する効果と、正解データを作成する、すなわち商品データに対してカテゴリを設定するシステム管理者などのユーザに対する効果がある。前者については、一般ユーザの利用頻度が高く注目されている商品データ(アクセス数、外部検索エンジンのヒット件数、アクセス増加量が大きい値を有する商品)に対してはその露出度の観点から、間違ったカテゴリを付与してしまった場合において問題が大きいということからも分かる。後者については、一度正解データを作成してしまえば他の多くの商品について当該正解データが適用されて人手による作業量を削減できるという将来利用度という観点から影響度に関係している。名詞の出現割合及びルールベースにおいて使用されている名詞の割合が商品名の一般性の度合いを表しており、一般性が高いほど上記観点において将来利用度が高くなり、優先して正解データの作成を行うべきものである。一般性の低い固有名詞のような商品名の場合には、優先して正解データを作成する必要はない。
さらに、本実施の形態では、分類コードに基づきランキング値が更新されるので、ランキング値は正解データの設定効率と上記影響度とによって設定される。上でも述べたが、カテゴリ設定の精度が高いほどシステム管理者などのユーザによる修正確率は減るため、設定効率が向上する。
以上のような考え方に基づき算出されるランキング値に従ってシステム管理者などのユーザに対して商品データを提示する優先度が決まる。
ランキング計算結果格納部35に格納されるデータの一例を図18に示す。図18の例では、図11に示した分類済商品データ格納部25に格納されたデータに加え、商品アクセス数、カテゴリアクセス数、ヒット件数、アクセス増加量、ランキング値が追加されている。
図13の説明に戻って、次に、正解データ設定部37は、ランキング計算結果格納部35に格納されたレコードをランキング値等(ユーザによって指示された場合には商品アクセス数、カテゴリアクセス数、アクセス増加量などの場合もある)に基づきソートする(ステップS51)。そして、ソート結果に基づきユーザに提示する表示データを生成し、表示装置に出力する(ステップS53)。例えば図19に示すような画面を表示する。図19の画面では、ランキング値でソート、ヒット件数でソート、商品アクセス数でソート、アクセス増加量でソートのいずれかを選択するためのラジオボタンと、ランキング計算結果格納部35に格納されたデータを表すテーブルと、当該テーブルの各行について仮カテゴリが正しくない場合に正しいカテゴリコードを入力するための入力欄と、テーブルの各行について仮カテゴリが正しい場合にチェックを付すためのチェック欄と、設定指示を行うためのOKボタンとが設けられている。カテゴリコードからカテゴリ名を抽出するのは例えば図2に示すようなデータを保持しておけばよい。システム管理者などのユーザは、ラジオボタンで商品の並べ替えを行うことができ、商品データと仮カテゴリを確認して正しければチェック欄にチェックを付し、正しくなければ、例えば候補カテゴリのデータを参照してそのコードを入力するようにしても良いし、他のカテゴリのコードを入力しても良い。図19ではランキング値の上位の一部のみを示しているが、スクロールしてランキング値が下位の商品データを示すようにしても良いし、複数画面に分割するようにして提示しても良い。
正解データ設定部37は、ユーザからの入力を受け付け(ステップS55)、入力に従ってチェック欄にチェックが付された商品データ又は正しいカテゴリコードが入力された商品データについて、商品名とカテゴリコードとの組を正解データDB23に格納する(ステップS57)。さらに、商品データ格納部1に、チェック欄にチェックが付された商品データ又は正しいカテゴリコードが入力された商品データについては、確定カテゴリコードとして、仮カテゴリコード又は入力カテゴリコードを登録し、チェック欄にチェックが付されなかった商品については仮カテゴリコードとして、仮カテゴリコードを登録する。
以上のような処理を実施することにより、ランキング値に応じた優先順位が付された形でシステム管理者などのユーザに商品データを提示することができる。ユーザは、優先順位に従ってカテゴリコードを設定してゆけば、カテゴリコードを設定することによる影響度が高い順及び作業効率が良い順に作業を行うことができる。
以上本発明の一実施の形態を説明したが、本発明はこれに限定されるものではない。例えば、図1に示した機能ブロック図は必ずしも実際のプログラム・モジュールに対応するものではない。また、図19の画面構成も一例であって、これに限定されるものではない。さらに、ランキング値を算出する際に用いられる関数については適宜処理対象のデータに応じて変更することが可能である。さらにルールベースに使用されている名詞を一般的な名詞の例として示しているが、ルールベースDB17の他に一般的な名詞を蓄積したデータ格納部を用意するようにしても良い。
なお、上で述べたカテゴリ設定支援装置は、例えばサービスサーバ31とネットワークで接続されたサーバであって、例えばネットワークに接続された他の端末から指示を出すようにしても良い。
また、更新処理部21は、例えば定期的に又は任意のタイミングで、正解データDB23に格納されたデータを用いて、頻出語DB13、ルールベースDB17、分類ルールDB19の更新処理を実施する。頻出語DB13には、正解データDB23に格納されている商品名において特定のカテゴリに偏らず頻出する語を抽出して格納する。ルールベースDB17には、正解データDB23に格納されている商品名及びカテゴリコードからキーワード条件式を抽出する処理を実施して格納する。この処理についてはユーザの指示に従って行う。また、分類ルールDB19には、正解データDB23に格納されている商品名及びカテゴリコードについて機械分類処理を行って処理結果を格納する。
さらに、カテゴリ設定支援装置は、図20に示すようなコンピュータ装置であって、メモリ2501(記憶装置)とCPU2503(処理装置)とハードディスク・ドライブ(HDD)2505と表示装置2509に接続される表示制御部2507とリムーバブル・ディスク2511用のドライブ装置2513と入力装置2515とネットワークに接続するための通信制御部2517とがバス2519で接続されている。オペレーティング・システム(OS:Operating System)及び本実施の形態における処理を実施するためのアプリケーション・プログラムは、HDD2505に格納されており、CPU2503により実行される際にはHDD2505からメモリ2501に読み出される。必要に応じてCPU2503は、表示制御部2507、通信制御部2517、ドライブ装置2513を制御して、必要な動作を行わせる。また、処理途中のデータについては、メモリ2501に格納され、必要があればHDD2505に格納される。本発明の実施の形態では、上で述べた処理を実施するためのアプリケーション・プログラムはリムーバブル・ディスク2511に格納されて頒布され、ドライブ装置2513からHDD2505にインストールされる。インターネットなどのネットワーク及び通信制御部2517を経由して、HDD2505にインストールされる場合もある。このようなコンピュータ装置は、上で述べたCPU2503、メモリ2501などのハードウエアとOS及び必要なアプリケーション・プログラムとが有機的に協働することにより、上で述べたような各種機能を実現する。
(付記1)
データ格納部に格納された複数のデータ項目に対するカテゴリの設定を支援するカテゴリ設定支援方法であって、
前記データ格納部に格納された前記複数のデータ項目の各々について、当該データ項目に対してカテゴリの設定を行う影響度を、予め定められた関連事項に基づき算出し、前記データ項目に対応して前記データ格納部に格納するステップと、
前記データ格納部に格納された影響度に基づいて各前記データ項目についてカテゴリの設定優先順位を決定し、当該設定優先順位に基づきカテゴリの設定のための表示を表示装置に対して行う表示ステップと、
を含み、コンピュータに実行されるカテゴリ設定支援方法。
(付記2)
前記影響度が、
前記データ項目の利用頻度と、前記データ項目に対してカテゴリの設定を行うことにより得られ且つ他のデータ項目に対するカテゴリの設定に用いられる正解データの将来利用度とに基づき決定される
付記1記載のカテゴリ設定支援方法。
(付記3)
前記データ項目の利用頻度が、
各データ項目に対するアクセスログが格納されているアクセスログ格納部に格納されているデータを用いることにより特定される、前記データ項目のアクセス量及びアクセス増加量、並びにネットワークにおいて提供されている検索エンジンにおける前記データ項目の該当件数のうち少なくともいずれかによって算出される
付記2記載のカテゴリ設定支援方法。
(付記4)
前記将来利用度が、
前記データ項目の特定属性に含まれる名詞に関する指標に基づき算出される
付記2記載のカテゴリ設定支援方法。
(付記5)
前記名詞に関する指標が、
前記特定属性に含まれる名詞の出現度と、前記データ項目の特定属性に含まれる名詞の一般性を表す指標との少なくともいずれかにより算出される
付記4記載のカテゴリ設定支援方法。
(付記6)
各前記データ項目について、カテゴリの自動判断処理を行い、前記データ項目に対応して前記データ格納部に格納するカテゴリ判断ステップ
をさらに含み、
前記表示ステップにおいて、各前記データ項目について前記カテゴリの自動判断処理結果を表示する
付記1記載のカテゴリ設定支援方法。
(付記7)
前記カテゴリ判断ステップにおいて、
各前記データ項目について、信頼度の異なる複数の自動判断処理を実施し、最初に特定されたカテゴリを前記データ格納部に格納し、
前記表示ステップにおいて、前記データ項目が、前記影響度と前記カテゴリを特定した自動判断処理の信頼度に応じた指標値とに基づき設定優先順位が決定される
付記6記載のカテゴリ設定支援方法。
(付記8)
前記データ格納部に格納された前記データ項目のうち、前記正解データとのマッチングによりカテゴリが特定されるデータ項目を処理対象から除外するステップ
をさらに含む付記1記載のカテゴリ設定支援方法。
(付記9)
ユーザからカテゴリ設定入力を受け付けたデータ項目に対応して前記データ格納部に設定入力されたカテゴリのコードを登録するステップと、
ユーザからカテゴリ設定入力を受け付けたデータ項目の特定属性と前記カテゴリのコードとを正解データとして正解データ格納部に登録するステップと、
をさらに含む付記8記載のカテゴリ設定支援方法。
(付記10)
付記1乃至9記載のカテゴリ設定支援方法をコンピュータに実行させるためのプログラム。
(付記11)
データ格納部に格納された複数のデータ項目に対するカテゴリの設定を支援するカテゴリ設定支援装置であって、
前記データ格納部に格納された前記複数のデータ項目の各々について、当該データ項目に対してカテゴリの設定を行う影響度を、予め定められた関連事項に基づき算出し、前記データ項目に対応して前記データ格納部に格納する手段と、
前記データ格納部に格納された影響度に基づいて各前記データ項目についてカテゴリの設定優先順位を決定し、当該設定優先順位に基づきカテゴリの設定のための表示を表示装置に対して行う手段と、
を有するカテゴリ設定支援装置。
本発明の実施の形態の機能ブロック図である。 カテゴリコード及びカテゴリ名の対応関係の一例を示すテーブルである。 商品データ格納部に格納されるデータの一例を示すテーブルである。 頻出語DBに格納されるデータの一例を示す図である。 商品DBに格納されるデータの一例を示すテーブルである。 ルールベースDBに格納されるデータの一例を示すテーブルである。 分類ルールDBに格納されるデータの一例を示すテーブルである。 正解データDB23に格納されるデータの一例を示すテーブルである。 本発明の実施の形態におけるメイン処理フローの第1の部分を示す図である。 本発明の実施の形態におけるメイン処理フローの第2の部分を示す図である。 分類済商品データ格納部に格納されるデータの一例を示す図である。 分類手法の信頼度などを説明するための図である。 本発明の実施の形態におけるメイン処理フローの第3の部分を示す図である。 ランキング値計算処理の処理フローの第1の部分を示す図である。 ランキング値計算処理の処理フローの第2の部分を示す図である。 形態素解析結果の一例を示す図である。 形態素解析結果の他の例を示す図である。 ランキング計算結果格納部に格納されるデータの一例を示すテーブルである。 ユーザに提示される画面例を示す図である。 コンピュータの機能ブロック図である。
符号の説明
1 商品データ格納部 3 第1比較部 5 第2比較部
7 第3比較部 9 ルールベース分類部 11 機械学習分類部
13 頻出語DB 15 商品DB 17 ルールベースDB
19 分類ルールDB 21 更新処理部 23 正解データDB
25 分類済商品データ格納部 27 ランキング処理部
29 アクセスデータ格納部 35 ランキング計算結果格納部
37 正解データ設定部

Claims (4)

  1. データ格納部に格納された複数のデータ項目に対するカテゴリの設定を支援するカテゴリ設定支援方法であって、
    前記データ格納部に格納された前記複数のデータ項目の各々について、当該データ項目の利用頻度に応じて算出される第1の値に、前記データ項目に対応付けて前記データ格納部に登録されている属性のうちの特定属性に含まれる名詞の出現度と、前記特定属性に含まれる名詞のうち、予め設定された一般的な名詞を格納するルールベース格納部に格納されている前記一般的な名詞の割合とに応じて算出される第2の値を加算することにより、当該データ項目に対してカテゴリの設定を行うことによる波及効果の度合いを表す影響度算出し、前記データ項目に対応付けて前記データ格納部に格納する影響度算出ステップと、
    各前記データ項目を、前記データ格納部に格納された前記影響度の高い順に、カテゴリを設定可能な態様で表示装置に表示する表示ステップと、
    を含み、コンピュータに実行されるカテゴリ設定支援方法。
  2. 記データ項目の利用頻度が、
    各データ項目に対するアクセスログが格納されているアクセスログ格納部に格納されているデータを用いることにより特定される、前記データ項目のアクセス量及びアクセス増加量、並びにネットワークにおいて提供されている検索エンジンにおける前記データ項目の該当件数のうち少なくともいずれかによって算出される
    請求項1記載のカテゴリ設定支援方法。
  3. 各前記データ項目について、カテゴリを特定するための複数の自動判断処理であって、予め定められた信頼度が異なる複数の自動判断処理を、前記信頼度の高い順に少なくとも1のカテゴリを特定するまで実施し、最初に特定されたカテゴリと当該カテゴリを特定した自動判断処理の前記信頼度とを前記データ項目に対応付けて前記データ格納部に格納するカテゴリ判断ステップ
    をさらに含み、
    前記影響度算出ステップが、
    前記データ格納部に格納された前記信頼度に応じて算出される第3の値を前記影響度に加算することにより、前記影響度を更新するステップ
    を含み、
    前記表示ステップにおいて、
    各前記データ項目について前記カテゴリの自動判断処理結果を表示する
    請求項1記載のカテゴリ設定支援方法。
  4. データ格納部に格納された複数のデータ項目に対するカテゴリの設定を支援するカテゴリ設定支援装置であって、
    前記データ格納部に格納された前記複数のデータ項目の各々について、当該データ項目の利用頻度に応じて算出される第1の値に、前記データ項目に対応付けて前記データ格納部に登録されている属性のうちの特定属性に含まれる名詞の出現度と、前記特定属性に含まれる名詞のうち、予め設定された一般的な名詞を格納するルールベース格納部に格納されている前記一般的な名詞の割合とに応じて算出される第2の値を加算することにより、当該データ項目に対してカテゴリの設定を行うことによる波及効果の度合いを表す影響度算出し、前記データ項目に対応付けて前記データ格納部に格納する手段と、
    各前記データ項目を、前記データ格納部に格納された前記影響度の高い順に、カテゴリを設定可能な態様で表示装置に表示する手段と、
    を有するカテゴリ設定支援装置。
JP2005204192A 2005-07-13 2005-07-13 カテゴリ設定支援方法及び装置 Expired - Fee Related JP4368336B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005204192A JP4368336B2 (ja) 2005-07-13 2005-07-13 カテゴリ設定支援方法及び装置
US11/247,803 US20070016581A1 (en) 2005-07-13 2005-10-11 Category setting support method and apparatus
CNB2005101271745A CN100472518C (zh) 2005-07-13 2005-11-15 类别设定的支持方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005204192A JP4368336B2 (ja) 2005-07-13 2005-07-13 カテゴリ設定支援方法及び装置

Publications (2)

Publication Number Publication Date
JP2007025868A JP2007025868A (ja) 2007-02-01
JP4368336B2 true JP4368336B2 (ja) 2009-11-18

Family

ID=37609518

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005204192A Expired - Fee Related JP4368336B2 (ja) 2005-07-13 2005-07-13 カテゴリ設定支援方法及び装置

Country Status (3)

Country Link
US (1) US20070016581A1 (ja)
JP (1) JP4368336B2 (ja)
CN (1) CN100472518C (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8538958B2 (en) * 2008-07-11 2013-09-17 Satyam Computer Services Limited Of Mayfair Centre System and method for context map generation
JP2010092401A (ja) * 2008-10-10 2010-04-22 Panasonic Corp ネットワーク機器、機器、その情報検索方法、およびそのプログラム
US20110093478A1 (en) * 2009-10-19 2011-04-21 Business Objects Software Ltd. Filter hints for result sets
JP5346841B2 (ja) * 2010-02-22 2013-11-20 株式会社野村総合研究所 文書分類システムおよび文書分類プログラムならびに文書分類方法
CN107122980B (zh) * 2011-01-25 2021-08-27 阿里巴巴集团控股有限公司 识别商品所属类目的方法和装置
CN103310343A (zh) * 2012-03-15 2013-09-18 阿里巴巴集团控股有限公司 商品信息发布方法和装置
US8682864B1 (en) 2012-06-20 2014-03-25 Google Inc. Analyzing frequently occurring data items
CN103577989B (zh) * 2012-07-30 2017-11-14 阿里巴巴集团控股有限公司 一种基于产品识别的信息分类方法及信息分类系统
JP6007075B2 (ja) * 2012-11-16 2016-10-12 任天堂株式会社 サービス提供システム、サービス提供方法、サーバシステムおよびサービス提供プログラム
JP5753217B2 (ja) * 2013-05-17 2015-07-22 株式会社アイディーズ 商品コード分析システム及び商品コード分析プログラム
JP6291844B2 (ja) * 2014-01-06 2018-03-14 日本電気株式会社 データ処理装置
US20200201919A1 (en) * 2016-11-30 2020-06-25 Optim Corporation System, method, and program for generating url associated with article
JP6664343B2 (ja) * 2017-03-09 2020-03-13 三菱電機ビルテクノサービス株式会社 ソフトウェア更新管理システム及びプログラム
JP6680725B2 (ja) * 2017-06-12 2020-04-15 ヤフー株式会社 カテゴリ選択装置、広告配信システム、カテゴリ選択方法、およびプログラム
CN107590178B (zh) * 2017-07-31 2020-10-16 杭州大搜车汽车服务有限公司 一种基于vin码的车型匹配方法、电子设备、存储介质
WO2019051814A1 (zh) * 2017-09-15 2019-03-21 达闼科技(北京)有限公司 一种目标识别方法、装置和智能终端
WO2021024430A1 (ja) * 2019-08-07 2021-02-11 日本電信電話株式会社 類似度評価装置、類似度評価方法、およびプログラム
US11860780B2 (en) 2022-01-28 2024-01-02 Pure Storage, Inc. Storage cache management

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5537586A (en) * 1992-04-30 1996-07-16 Individual, Inc. Enhanced apparatus and methods for retrieving and selecting profiled textural information records from a database of defined category structures
US6029195A (en) * 1994-11-29 2000-02-22 Herz; Frederick S. M. System for customized electronic identification of desirable objects
US6941321B2 (en) * 1999-01-26 2005-09-06 Xerox Corporation System and method for identifying similarities among objects in a collection
US6629097B1 (en) * 1999-04-28 2003-09-30 Douglas K. Keith Displaying implicit associations among items in loosely-structured data sets
US6654744B2 (en) * 2000-04-17 2003-11-25 Fujitsu Limited Method and apparatus for categorizing information, and a computer product
US7814043B2 (en) * 2001-11-26 2010-10-12 Fujitsu Limited Content information analyzing method and apparatus
US20040128555A1 (en) * 2002-09-19 2004-07-01 Atsuhisa Saitoh Image forming device controlling operation according to document security policy
US7610313B2 (en) * 2003-07-25 2009-10-27 Attenex Corporation System and method for performing efficient document scoring and clustering
WO2006002180A2 (en) * 2004-06-18 2006-01-05 Pictothink Corporation Network content organization tool
US7428530B2 (en) * 2004-07-01 2008-09-23 Microsoft Corporation Dispersing search engine results by using page category information

Also Published As

Publication number Publication date
JP2007025868A (ja) 2007-02-01
CN100472518C (zh) 2009-03-25
CN1896990A (zh) 2007-01-17
US20070016581A1 (en) 2007-01-18

Similar Documents

Publication Publication Date Title
JP4368336B2 (ja) カテゴリ設定支援方法及び装置
CN107436875B (zh) 文本分类方法及装置
US10896214B2 (en) Artificial intelligence based-document processing
US8176050B2 (en) Method and apparatus of supporting creation of classification rules
US8156138B2 (en) System and method for providing targeted content
KR100692209B1 (ko) 맞춤형 상품 정보 제공 방법 및 그 시스템
US9767183B2 (en) Method and system for enhanced query term suggestion
US20180114136A1 (en) Trend identification using multiple data sources and machine learning techniques
CN111552870A (zh) 对象推荐方法、电子装置及存储介质
US20100106599A1 (en) System and method for providing targeted content
CN102567475A (zh) 用于交互式查询重构的用户接口
JP2017204018A (ja) 検索処理方法、検索処理プログラムおよび情報処理装置
CN113177154A (zh) 搜索词推荐方法、装置、电子设备及存储介质
JP5302614B2 (ja) 施設関連情報の検索データベース形成方法および施設関連情報検索システム
JP5345987B2 (ja) 文書検索装置、文書検索方法および文書検索プログラム
JP2017219899A (ja) ナレッジ検索装置、ナレッジ検索方法、および、ナレッジ検索プログラム
US20200395004A1 (en) Computer System, Model Generation Method, and Computer Readable Recording Medium
JP2010003134A (ja) 検索キーワードを推薦するサーバ、方法、およびプログラム
JP6549173B2 (ja) 計算機システム及び文章データの検索方法
US20150186363A1 (en) Search-Powered Language Usage Checks
JP2011100191A (ja) 文書検索装置、文書検索方法、及び文書検索プログラム
CN114237588A (zh) 一种代码仓库选择方法、装置、设备及存储介质
CN113742614A (zh) 生成、显示推荐信息的方法、电子设备及存储介质
JP2018022217A (ja) ナレッジ検索装置、ナレッジ検索方法、および、ナレッジ検索プログラム
CN111310016B (zh) 标签挖掘方法、装置、服务器和存储介质

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090331

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090513

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090825

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090825

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120904

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120904

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130904

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees