JP4874828B2 - コミュニティ抽出による検索用インデックス作成方法およびその装置 - Google Patents

コミュニティ抽出による検索用インデックス作成方法およびその装置 Download PDF

Info

Publication number
JP4874828B2
JP4874828B2 JP2007024761A JP2007024761A JP4874828B2 JP 4874828 B2 JP4874828 B2 JP 4874828B2 JP 2007024761 A JP2007024761 A JP 2007024761A JP 2007024761 A JP2007024761 A JP 2007024761A JP 4874828 B2 JP4874828 B2 JP 4874828B2
Authority
JP
Japan
Prior art keywords
search index
authority
hub
cluster
community
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007024761A
Other languages
English (en)
Other versions
JP2008191877A (ja
Inventor
少遅 王
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2007024761A priority Critical patent/JP4874828B2/ja
Publication of JP2008191877A publication Critical patent/JP2008191877A/ja
Application granted granted Critical
Publication of JP4874828B2 publication Critical patent/JP4874828B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、インターネット等のネットワーク上に存在するWebサイト、ブログ(Blog、Web Log:日記風のサイト)等の多数のノードの中から所望の情報を豊富に掲載するノードを提示する技術に関する。
インターネット上の膨大な情報の中から所望の情報を効率的に閲覧するために検索エンジンが用いられている。
これらの検索エンジンでは、一般に、各ノードのページに含まれるキーワードを予めインデックス化しておき、そのインデックスに対して検索クエリを実行することで、指定した検索タームを含むノードの一覧を取得し、その一覧を経由してノードへのアクセスを行うようになっている。
しかしながら、単に所定のキーワードが含まれるか否かという観点からのノードの選定では、同じキーワードが用いられているものであっても所望するものとは全く異なるトピック(話題)に関するノードである可能性も低くなく、ユーザが満足する結果が得られないことも多い。
このような問題に対し、共通のトピックを扱うノードの集合であるコミュニティに着目することで検索精度を高められるのではないかという模索がなされている。コミュニティを特定することができれば、そのトピックから外れたノードを除外することができ、検索精度を高めることが可能になる。
特定のトピックに関するWebページ集合を抽出する手法としてHITS(Hyperlink Induced Topic Search)アルゴリズムが存在する(非特許文献1)。HITSアルゴリズムは、検索クエリ(トピック)に関して、トピックに関する情報が豊富なページをオーソリティ(authority)、オーソリティへのリンクが豊富なページをハブ(hub)と定義し、それらの集合をコミュニティとして抽出し、Webページの関係性を把握する手法である。
しかし、HITSアルゴリズムには、トピックドリフト(topic drift)と呼ばれる問題点が指摘されている。これは、個人のリンク集のページにおいては複数のトピックのリンク集を掲載しているものが多く、ハブの中に目的とは異なるトピックのリンクが含まれている場合、それらのリンク先のページのオーソリティとしての値が高くなってしまい、目的とするトピックと関連のないページがオーソリティと認識されてしまう現象である。図1はトピックドリフトの例を示す図であり、リンク集のWebページP1がトピック「ラーメン」についてのWebページP2とトピック「サッカー」についてのWebページP3にリンクしているものとすると、本来はWebページP2とWebページP1が「ラーメン」コミュニティC1と認識され、WebページP3とWebページP1が「サッカー」コミュニティC2と認識されるべきところ、一つのコミュニティC3と認識されてしまうことになる。
このようなトピックドリフトの問題を改善する試みとして、いくつかの手法が提案されている。
非特許文献2では、ハブに含まれているリンク集の中にDOM(Document Object Model)を導入することにより、ハブを細分化することでHITSアルゴリズムを改良している。
また、非特許文献3では、センタ(centers)とファン(fans)という概念を用い、あるトピックに対してセンタとして複数のURL(Uniform Resource Locator)を与え、それらのURL全てにリンクするページをファンとして抽出する。センタに含まれるページをファンの多数からリンクされるものへと更新処理を繰り返すことにより、トピックにおける中心的なページ集合を求めている。
なお、上述のようにWeb全体を対象としてリンク構造を解析してページ集合を抽出する研究は行われてきたが、近年爆発的に普及しているブログの特性に着目して行われた研究は存在しない。
J. Kleinberg. Authoritative sources in a hyperlinked environment. Proc. 9th ACM-SIAM Symposium on Discrete Algorithms, 1998. Extended version in Journal of the ACM 46(1999). Integrating the Document Object Model with Hyperlinks for Enhanced Topic Distillation and Information Extraction Proc. of the 10th International WWW conference, pp.211-220, 2001 「ハイパーリンクのグラフ構造に基づくWebコミュニティの洗練」村田 剛志 人工知能学会誌, Vol.17, No.3, pp.322-329, 2002.
昨今のブログの爆発的な普及によりブログに対する検索需要も増大してきているが、上述したようにブログの特性に着目して行われた研究は存在せず、新たな手法が要望されている。すなわち、ブログは従来のWebサイトとは異なり、以下に説明するような特性があり、HITSアルゴリズムをそのまま適用すると多くのトピックにおいてトピックドリフトと同様の問題が発生し、目的に合ったコミュニティを抽出することが難しい。
(1)マルチトピックス(Multi-topics)性
ブログにおいては、一つのブログ記事(エントリ)に複数のトピック(マルチトピックス)が含まれる現象がよく見られる。このようなマルチトピックスがあると、前述したトピックドリフトと同様の問題が発生する。図2はブログ記事のマルチトピックスの例を示す図であり、ブログB11のトピック「ラーメン」についてブログB12からリンクし、ブログB11のトピック「サッカー」についてブログB13からリンクしているものとすると、本来はブログB11とブログB12が「ラーメン」コミュニティC11と認識され、ブログB11とブログB13が「サッカー」コミュニティC12と認識されるべきところ、一つのコミュニティC13と認識されてしまうことになる。
このように、同じブログに対するリンク元が異なるコミュニティに属する可能性があり得るため、リンク元のリンク意図を識別して異なるコミュニティに属するのか否かの見分けが必要となる。ブログでもリンク(inbound links、outbound links)およびトラックバックによってWebページと同様に巨大なグラフを構築しており、Webページと比較してコミュニティの性質はより顕著となっているが、マルチトピックス性に起因して正確なコミュニティの抽出が妨げられる。
(2)エントリ依存性
ブログではエントリ毎にトピックが異なることが多く、一般的なサイトを単位とする手法では正確にコミュニティを抽出することができない。
(3)時効性
ブログのコミュニティは短期間のうちに消滅したり新たに発生したりすることが多く、ブログないしコミュニティを特徴付けるタームも同様に短期間のうちに変化していく。従って、これらの変化に追随できる仕組としなければならない。
(4)情報の散在、非組織化
ブログでは通常のWebページと比較して情報が散在しており、組織化されていない。従って、単にコミュニティ単位にブログをまとめるだけでなく、階層化された見通しのよいものとしなければならない。
(5)トラックバックリンクの存在
ブログでは通常のリンクに加えトラックバックリンクが存在し、その取り扱いをいかなるものにするか決定しなければならない。
このように、ブログ記事のコミュニティ性が顕在であるにもかかわらず、このコミュニティを中心に整理するブログ検索エンジンはまだ存在しない。
本発明は上記の従来の問題点に鑑み提案されたものであり、その目的とするところは、一般のWebページに加え、ブログに対してもコミュニティ中心に階層的に整理した適切な検索用インデックスを作成することのできるコミュニティ抽出による検索用インデックス作成方法およびその装置を提供することにある。
上記の課題を解決するため、本発明にあっては、請求項1に記載されるように、検索用インデックス作成装置のクラスタリング手段が、対象となる所定期間のクエリログであって、主たる検索タームであるクエリと当該クエリと同時に用いられた検索タームである共起語とが発生頻度をともなって記録された情報から、上記発生頻度の相関の強いクエリ同士をグループ化してターム集合であるクラスタにクラスタリングを行うクラスタリング工程と、上記検索用インデックス作成装置のラベリング手段が、上記クラスタリングにより得られた各クラスタに対してラベル付けを行うラベリング工程と、上記検索用インデックス作成装置のルートセット作成手段が、ラベルの付された各クラスタのタームに基づいて当該タームを含むクラスタ毎のノードの集合であるルートセットを作成するルートセット作成工程と、上記検索用インデックス作成装置のベースセット作成手段が、作成されたルートセットに含まれる各ノードに基づいて当該ノードのクラスタ毎のリンク先とリンク元のノードの集合であるベースセットを作成するベースセット作成工程と、上記検索用インデックス作成装置のコミュニティ抽出手段が、作成されたベースセットに含まれる各ノードにオーソリティの重みとハブの重みを割り当て、ベースセットの全ノードのオーソリティの重みを要素に持つベクトルとベースセットの全ノードのハブの重みを要素に持つベクトルとを割り当て、HITSアルゴリズムにより最大固有値に対応する固有ベクトルおよび最大固有値以外の固有値に対応する固有ベクトルを算出し、最大固有値に対応するオーソリティの重みおよびハブの重みを大きい順に配置した序列と最大固有値以外の固有値に対応するオーソリティの重みおよびハブの重みを大きい順に配置した序列とをクラスタ毎にコミュニティ抽出結果として生成するコミュニティ抽出工程と、上記検索用インデックス作成装置のフレーズ抽出手段が、コミュニティ抽出結果の上位序列の所定数のオーソリティおよびハブからフレーズの抽出を行うフレーズ抽出工程と、上記検索用インデックス作成装置のディレクトリ作成手段が、上記クラスタに付されたラベル、上記クラスタに含まれるターム、上記オーソリティおよびハブから抽出されたフレーズ、ならびに上記オーソリティおよびハブを、階層構造に配置したディレクトリを作成するディレクトリ作成工程と、上記検索用インデックス作成装置のインデックス作成手段が、作成されたディレクトリに基づいて検索用のインデックスを作成するインデックス作成工程とを備えるコミュニティ抽出による検索用インデックス作成方法を要旨としている。
また、請求項2に記載されるように、請求項1に記載のコミュニティ抽出による検索用インデックス作成方法において、上記クラスタリング工程は、上記クエリログからクエリと共起語の発生頻度を表すクエリ/共起語の行列を作成する工程と、作成されたクエリ/共起語の行列から検索ターム間の相関を表す共起行列を作成する工程と、作成された共起行列から相関の強いクエリ同士をグループ化してクラスタリングを行う工程とを備えるようにすることができる。
また、請求項3に記載されるように、請求項1に記載のコミュニティ抽出による検索用インデックス作成方法において、上記ラベリング工程は、カテゴリデータを用いてラベルを付すようにすることができる。
また、請求項4に記載されるように、請求項1に記載のコミュニティ抽出による検索用インデックス作成方法において、上記ルートセット作成工程は、各クラスタのタームにより、キーワードと対応するノードの対応を表すキーワード/URLテーブルを検索してクラスタ毎のノードの集合であるルートセットを作成するようにすることができる。
また、請求項5に記載されるように、請求項1に記載のコミュニティ抽出による検索用インデックス作成方法において、上記ベースセット作成工程は、作成されたルートセットに含まれる各ノードにつき、ノードとリンクの相手方のノードの対応を表すURL/リンクテーブルを検索することで、クラスタ毎のリンク先とリンク元のノードの集合であるベースセットを作成するようにすることができる。
また、請求項6に記載されるように、請求項1に記載のコミュニティ抽出による検索用インデックス作成方法において、上記コミュニティ抽出工程は、最大固有値に対応する固有ベクトルの計算と最大固有値以外の固有値に対応する固有ベクトルの計算とを並列的に行うようにすることができる。
また、請求項7に記載されるように、請求項1に記載のコミュニティ抽出による検索用インデックス作成方法において、上記コミュニティ抽出工程の最大固有値に対応する固有ベクトルの計算は、オーソリティの重みベクトルとハブの重みベクトルの両者の要素を「1」とする初期化の工程と、係数行列Eとオーソリティの重みベクトルの乗算結果のハブの重みベクトルへの代入、ハブの重みベクトルの絶対値の計算、ハブの重みベクトルをハブの重みベクトルの絶対値で除算した結果のハブの重みベクトルへの代入、係数行列Eとハブの重みベクトルの乗算結果のオーソリティの重みベクトルへの代入、オーソリティの重みベクトルの絶対値の計算、オーソリティの重みベクトルをオーソリティの重みベクトルの絶対値で除算した結果のオーソリティの重みベクトルへの代入を順次に行い、値が収束まで繰り返す工程とを備えるようにすることができる。
また、請求項8に記載されるように、請求項1に記載のコミュニティ抽出による検索用インデックス作成方法において、上記コミュニティ抽出工程の最大固有値以外の固有値に対応する固有ベクトルの計算は、子空間反復法により計算を行うようにすることができる。
また、請求項9に記載されるように、請求項1に記載のコミュニティ抽出による検索用インデックス作成方法において、上記フレーズ抽出工程は、抽出された上位所定数のオーソリティおよびハブのノードにつきフレーズ辞書を用いて特徴的なフレーズを抽出するようにすることができる。
また、請求項10に記載されるように、請求項1に記載のコミュニティ抽出による検索用インデックス作成方法において、上記ディレクトリ作成工程は、第1階層にラベルを設定する工程と、第2階層に各タームを設定する工程と、第3階層にフレーズ抽出で得られたフレーズを設定する工程と、第4階層に、対応するオーソリティのうち最大固有値に対応するもの、最大固有値以外の固有値に対応するものの順に設定する工程と、第5階層に、ハブのうち最大固有値に対応するもの、最大固有値以外の固有値に対応するものの順に設定する工程とを備えるようにすることができる。
また、請求項11に記載されるように、請求項1に記載のコミュニティ抽出による検索用インデックス作成方法において、上記インデックス作成工程は、第1階層に上記クラスタに付されたラベルを設定する工程と、第2階層に上記クラスタに含まれるタームを設定する工程と、第3階層に上記オーソリティおよびハブのノードから抽出されたフレーズを設定する工程と、上記第3階層に合致するノードのURLとオーソリティ/ハブの区別を対応付けて設定する工程とを備えるようにすることができる。
また、請求項12に記載されるように、コミュニティ抽出による検索用インデックス作成装置として構成することができる。
本発明のコミュニティ抽出による検索用インデックス作成方法およびその装置にあっては、一般のWebページに加え、ブログに対しても適切な検索用インデックスを作成することができる。
以下、本発明の好適な実施形態につき説明する。
<システム構成>
図3は本発明の一実施形態にかかるシステムの構成例を示す図である。
図3において、本システムは、コミュニティ抽出の対象となるタームのクラスタリングを行うクラスタリングサーバ1と、クラスタリングされたタームに基づいてコミュニティの抽出を行い、検索用インデックスを作成するコミュニティ抽出サーバ2と、作成された検索用インデックスに基づいてブログの検索を行うブログ検索サーバ3と、インターネット等のネットワーク4を介してブログ検索サーバ3にアクセスして検索を要求し検索結果を取得するユーザ端末5と、処理に用いられる各種のデータを保持するデータベース類101〜106とを備えている。
クラスタリングサーバ1は、ブログ検索サーバ3から所定期間内の検索内容を示すクエリ(検索ターム)ログを収集してクエリログDB101に格納するクエリログ収集部11と、クエリログ(PV(Page View)数等による上位の所定数を対象)からクエリと共起語(主たる検索タームであるクエリに付随する検索ターム)の発生頻度を表すクエリ/共起語の行列を経て検索ターム間の相関を表す共起行列を作成する共起行列作成部12と、共起行列から相関の強いクエリ同士をグループ化してクラスタリングを行い、結果をターム集合としてターム集合DB102に格納するクラスタリング処理部13と、クラスタリングされた各クラスタのターム集合に対してカテゴリDB103のカテゴリデータを用いてラベルを付すラベリング部14とを備えている。
コミュニティ抽出サーバ2は、コミュニティ抽出のための事前処理として、対象範囲内の全ブログを想定されるキーワードにより検索し、キーワードと対応するノード(ブログエントリのURL)の対応を表すキーワード/URLテーブルを作成するとともに、各ノードの書誌情報を記録したURL/書誌情報テーブルを作成してブログDB104に格納するブログ検索部21と、各ブログのリンク(そのノードから他のノードを参照するアウトバウンドリンク、そのノードに対するトラックバックリンク、そのノードを参照してくるインバウンドリンク)を抽出し、ノードとリンクの相手方のノードの対応を表すURL/リンクテーブルを作成してブログDB104に格納するリンク取得部22とを備えている。
コミュニティ抽出サーバ2は、更に、ターム集合DB102の各クラスタのタームによりブログDB104のキーワード/URLテーブルを検索してクラスタ毎のノードの集合であるルートセットを作成するルートセット作成部23と、作成されたルートセットに含まれる各ノードにつきブログDB104のURL/リンクテーブルを検索することで、クラスタ毎のリンク先とリンク元のノードの集合であるベースセットを作成するベースセット作成部24と、作成されたベースセットからHITSアルゴリズムによりコミュニティ抽出を行うコミュニティ抽出部(HITS計算部)25と、抽出された上位所定数のオーソリティおよびハブのノードにつき、フレーズ辞書105およびURL/書誌情報テーブルを用いて特徴的なフレーズを抽出するフレーズ抽出部26と、クラスタ、ラベル、ターム(ターム集合に含まれる各ターム)、フレーズに基づいて各コミュニティ内のオーソリティおよびハブの位置付けを表すディレクトリを作成するディレクトリ作成部27と、作成されたディレクトリに基づいて検索用のインデックスを作成してインデックスDB106に格納するインデックス作成部28とを備えている。
<動作>
図4は上記の実施形態の全体的な処理の流れを示す図である。
図4において、クラスタリングサーバ1のクエリログ収集部11はブログ検索サーバ3から対象となる所定期間のクエリログを収集し、クエリログDB101に格納する(ステップS1)。図5はクエリログの例を示す図であり、主たる検索タームであるクエリと、その検索に際して同時に設定された第2、第3・・・の検索タームである共起語とが、PV数を伴って記録されたものとなっている。なお、順位はクエリのPV数に応じて付されており、上位所定数のデータを後続の処理の対象とする。また、セッション情報やカテゴリ関連付けの情報をクエリの属性として付加してもよい。
図4に戻り、これと並行して、コミュニティ抽出サーバ2のブログ検索部21はブログの検索を行ってキーワード/URLテーブルおよびURL/書誌情報テーブルを作成するとともに、リンク取得部22は各ブログのリンクを抽出してURL/リンクテーブルを作成し、これらをブログDB104に格納する(ステップS2)。図6はキーワード/URLテーブルの例を示す図であり、所定のキーワードとそのキーワードを多く含むブログのURLとが対応付けられたものとなっている。図7はURL/書誌情報テーブルの例を示す図であり、ノードのURL毎にタイトル、作者、要約、更新日等が記録されたものとなっている。図8はURL/リンクテーブルの例を示す図であり、ブログのURLに対し、本文と、アウトバンドURLと、トラックバックURLと、インバウンドURLとが対応付けられたものとなっている。
図4に戻り、クラスタリングサーバ1の共起行列作成部12はクエリログDB101からクエリログを取得し、クエリ/共起語の行列Mを作成する(ステップS3)。図9はクエリ/共起語の行列Mの例を示す図であり、複数のクエリと複数の共起語の組み合わせに対するPV数が記録されたものとなっている。
図4に戻り、クラスタリングサーバ1の共起行列作成部12はクエリ/共起語の行列Mから
W=MM (MはMの転置行列)
で計算される共起行列Wを作成する(ステップS4)。図10は共起行列Wの例を示す図であり、複数のクエリ同士の組み合わせに対する相関値wが記録されたものとなっている。
図4に戻り、クラスタリングサーバ1のクラスタリング処理部13は共起行列Wの各相関値wから、相関の強いクエリ同士をグループ化してクラスタリングを行い、結果をターム集合としてターム集合DB102に格納する(ステップS5)。クラスタ内のタームの数(m)には上限を設ける(例:m=6)。図11はターム集合の例を示す図であり、(a)は各クエリのクラスタリングの様子を概念的に示したもの、(b)はターム集合のデータ形式の例である。ここでは、クエリ「クリスマス」とクエリ「イルミネーション」の相関が強いものとして、これらが同じクラスタ#1に入れられたものとしている。
図4に戻り、クラスタリングサーバ1のラベリング部14はターム集合DB102に格納されたターム集合に対してカテゴリDB103のカテゴリデータを用いてラベルを付し、ターム集合DB102に格納する(ステップS6)。図12はカテゴリデータの例を示す図であり、クラスタ#1のターム「クリスマス」「イルミネーション」の上位階層(全てのタームより上位である直近の階層)の「祝日、記念日、年中行事」がラベルとして選ばれたことを示している。図13はターム集合(ラベル付)の例を示す図であり、(a)は各クエリのラベリングの様子を概念的に示したもの、(b)はラベルが付されたターム集合のデータ形式の例である。ここでは、「クリスマス」「イルミネーション」のクラスタ#1にラベル「祝日、記念日、年中行事」が付され、「ラーメン○○館」のクラスタ#2にラベル「フードテーマパーク」が付され、「アジア大会」のクラスタ#3にラベル「国際大会」が付され、「焼酎」のクラスタ#4にラベル「アルコール」が付されたものとしている。
図4に戻り、コミュニティ抽出サーバ2のルートセット作成部23はターム集合DB102のラベルの付された各クラスタのタームによりブログDB104のキーワード/URLテーブルを検索してクラスタ毎の出現頻度上位のノード(ノード数nは例えばn=10)の集合(m個のタームについてn個のノードとなるため最大でm×n個のノード)であるルートセットを作成する(ステップS7)。キーワード/URLテーブルの例は既に図6に示した。図14は作成されたルートセットの例を示す図であり、各クラスタに対応するノードのURLが記録されたものとなっている。
図4に戻り、コミュニティ抽出サーバ2のベースセット作成部24は作成されたルートセットに含まれる各ノードにつきブログDB104のURL/リンクテーブルを検索することで、クラスタ毎のリンク先とリンク元のノードの集合であるベースセットを作成する(ステップS8)。なお、トラックバックリンクはインバウンドリンクとして扱う。URL/リンクテーブルの例は既に図8に示した。図15は作成されたベースセットの例を示す図であり、各クラスタに対応するリンク先のURLとリンク元のURLとが記録されたものとなっている。
図4に戻り、コミュニティ抽出サーバ2のコミュニティ抽出部25は作成されたベースセットからHITSアルゴリズムによりコミュニティ抽出を行う(ステップS9)。以下、コミュニティ抽出の処理につき詳細に説明する。
図16はコミュニティ抽出の概要を示す図であり、説明を簡便にするためにノードが6個の場合を示している。実際には、対象とするブログの範囲にもよるが、本出願人の運営するサービスで検索対象とするノード(ブログエントリ)数は数千万〜数億に達する。
図16において、各ノードN〜Nはオーソリティの重みaとハブの重みhとが対になって、トピック(各クラスタ毎のテーマとなる話題)の数だけa、hの対が存在する。なお、a、hのサブスクリプト(下付数字)は対応するノードの番号を示し、スーパースクリプト(上付数字)はトピックの番号を示している。
また、図16ではあるトピックにつき、各ノードN〜Nに矢印付の線で示されるようなリンク関係(矢印の先がリンク先、反対側がリンク元)があることがベースセットで示されているものとする。
オーソリティの重みaはそのノードにリンクしてくるハブの重みの総和と定義されるため、図16の場合のあるトピックについてのオーソリティの重みa〜aは図17(a)に示すようになり、係数部分を行列Eと置けば、ハブの重みベクトルに左から行列Eを乗算したものがオーソリティの重みベクトルとなる。
同様に、ハブの重みhはそのリンク先のノードのオーソリティの重みの総和と定義されるため、図16の場合のあるトピックについてのハブの重みh〜hは図17(b)に示すようになり、係数部分は行列Eとなり、オーソリティの重みベクトルに左から行列Eを乗算したものがハブの重みベクトルとなる。
これらのオーソリティおよびハブの重みのベクトル式を相互に代入することにより、図17(c)に示すように、オーソリティの重みベクトルは自己に左側から行列EEを乗算したものとなり、ハブの重みベクトルは自己に左側から行列EEを乗算したものとなる。従って、オーソリティおよびハブの重みベクトルを求めることは、行列EE、EEの固有値に対応する固有ベクトルを求めることにほかならない。ただし、次元が多い場合は公式等から即座に固有値および固有ベクトルを求めることはできず、反復した数値計算が必要になる。
従来のHITSアルゴリズムの研究においては、各Webサイトについて1つのトピックにおけるオーソリティ−ハブ関係を抽出するために、基本固有ベクトル値のみを用いていたが、本発明においては、ブログの特徴に鑑み、各エントリについて複数のトピックにおけるオーソリティ−ハブ関係を抽出するため、基本固有ベクトル値と合わせて、その他の複数の固有ベクトル値についても計算を行うこととしている。
図18はコミュニティ抽出のための固有ベクトルの計算処理の例を示すフローチャートである。
図18において、処理を開始すると(ステップS101)、最大固有値に対応する固有ベクトルの計算(ステップS102)と最大固有値以外の固有値に対応する固有ベクトルの計算(ステップS107)とを並列的に行い、両者の完了をもって処理を終了する(ステップS113)。
最大固有値に対応する固有ベクトルの計算(ステップS102)では、初期化処理として、オーソリティの重みベクトルとハブの重みベクトルの両者の全要素を「1」とする(ステップS103)。
次いで、行列Eとオーソリティの重みベクトルの乗算結果のハブの重みベクトルへの代入、ハブの重みベクトルの絶対値の計算、ハブの重みベクトルをハブの重みベクトルの絶対値で除算した結果のハブの重みベクトルへの代入、行列Eとハブの重みベクトルの乗算結果のオーソリティの重みベクトルへの代入、オーソリティの重みベクトルの絶対値の計算、オーソリティの重みベクトルをオーソリティの重みベクトルの絶対値で除算した結果のオーソリティの重みベクトルへの代入を順次に行う(ステップS104)。
そして、値が収束したか否か判断し(ステップS105)、収束していない場合は演算処理(ステップS104)を繰り返し、収束した場合はその時点でのオーソリティの重みベクトルとハブの重みベクトルの要素を大小の序列をもって出力する(ステップS106)。
一方、最大固有値以外の固有値に対応する固有ベクトルの計算(ステップS107)では、子空間反復法(Subspace Iteration)により計算を行う。
k番目までの固有値を求めるものとすると、G=EEで表される行列Gを計算するとともに、行列Gのk列までの部分行列Aを求める(ステップS108)。
次いで、行列Gと行列Aの乗算結果を行列Aに代入する(ステップS109)。
次いで、変数iを1からkまで変化させ、その都度に行列Aのi列について図示の演算結果を順次に代入する(ステップS110)。これは「Gram-Schmidt Orthonormalization」に基づいている。
そして、値が収束したか否か判断し(ステップS111)、収束していない場合は演算処理(ステップS109)から処理を繰り返し、収束した場合は、部分行列Aの各列は行列Gのk番目までの固有値に対応した固有ベクトルとなり、固有値の順番毎に、その時点でのオーソリティの重みベクトルとハブの重みベクトルの要素を大小の序列をもって出力する(ステップS112)。
図19は最大固有値に対応する固有ベクトルの演算処理(ステップS104)の1回目の計算例を示し、図20は2回目の計算例を示しており、同様の計算を繰り返すことにより所定の値に収束していく。
図21は最大固有値以外の固有値に対応する固有ベクトルの演算処理(ステップS108)の計算例を示し、図22(a)は演算処理(ステップS109)の計算例を示し、図22(b)は演算処理(ステップS110)の計算例を示し、図22と同様の計算を繰り返すことにより所定の値に収束していく。
図23はコミュニティ抽出結果の例を示す図であり、第1、第2、・・・のクラスタ(トピック)についてのオーソリティおよびハブの序列が出力され、それぞれに最大固有値に対応するオーソリティおよびハブの序列と、最大固有値以外の固有値に対応するオーソリティおよびハブの序列とが含まれる。ノードが複数のコミュニティに属する場合には異なるオーソリティの重みおよびハブの重みを持つことから、コミュニティを仕分けることができ、それぞれのコミュニティ内のオーソリティおよびハブを見つけることもできる。ブログにおいては、各エントリが、あるトピックについてはオーソリティとなり、あるトピックについてはハブになることがある。
図4に戻り、コミュニティ抽出サーバ2のフレーズ抽出部26はコミュニティ抽出結果の上位序列の所定数のオーソリティおよびハブにつき、フレーズ辞書105およびURL/書誌情報テーブルを用いてキーとなるフレーズの抽出を行い、ディレクトリ作成部27はクラスタ、ラベル、ターム(ターム集合に含まれる各ターム)、フレーズに基づいて各コミュニティ内のオーソリティおよびハブの位置付けを表すディレクトリを作成し、インデックス作成部28は作成されたディレクトリに基づいて検索用のインデックスを作成し、インデックスDB106に格納する(ステップS10)。
図24はコミュニティのディレクトリ構造の例を示す図であり、図13のクラスタ#1についての例であるが、ラベル「祝日、記念日、年中行事」を第1階層にして、第2階層にターム「クリスマス」「イルミネーション」が入り、「クリスマス」の下の第3階層にはフレーズ抽出で得られた「プレゼント」「ディナー」等が入り、「イルミネーション」の下の第3階層にはフレーズ抽出で得られた「クリスマス」「表参道」等が入り、それぞれの第3階層の下の第4階層には対応するオーソリティが最大固有値に対応するもの、最大固有値以外の固有値に対応するものの順に入り、その下の第5階層にハブが最大固有値に対応するもの、最大固有値以外の固有値に対応するものの順に入る。なお、オーソリティ直前までの階層を3階層としているが、検索時の使い勝手等を考慮して階層を任意に増減することができる。
図25はインデックスデータの例を示す図であり、第1階層をコミュニティとし、第2階層を大キーワードとし、第3階層を小キーワードとし、それらに合致するノードのURLとオーソリティ/ハブの区別が対応付けられている。
ブログ検索サーバ3(図3)はユーザ端末5からネットワーク4を介して検索要求を受け付けると、インデックスDB106の検索用のインデックスに基づいて検索を行い、検索結果をユーザ端末5に返す。
<総括>
以上説明したように、本発明の実施形態にあっては、次のような利点がある。
(1)複数の固有ベクトルを利用することで、リンク先のエントリに複数のトピックが存在する場合でも、ブログの複数トピックに対応するコミュニティを見つけ出すことができる。しかも、リンク構造分析のみに着目してコミュニティをトピックごとに整理し階層化することができる。
(2)ブログのサイト単位ではなくエントリ単位にコミュニティの抽出を行うため、エントリ毎にトピックが異なる場合にも精度の高いコミュニティ抽出を行うことができる。
(3)ブログ検索のクエリログを利用して随時にオフライン(offline)処理を行い、常にランキング上位の検索クエリを利用することで、話題性のあるコミュニティをつかめ、新生や消滅するコミュニティを対象に絞り込むことが可能となる。
(4)それぞれのコミュニティ内にオーソリティおよびハブの存在で自然に階層的な構造が作り上げられていることを利用することで、今までは散在していたブログの情報を組織化し、階層構造として表示することができ、閲覧者にとって情報が探しやすくなる。それにより、例えばあるトピックについてブログの情報を調べる場合、より凝縮した内容のみ調べたい場合はオーソリティとなるエントリを調べれば済み、より掘り下げてそのトピックがブログでどの様に言及されているかを調べたい場合はハブとなるエントリを調べるといった使い分けができるようになる。従って、ブログで発信される情報の信頼性を図る指標を提供することができる。
(5)トラックバックリンクをインバウンドリンクとして扱うことにより、大きな変更を加えずにHITSアルゴリズムを用いることができる。
以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範な趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更を加えることができることは明らかである。すなわち、具体例の詳細および添付の図面により本発明が限定されるものと解釈してはならない。
トピックドリフトの例を示す図である。 ブログ記事のマルチトピックスの例を示す図である。 本発明の一実施形態にかかるシステムの構成例を示す図である。 実施形態の全体的な処理の流れを示す図である。 クエリログの例を示す図である。 キーワード/URLテーブルの例を示す図である。 URL/書誌情報テーブルの例を示す図である。 URL/リンクテーブルの例を示す図である。 クエリ/共起語の行列の例を示す図である。 共起行列の例を示す図である。 ターム集合の例を示す図である。 カテゴリデータの例を示す図である。 ターム集合(ラベル付)の例を示す図である。 ルートセットの例を示す図である。 ベースセットの例を示す図である。 コミュニティ抽出の概要を示す図(その1)である。 コミュニティ抽出の概要を示す図(その2)である。 コミュニティ抽出のための固有ベクトルの計算処理の例を示すフローチャートである。 固有ベクトルの計算例を示す図(その1)である。 固有ベクトルの計算例を示す図(その2)である。 固有ベクトルの計算例を示す図(その3)である。 固有ベクトルの計算例を示す図(その4)である。 コミュニティ抽出結果の例を示す図である。 コミュニティのディレクトリ構造の例を示す図である。 インデックスデータの例を示す図である。
符号の説明
1 クラスタリングサーバ
11 クエリログ収集部
12 共起行列作成部
13 クラスタリング処理部
14 ラベリング部
2 コミュニティ抽出サーバ
21 ブログ検索部
22 リンク取得部
23 ルートセット作成部
24 ベースセット作成部
25 コミュニティ抽出部
26 フレーズ抽出部
27 ディレクトリ作成部
28 インデックス作成部
3 ブログ検索サーバ
4 ネットワーク
5 ユーザ端末
101 クエリログDB
102 ターム集合DB
103 カテゴリDB
104 ブログDB
105 フレーズ辞書
106 インデックスDB

Claims (12)

  1. 検索用インデックス作成装置のクラスタリング手段が、対象となる所定期間のクエリログであって、主たる検索タームであるクエリと当該クエリと同時に用いられた検索タームである共起語とが発生頻度をともなって記録された情報から、上記発生頻度の相関の強いクエリ同士をグループ化してターム集合であるクラスタにクラスタリングを行うクラスタリング工程と、
    上記検索用インデックス作成装置のラベリング手段が、上記クラスタリングにより得られた各クラスタに対してラベル付けを行うラベリング工程と、
    上記検索用インデックス作成装置のルートセット作成手段が、ラベルの付された各クラスタのタームに基づいて当該タームを含むクラスタ毎のノードの集合であるルートセットを作成するルートセット作成工程と、
    上記検索用インデックス作成装置のベースセット作成手段が、作成されたルートセットに含まれる各ノードに基づいて当該ノードのクラスタ毎のリンク先とリンク元のノードの集合であるベースセットを作成するベースセット作成工程と、
    上記検索用インデックス作成装置のコミュニティ抽出手段が、作成されたベースセットに含まれる各ノードにオーソリティの重みとハブの重みを割り当て、ベースセットの全ノードのオーソリティの重みを要素に持つベクトルとベースセットの全ノードのハブの重みを要素に持つベクトルとを割り当て、HITSアルゴリズムにより最大固有値に対応する固有ベクトルおよび最大固有値以外の固有値に対応する固有ベクトルを算出し、最大固有値に対応するオーソリティの重みおよびハブの重みを大きい順に配置した序列と最大固有値以外の固有値に対応するオーソリティの重みおよびハブの重みを大きい順に配置した序列とをクラスタ毎にコミュニティ抽出結果として生成するコミュニティ抽出工程と、
    上記検索用インデックス作成装置のフレーズ抽出手段が、コミュニティ抽出結果の上位序列の所定数のオーソリティおよびハブからフレーズの抽出を行うフレーズ抽出工程と、
    上記検索用インデックス作成装置のディレクトリ作成手段が、上記クラスタに付されたラベル、上記クラスタに含まれるターム、上記オーソリティおよびハブから抽出されたフレーズ、ならびに上記オーソリティおよびハブを、階層構造に配置したディレクトリを作成するディレクトリ作成工程と、
    上記検索用インデックス作成装置のインデックス作成手段が、作成されたディレクトリに基づいて検索用のインデックスを作成するインデックス作成工程とを備えたことを特徴とするコミュニティ抽出による検索用インデックス作成方法。
  2. 請求項1に記載のコミュニティ抽出による検索用インデックス作成方法において、
    上記クラスタリング工程は、
    上記クエリログからクエリと共起語の発生頻度を表すクエリ/共起語の行列を作成する工程と、
    作成されたクエリ/共起語の行列から検索ターム間の相関を表す共起行列を作成する工程と、
    作成された共起行列から相関の強いクエリ同士をグループ化してクラスタリングを行う工程とを備えたことを特徴とするコミュニティ抽出による検索用インデックス作成方法。
  3. 請求項1に記載のコミュニティ抽出による検索用インデックス作成方法において、
    上記ラベリング工程は、カテゴリデータを用いてラベルを付すことを特徴とするコミュニティ抽出による検索用インデックス作成方法。
  4. 請求項1に記載のコミュニティ抽出による検索用インデックス作成方法において、
    上記ルートセット作成工程は、各クラスタのタームにより、キーワードと対応するノードの対応を表すキーワード/URLテーブルを検索してクラスタ毎のノードの集合であるルートセットを作成することを特徴とするコミュニティ抽出による検索用インデックス作成方法。
  5. 請求項1に記載のコミュニティ抽出による検索用インデックス作成方法において、
    上記ベースセット作成工程は、作成されたルートセットに含まれる各ノードにつき、ノードとリンクの相手方のノードの対応を表すURL/リンクテーブルを検索することで、クラスタ毎のリンク先とリンク元のノードの集合であるベースセットを作成することを特徴とするコミュニティ抽出による検索用インデックス作成方法。
  6. 請求項1に記載のコミュニティ抽出による検索用インデックス作成方法において、
    上記コミュニティ抽出工程は、最大固有値に対応する固有ベクトルの計算と最大固有値以外の固有値に対応する固有ベクトルの計算とを並列的に行うことを特徴とするコミュニティ抽出による検索用インデックス作成方法。
  7. 請求項1に記載のコミュニティ抽出による検索用インデックス作成方法において、
    上記コミュニティ抽出工程の最大固有値に対応する固有ベクトルの計算は、
    オーソリティの重みベクトルとハブの重みベクトルの両者の要素を「1」とする初期化の工程と、
    係数行列Eとオーソリティの重みベクトルの乗算結果のハブの重みベクトルへの代入、ハブの重みベクトルの絶対値の計算、ハブの重みベクトルをハブの重みベクトルの絶対値で除算した結果のハブの重みベクトルへの代入、係数行列Eとハブの重みベクトルの乗算結果のオーソリティの重みベクトルへの代入、オーソリティの重みベクトルの絶対値の計算、オーソリティの重みベクトルをオーソリティの重みベクトルの絶対値で除算した結果のオーソリティの重みベクトルへの代入を順次に行い、値が収束まで繰り返す工程とを備えたことを特徴とするコミュニティ抽出による検索用インデックス作成方法。
  8. 請求項1に記載のコミュニティ抽出による検索用インデックス作成方法において、
    上記コミュニティ抽出工程の最大固有値以外の固有値に対応する固有ベクトルの計算は、子空間反復法により計算を行うことを特徴とするコミュニティ抽出による検索用インデックス作成方法。
  9. 請求項1に記載のコミュニティ抽出による検索用インデックス作成方法において、
    上記フレーズ抽出工程は、抽出された上位所定数のオーソリティおよびハブのノードにつきフレーズ辞書を用いて特徴的なフレーズを抽出することを特徴とするコミュニティ抽出による検索用インデックス作成方法。
  10. 請求項1に記載のコミュニティ抽出による検索用インデックス作成方法において、
    上記ディレクトリ作成工程は、
    第1階層にラベルを設定する工程と、
    第2階層に各タームを設定する工程と、
    第3階層にフレーズ抽出で得られたフレーズを設定する工程と、
    第4階層に、対応するオーソリティのうち最大固有値に対応するもの、最大固有値以外の固有値に対応するものの順に設定する工程と、
    第5階層に、ハブのうち最大固有値に対応するもの、最大固有値以外の固有値に対応するものの順に設定する工程とを備えたことを特徴とするコミュニティ抽出による検索用インデックス作成方法。
  11. 請求項1に記載のコミュニティ抽出による検索用インデックス作成方法において、
    上記インデックス作成工程は、
    第1階層に上記クラスタに付されたラベルを設定する工程と、
    第2階層に上記クラスタに含まれるタームを設定する工程と、
    第3階層に上記オーソリティおよびハブのノードから抽出されたフレーズを設定する工程と、
    上記第3階層に合致するノードのURLとオーソリティ/ハブの区別を対応付けて設定する工程とを備えたことを特徴とするコミュニティ抽出による検索用インデックス作成方法。
  12. 対象となる所定期間のクエリログであって、主たる検索タームであるクエリと当該クエリと同時に用いられた検索タームである共起語とが発生頻度をともなって記録された情報から、上記発生頻度の相関の強いクエリ同士をグループ化してターム集合であるクラスタにクラスタリングを行うクラスタリング手段と、
    上記クラスタリングにより得られた各クラスタに対してラベル付けを行うラベリング手段と、
    ラベルの付された各クラスタのタームに基づいて当該タームを含むクラスタ毎のノードの集合であるルートセットを作成するルートセット作成手段と、
    作成されたルートセットに含まれる各ノードに基づいて当該ノードのクラスタ毎のリンク先とリンク元のノードの集合であるベースセットを作成するベースセット作成手段と、
    作成されたベースセットに含まれる各ノードにオーソリティの重みとハブの重みを割り当て、ベースセットの全ノードのオーソリティの重みを要素に持つベクトルとベースセットの全ノードのハブの重みを要素に持つベクトルとを割り当て、HITSアルゴリズムにより最大固有値に対応する固有ベクトルおよび最大固有値以外の固有値に対応する固有ベクトルを算出し、最大固有値に対応するオーソリティの重みおよびハブの重みを大きい順に配置した序列と最大固有値以外の固有値に対応するオーソリティの重みおよびハブの重みを大きい順に配置した序列とをクラスタ毎にコミュニティ抽出結果として生成するコミュニティ抽出手段と、
    コミュニティ抽出結果の上位序列の所定数のオーソリティおよびハブからフレーズの抽出を行うフレーズ抽出手段と、
    上記クラスタに付されたラベル、上記クラスタに含まれるターム、上記オーソリティおよびハブから抽出されたフレーズ、ならびに上記オーソリティおよびハブを、階層構造に配置したディレクトリを作成するディレクトリ作成手段と、
    作成されたディレクトリに基づいて検索用のインデックスを作成するインデックス作成手段とを備えたことを特徴とするコミュニティ抽出による検索用インデックス作成装置。
JP2007024761A 2007-02-02 2007-02-02 コミュニティ抽出による検索用インデックス作成方法およびその装置 Expired - Fee Related JP4874828B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007024761A JP4874828B2 (ja) 2007-02-02 2007-02-02 コミュニティ抽出による検索用インデックス作成方法およびその装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007024761A JP4874828B2 (ja) 2007-02-02 2007-02-02 コミュニティ抽出による検索用インデックス作成方法およびその装置

Publications (2)

Publication Number Publication Date
JP2008191877A JP2008191877A (ja) 2008-08-21
JP4874828B2 true JP4874828B2 (ja) 2012-02-15

Family

ID=39751929

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007024761A Expired - Fee Related JP4874828B2 (ja) 2007-02-02 2007-02-02 コミュニティ抽出による検索用インデックス作成方法およびその装置

Country Status (1)

Country Link
JP (1) JP4874828B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104978332A (zh) * 2014-04-04 2015-10-14 腾讯科技(深圳)有限公司 用户生成内容标签数据生成方法、装置及相关方法和装置

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5271863B2 (ja) * 2009-10-13 2013-08-21 日本電信電話株式会社 情報分析装置、情報分析方法および情報分析プログラム
JP5068304B2 (ja) * 2009-12-28 2012-11-07 ヤフー株式会社 抽出装置、方法及びプログラム
JP5165720B2 (ja) * 2010-03-31 2013-03-21 ヤフー株式会社 スパムブログ抽出装置及び方法
EP2738687A4 (en) * 2011-07-25 2015-01-07 Rakuten Inc GENDER GENERATING DEVICE
JP6033070B2 (ja) * 2012-12-14 2016-11-30 株式会社エクサ データ管理装置及びデータ管理プログラム
JP6553793B1 (ja) * 2018-09-20 2019-07-31 ヤフー株式会社 情報処理装置、情報処理方法及び情報処理プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104978332A (zh) * 2014-04-04 2015-10-14 腾讯科技(深圳)有限公司 用户生成内容标签数据生成方法、装置及相关方法和装置
CN104978332B (zh) * 2014-04-04 2019-06-14 腾讯科技(深圳)有限公司 用户生成内容标签数据生成方法、装置及相关方法和装置

Also Published As

Publication number Publication date
JP2008191877A (ja) 2008-08-21

Similar Documents

Publication Publication Date Title
US9864808B2 (en) Knowledge-based entity detection and disambiguation
Kao et al. Mining web informative structures and contents based on entropy analysis
KR101361182B1 (ko) 태그를 분석하여 관련 문서를 찾기 위한 시스템 및 방법
US6560600B1 (en) Method and apparatus for ranking Web page search results
JP4908214B2 (ja) サーチクエリのリファインメントを提供するシステム及び方法。
US7020679B2 (en) Two-level internet search service system
JP4874828B2 (ja) コミュニティ抽出による検索用インデックス作成方法およびその装置
US20100131563A1 (en) System and methods for automatic clustering of ranked and categorized search objects
US8812508B2 (en) Systems and methods for extracting phases from text
Zaiane et al. Dbconnect: mining research community on dblp data
US7398461B1 (en) Method for ranking web page search results
US20070271228A1 (en) Documentary search procedure in a distributed system
JP2000090103A (ja) 情報検索装置及び情報検索プログラムを記録したコンピュータ読み取り可能な記録媒体
Kumari et al. Comparative study of page rank and weighted page rank algorithm
Zaïane et al. Mining research communities in bibliographical data
JP2001188802A (ja) 情報検索装置及び情報検索方法
US7483877B2 (en) Dynamic comparison of search systems in a controlled environment
Iqbal et al. CURE: Collection for urdu information retrieval evaluation and ranking
US7490082B2 (en) System and method for searching internet domains
JP3632354B2 (ja) 情報検索装置
Joshi et al. A novel approach towards integration of semantic web mining with link analysis to improve the effectiveness of the personalized web
Akritidis et al. Effective ranking fusion methods for personalized metasearch engines
KR100434718B1 (ko) 문서 색인 시스템 및 그 방법
Sima et al. Keyword query approach over rdf data based on tree template
Arora et al. Efficient Hybrid Ranking Algorithm for Search Engine

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090327

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110811

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110823

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111024

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111115

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111124

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141202

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4874828

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

LAPS Cancellation because of no payment of annual fees
R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350