JP7462198B1 - キーワード収集方法、情報処理装置およびプログラム - Google Patents
キーワード収集方法、情報処理装置およびプログラム Download PDFInfo
- Publication number
- JP7462198B1 JP7462198B1 JP2023096659A JP2023096659A JP7462198B1 JP 7462198 B1 JP7462198 B1 JP 7462198B1 JP 2023096659 A JP2023096659 A JP 2023096659A JP 2023096659 A JP2023096659 A JP 2023096659A JP 7462198 B1 JP7462198 B1 JP 7462198B1
- Authority
- JP
- Japan
- Prior art keywords
- information
- related words
- collection
- words
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 113
- 230000010365 information processing Effects 0.000 title claims abstract description 110
- 238000000605 extraction Methods 0.000 claims abstract description 36
- 238000004458 analytical method Methods 0.000 claims abstract description 31
- 238000004891 communication Methods 0.000 claims abstract description 15
- 230000008569 process Effects 0.000 claims description 91
- 238000011156 evaluation Methods 0.000 claims description 75
- 239000000284 extract Substances 0.000 claims description 16
- 230000004044 response Effects 0.000 claims description 7
- 230000006870 function Effects 0.000 description 31
- 238000012545 processing Methods 0.000 description 23
- 238000005516 engineering process Methods 0.000 description 12
- 238000013473 artificial intelligence Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000012854 evaluation process Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 4
- 230000002860 competitive effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 235000019640 taste Nutrition 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000013441 quality evaluation Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
目的に合った検索結果を得るために、目的のテーマに関連する複数のキーワードを組み合せるという手法が採られている。このような関連するキーワードは、たとえば検索サービスサイトや、ウェブブラウザに搭載された予測機能などにより、閲覧ユーザーが入力したワードに関連性があると予測するワードを提示するものがある。
そのほか、データベースに存在する文書を検索し、特定のワードに対する共起単語やクエリ単語を抽出し、それらの単語を含むフレーズに対して関連度を算出して提示することで、文書の内容が、ユーザーが求めている内容であるかを容易に把握可能にするものが知られている(たとえば、特許文献2)
そのほか、閲覧ユーザーが関心を持つ内容に関連性がある内容のコンテンツを作成しても、そのコンテンツ内に閲覧ユーザーが検索などで利用するキーワードと一致または関連性のキーワードが使用されていなければ、検索やデータベースでの索引、AIに対する問い合わせに該当しない結果になる可能性があるほか、または調査結果の低ランクに位置される可能性があるという課題がある。調査結果の表示順位は、閲覧ユーザーの目にとまり興味を引くか否かに大きな影響を与えるため、コンテンツの作成に用いるキーワードの選択は重要な要素となる。
情報提示部が、前記抽出ワード情報を前記ユーザー端末に提示する工程とを含む。
上記キーワード収集方法において、前記情報収集部が、前記関連ワードとともに、前記関連ワードの利用回数、提示位置情報、利用状態情報、価値情報のいずれかまたは2以上を含む評価基準情報を、前記情報供給手段からの提示情報から前記収集条件に基づいて抽出する工程と、前記情報処理部が、前記関連ワードごとに前記評価基準情報を対比し、その対比結果に基づいて前記収集傾向を解析する工程とを含む。
上記キーワード収集方法において、前記情報収集部が、関連ワードの収集回数を計数し、または前記情報処理部が計数した関連ワードの出現回数を取得して、前記収集回数または前記出現回数が設定条件を満たすまで繰り返して、関連ワードを収集する工程を含む。
上記キーワード収集方法において、前記情報収集部が、前記情報供給手段から収集した関連ワードとともに、少なくとも収集日時情報、前記情報供給手段の識別情報を取得して前記格納部に格納する工程と、前記格納部は、取得した前記関連ワードに対して前記収集日時情報および前記識別情報を関連付けたデータベースを生成する工程とを含む。
上記情報処理装置において、前記情報収集部が、前記関連ワードとともに、前記関連ワードの利用回数、提示位置情報、利用状態情報、価値情報のいずれかまたは2以上を含む評価基準情報を、前記情報供給手段からの提示情報から前記収集条件に基づいて抽出し、
前記情報処理部が、前記関連ワードごとに前記評価基準情報を対比し、その対比結果に基づいて前記収集傾向を解析することを含む。
上記情報処理装置において、前記情報収集部が、関連ワードの収集回数を計数し、または前記情報処理部が計数した関連ワードの出現回数を取得して、前記収集回数または前記出現回数が設定条件を満たすまで繰り返して、関連ワードを収集する。
上記情報処理装置において、前記情報収集部が、前記情報供給手段から収集した関連ワードとともに、少なくとも収集日時情報、前記情報供給手段の識別情報を取得して前記格納部に格納し、取得した前記関連ワードに対して前記収集日時情報および前記識別情報を関連付けたデータベースを生成することを含む。
上記情報処理装置において、前記情報供給手段は、情報検索サービスを提供するウェブサイト、AIを利用した情報提供サービスサイト、または情報検索機能を備えるデータベースの何れかまたは2以上が含まれる。
上記情報処理装置において、前記情報収集部は、前記情報供給手段が蓄積した検索記録から割り出したワード、または該検索記録に基づく予測処理で割り出したワード、前記テーマワードまたは収集した関連ワードを利用して検索したウェブサイトのページに用いられるワード、前記テーマワードまたは収集した関連ワードを利用した検索結果ページに含まれる広告表示に用いられたワード、入力された文字に対して文書による対話が可能なAIの回答に含まれるワードのいずれか、またはこれら2以上を収集条件として、前記関連ワードを収集することを含む。
上記キーワード収集プログラムにおいて、前記関連ワードとともに、前記関連ワードの利用回数、提示位置情報、利用状態情報、価値情報のいずれかまたは2以上を含む評価基準情報を、前記情報供給手段からの提示情報から前記収集条件に基づいて抽出する機能と、
前記関連ワードごとに前記評価基準情報を対比し、その対比結果に基づいて前記収集傾向を解析する機能とを含む。
(2) 閲覧ユーザーの嗜好性や流行性に沿ったキーワードを抽出して提示することで、このキーワードを利用したコンテンツやウェブサイトの品質などに対する評価の向上、閲覧ユーザーが求める情報に到達できるなどの有益性や満足度の高いコンテンツの作成に寄与できる。
(3) コンテンツなどの作成において、流行性のある話題に関連するキーワードの調査などの作業負荷を軽減することができる。
図1は、キーワード収集システムの構成例を示している。図1に示す構成は一例であり、本開示の技術が斯かる構成に限定されない。
このキーワード収集システム2は、設定したテーマワードが示す意味、目的や用途などの関連性、もしくは類似性がある関連ワードを収集するとともに、この収集した複数の関連ワードに対する価値などを解析する機能を有する。テーマワードは、たとえばネットワーク上の複数の閲覧ユーザーが興味をもつ内容、または流行しているものや分野などを特定する大枠の概念を表すキーワードである。関連ワードは、たとえばネットワーク上で閲覧ユーザーがテーマワードと組み合せて情報の検索に用いるほか、記事や動画、音声情報などで構成されるオンラインコンテンツやウェブコンテンツの内容、種別などの特定に利用されるキーワードである。キーワード収集システム2は、テーマワードが示す分野やコンテンツの内容の中から、閲覧ユーザーが興味を持ちもしくは流行性があると推測した内容を表わす複数の関連ワードを収集し、それらの関連ワードから特定の条件や目的に沿ったキーワードを抽出した抽出ワード情報を生成して、コンテンツなどを作成するユーザーに提供する機能を有する。
このキーワード収集システム2には、たとえば情報処理装置4、ユーザー端末6、情報供給手段8が含まれており、情報処理装置4とユーザー端末6、情報処理装置4と情報供給手段8がそれぞれインターネットなどのネットワークを介して情報の送受信を行う。この情報処理装置4は、関連ワードの収集および抽出ワード情報の生成処理を実行する。ユーザー端末6は、テーマワードに関する抽出ワード情報を要求するユーザーが利用する端末である。情報供給手段8は、テーマワードやその関連ワードなどのキーワードに対し、ネットワーク上で利用されているキーワード、もしくはデータベースに蓄積されている情報の中から関連ワードを提供する手段の一例である。
情報処理装置4は、たとえば関連ワードの収集および抽出ワード情報の生成機能を備えるPC(Personal Computer)のほか、これらの機能とともに契約した管理者のウェブページなどをネットワーク上への公開や管理などの機能を備えるサーバー装置などで構成される。情報処理装置4は、ネットワークを通じて情報供給手段8から指定したキーワードに関連する関連ワードを収集した後、その収集傾向を解析して抽出ワード情報を生成する。情報処理装置4は、たとえば通信機能部10、情報収集部12、格納部14、情報処理部16などで構成される。この収集傾向は、収集した複数の関連ワードの中からユーザーの目的に沿った関連ワードを抽出するための評価情報の一例である。
情報収集部12は、情報供給手段8にアクセスして設定された収集条件や検索処理に対する設定条件により、関連ワードを収集する機能部の一例である。
格納部14は、少なくとも情報収集部12が収集した関連ワードを格納する手段であり、キーワード収集処理において一時的に情報を格納するものでもよく、またはデータベース化するなど長期に記憶させるものであってもよい。格納部14に格納される情報は、関連ワードとともに、収集元である情報供給手段8を特定する情報や収集日時などの情報、収集に利用したテーマワードや、テーマワードを入力したユーザー端末6の情報、その他関連する情報を含んでもよい。
情報処理部16は、収集した関連ワードに対し、その収集傾向を解析するとともに、関連ワードの中から抽出条件に基づいて抽出ワードを抽出して抽出ワード情報を生成する機能部である。収集傾向は、たとえば情報収集部12がテーマワードおよび複数の関連ワードを利用し、複数回、関連ワードを収集した結果に対し、同一の関連ワードが繰り返し出現した場合の出現数や、出現のタイミングの取得や連続性などの出現状態の情報が含まれる。そのほか、収集傾向は、たとえばテーマワードや関連ワードに関し、情報供給手段8が保持している情報、もしくは情報供給手段8によって提示された情報を利用して解析可能な情報が含まれる。
抽出条件は、収集傾向の解析結果に基づいて、複数の関連ワードの中から特定のキーワードを選択する条件の一例であり、たとえば出現数に対する閾値や、出現時期、出現の連続数などが含まれる。
ユーザー端末6は、情報処理装置4を利用して特定のテーマワードに対する抽出ワード情報を要求するユーザーが利用する端末装置であり、たとえばPCのほか、携帯端末装置など情報入力機能、通信機能および情報表示機能を備えたコンピュータで構成される。このユーザーは、テーマワードと取得した抽出ワードを利用してウェブサイトの運営、管理やコンテンツの作成を行う者が含まれる。ユーザー端末6は、たとえば情報処理装置4に対して端末情報やユーザーの識別情報を登録するとともに、キーワード収集を行うためのテーマワード、収集条件などを登録する。これに対しユーザー端末6は、情報処理装置4から抽出ワード情報を取得すると、この抽出ワード情報を利用してウェブサイトやコンテンツの作成を行う。
(1) 情報供給手段8が蓄積している過去の検索に利用されたキーワードであって、テーマワードまたはこれに関連するキーワードで検索した結果に対し、さらにその内容を絞り込むことを目的として次に入力されるキーワードを収集する条件、
(2) 情報供給手段8により、過去の検索記録などの情報から予測して割り出したものであって、テーマワードと組み合せて使用されることで、捜索対象のコンテンツなどの情報を特定し、または捜索範囲を絞り込むためのキーワードを収集する条件、
(3) 情報供給手段8が有する検索機能、または図示しない検索手段を利用し、テーマワードや先に取得している関連ワードによって得た検索結果に対し、その検索結果に挙げられたウェブサイトやコンテンツで使われているワードを収集する条件、
(4) 情報供給手段8が有する検索機能、または図示しない検索手段を利用して得た検索結果において、検索結果ページに表示された広告などで使用されているワードを収集する条件、
がある。
情報供給手段8は、入力したキーワードに関連する関連ワードを提供する機能を備えたサーバー装置、データベースなどで構成されており、たとえばキーワードに関連するウェブサイトの検索サービスなどが含まれる。そのほか情報供給手段8は、たとえば情報処理装置4から入力されたテーマワードなどを利用して、図示しない外部の検索サービスから検索結果を取得し、情報処理装置4に提供する機能を備える処理装置、または入力したキーワードに対して図示しない調査手段やデータベースなどを利用して関連ワードの調査や、閲覧ユーザーや他のウェブサイトで使用する関連ワードの推測などの処理が可能なAIなどを利用したウェブサイトなどであってもよい。
関連ワードの収集処理では、たとえば情報供給手段8が指定された収集条件に対応した情報を提供する機能を備えてもよく、または情報処理装置4がテーマワードや関連ワードを情報供給手段8に入力したことによって得られる検索情報の中から、設定された収集条件に対応した情報を抽出するものであってもよい。またこの収集処理に利用する情報供給手段8は、たとえば単一の検索サービスやAIを利用できるウェブサイト、データベースに限られず、複数のサービスを併用して関連ワードを収集してもよい。そして、このように複数の情報供給手段8を利用した場合、情報処理装置4は、たとえばそれぞれ収集した関連ワードを共通の作業領域である情報処理部16などに格納し、収集傾向の解析などの処理を実行すればよい。
情報処理装置4は、コンピュータで構成されており、たとえばプロセッサ20、記憶部22、通信部24、表示部26、タイマー28が備えられる。
プロセッサ20は記憶部22にあるキーワード収集処理プログラムを実行し、情報供給手段8からの関連ワードの収集処理、収集傾向の解析、抽出ワード情報の生成処理などの情報処理を実行する。
記憶部22は、プログラムを格納するとともに、キーワードなどを記憶する格納部の一例であり、データメモリ32を構成するROM(Read-Only Memory)、演算処理領域であるRAM(Random-Access Memory)30などの記憶素子を備える。データメモリ32内には、収集した関連ワードやそれに関連する情報を格納する関連ワードDB(Data Base)34を備えてもよい。
そのほか、表示部26は、収集した関連ワードや抽出ワード情報などを表示するモニターなどが含まれる。
タイマー28は、ユーザー端末6や情報供給手段8との間で行われる情報の送受信や情報処理装置4が実行する収集処理、解析処理、抽出処理などの実行タイミングや、経過時間などを計時する。
図3は、関連ワードの収集および抽出ワード情報の生成機能を示している。図3に示す構成は一例であり、本開示の技術が斯かる構成に限定されない。
情報処理装置4は、たとえばユーザー端末6からのアクセスおよびテーマワード40の取得を契機に、情報収集部12の処理領域42を形成すると、指定された収集条件に応じて情報供給手段8を利用した関連ワードの収集を実行する。
関連ワードの収集処理は、たとえば図3に示すように、入力されたテーマワード40に基づいて情報供給手段8から関連ワードを収集し、その収集一覧情報を生成する。この収集一覧情報には、たとえば収集処理に利用したワード情報部44と、収集結果部46が含まれる。第1階層の情報収集処理では、ワード情報部44にテーマワードを格納し、情報供給手段8から収集した複数の関連ワードA、B、・・・・Xを収集結果部46に格納する。
このように情報処理装置4は、前階層の収集処理で収集した関連ワードを利用して、次階層の関連ワードの収集処理を繰り返し実行する。すなわちこの収集処理では、収集処理の階層数と収集したワードの数に倍数に応じた収集結果部46が生成される。情報処理装置4は、たとえば予め設定した収集階層数条件、または得られた関連ワードの数、その他、後述する重複した関連ワードの出現回数に対して設定した閾値などの設定条件に応じて収集処理を実行すればよい。この設定条件は、たとえば情報処理装置4の情報収集部12に予め設定されていてもよく、またはユーザー端末6を通じてユーザーが希望する設定条件を入力してもよい。
評価値情報部52は、評価基準情報に基づいて設定される評価値が格納される領域の一例である。この評価値は、たとえば出現回数などの評価基準情報がそのまま利用される場合のほか、評価基準情報に対し図示しない設定情報に基づいて算出される場合が含まれる。すなわち、評価値の設定では、たとえば出現回数が多いものを高く評価すればよい。
この評価値情報部52には、たとえば出現回数を評価値とするほか、この出現回数に代えて、または出現回数と組み合せて出現した収集階層の情報を評価値としてもよい。すなわち、情報処理装置4は、メインのキーワードであるテーマワードに近いキーワードを優位とし、より早い段階の階層で収集した関連ワードに高い評価を設定してもよい。出現回数と収集階層数を組み合せて評価値を設定する場合は、既述の設定条件を利用すればよい。
また、収集条件3の場合、情報処理装置4は、たとえば検索結果に挙げられたウェブサイトやコンテンツに対し、テーマワードや関連ワード出現数とともに、これらのキーワードが配置された位置情報を収集してもよい。この位置情報の収集では、たとえばウェブサイトやコンテンツの全体構成に対して、出現する行数や上部側、中央側、下部側などに区分した情報、またはHTML形式のウェブサイトであれば見出しや掲題などのタグに記載されているかなどの情報を収集する。また、1つのコンテンツ内に同一の関連ワードが複数用いられている場合は、たとえばその関連ワードが集中、もしくは多く使われている範囲などの位置情報を取得してもよい。そして、収集傾向の解析処理では、たとえば、複数の関連ワード同士で、コンテンツの上部側やタイトルタグに含まれているものを高く評価するなどで対比してもよい。
図4は、関連ワードDB34の構成例を示している。
格納部14には、たとえば情報収集部12が収集した関連ワードを格納するデータベースが形成される。この関連ワードDBは、たとえばデータメモリ32内に形成されるものに限られず、RAM30内に、キーワード収集処理の実行時に一時的に形成されるものであってもよい。
この関連ワードDB34は、たとえば図4に示すように、検索ワード部341、関連ワード部342、日時部343、識別情報部344、収集条件部345、出現回数部346、評価基準情報部347、ランク情報部348などで構成される。
関連ワード部342は、検索ワード部341に格納されたキーワードによって収集された関連ワードが格納される領域である。この関連ワード部342は、情報供給手段8から提供、または検索結果に出力される関連ワードの数に対応して格納枠の数が設定される。
日時部343は、関連ワードの収集処理の実行日や時間情報が格納される領域である。情報収集処理では、たとえば今回設定されたテーマワードや先に取得した関連ワードで収集された関連ワードを利用して抽出ワード情報を生成する場合に限られず、過去に取得した同一のキーワードまたは関連性のあるキーワードによって収集した関連ワードを組み合せて抽出ワード情報を生成してもよい。この場合、たとえば収集した日時情報を利用して、抽出ワードの評価値情報を設定してもよい。
そのほか、情報処理装置4は、たとえば収集処理で設定されたテーマワードや関連ワードに対し、関連ワードDB34内に格納されている同一または類似のキーワードによる収集情報を提示し、または新たに収集した関連ワードと格納された関連ワードを組み合せて抽出ワード情報の生成に利用してもよい。
収集条件部345は、ユーザー端末6によって設定され、かつ関連ワードの収集処理に利用した収集条件を格納する領域である。
出現回数部346は、解析処理によって得られた収集傾向である出現回数の情報が格納される領域である。
ランク情報部348は、たとえば抽出処理で設定された評価値情報などの情報によって設定された順位などが格納される領域である。このランク情報は、収集した関連ワードの重要度(重み)を表わす情報であり、ランクが高いほど、閲覧ユーザーの流行性や興味に適合したキーワードであることが把握できる。
図5は、キーワード収集処理例を示している。図5に示す処理内容、処理手順は一例であり、斯かる構成に本開示の技術が限定されない。
このキーワード収集処理は、本開示のキーワード収集方法またはキーワード収集プログラムの一例であり、たとえば関連ワード収集処理F1とキーワード抽出処理F2に区分される。
情報処理装置4は、通信機能部10を通じてユーザー端末6と接続し(S101)、収集条件を取得し、その収集条件を情報収集部12に設定する(S102)。通信機能部10は、設定された収集条件でのキーワード収集が可能な情報供給手段8に接続する(S103)。情報処理装置4は、たとえば予め設定された情報供給手段8を選択してキーワード収集を行ってもよく、またはユーザー端末6側から取得した検索サービスやAI情報供給サービスなどのアドレス情報に基づいて情報供給手段8にアクセスしてもよい。ユーザー端末6から指定された情報供給手段8を利用する場合、情報収集部12は、指定された収集条件によるキーワード収集が実行可能か否かの判断処理を行ってもよい。
斯かる構成によれば、以下のいずれかの効果が期待できる。
(1) ウェブサイトの閲覧ユーザーのニーズや興味や嗜好性、流行性をもっているキーワードを推測することができる。
(2) 閲覧ユーザーが興味をもっている具体的なキーワード、またはこのキーワードに関連性の高い内容を把握することで、閲覧ユーザーのニーズに沿ったコンテンツの作成、提供が可能となる。
(3) 閲覧ユーザーのニーズに沿ったキーワードを利用した内容のコンテンツが作成でき、コンテンツやウェブサイトの品質評価の向上や、有益性、満足度の向上が図れる。
(4) 閲覧ユーザーの嗜好性や流行性に沿ったキーワードを抽出することで、コンテンツのクリエイターに対し、検索適応性を高めるための情報が提供できる。
(5) コンテンツなどの作成において、流行性の調査などの作業負荷を軽減することができる。
図6は、第2の実施形態に係るキーワード収集システムの構成例を示している。図6に示す構成は一例であり、斯かる内容に本開示の技術が限定されない。
このキーワード収集システム2では、特定のテーマワードに対し、2以上の異なる収集条件を組み合せて関連ワードの収集処理を実行する場合を示している。つまり、このキーワード収集処理では、たとえばテーマワードおよび先に収集した関連ワードに対し、収集条件1として、先の検索結果を絞り込むために用いられるキーワードを収集するとともに、収集条件2として検索結果で提示されたウェブサイトで利用されている言葉をキーワードとして収集する。
情報処理装置4は、たとえば図6に示すように、ユーザー端末6から特定のテーマワードとともに、関連ワードの収集を希望する2以上の収集条件を取得すると、収集条件ごとに情報供給手段8から関連ワードの収集処理を行う。情報処理装置4には、たとえば格納部14内に収集条件1、2、・・・Nごとの関連ワードDB34-1、34-2、・・・34-Nを形成してもよく、または共通の関連ワードDB内に、収集した収集条件1、2、・・・Nごとの関連ワードの格納領域を形成してもよい。
図7は、関連ワードの収集および抽出ワード情報の生成機能を示している。図7に示す構成は一例であり、本開示の技術が斯かる構成に限定されない。
情報処理装置4は、たとえば図7に示すように、処理領域42内に取得した収集条件ごとに収集一覧情報を生成する。図7では省略しているが、この収集一覧情報は、たとえばワード情報部44と、収集結果部46で構成されてよい。
情報処理装置4は、設定された収集条件ごとに関連ワードの収集処理を実行する。このとき情報処理装置4は、たとえば収集条件に対して共通の情報供給手段8にアクセスしてキーワードを収集してもよく、または収集条件に対して情報供給手段8が適合しない場合には、収集条件に適合する検索サービスサイトやAI情報提供サービスなどの他の情報供給手段8にアクセスしてもよい。
情報処理装置4は、次階層の収集処理IIとして、前階層で収集した複数の関連ワードに対し、それぞれを検索ワードとして情報供給手段8から関連ワードを収集して、収集一覧情報を生成する。
情報処理装置4は、設定前回の収集処理で収集した関連ワードを利用して、次の関連ワードの収集処理を繰り返し実行する。すなわちこの収集処理では、収集条件の数と、収集処理の回数と、収集したワードの数を積算した数の収集結果部46が生成される。情報処理装置4は、たとえば予め設定した収集回数条件、または得られた関連ワードの数、その他、後述する重複する関連ワードの出現回数に対して設定した閾値などの設定条件に応じて収集処理を実行すればよい。
この評価の調整では、たとえば関連ワードの収集に設定した収集条件1~4ごとに調整手法が設定されてもよく、または取集条件の組み合わせに応じて調整手法が設定されてもよい。
図8は、キーワード収集処理例を示している。図8に示す処理内容、処理手順は一例であり、斯かる構成に本開示の技術が限定されない。このキーワード収集処理は、本開示のキーワード収集方法またはキーワード収集プログラムの一例である。
情報処理装置4は、ユーザー端末6から複数の収集条件と、テーマワードを取得すると、これらの情報を利用して情報供給手段8から関連ワードの収集処理を行う(S201)とともに収集条件を設定する(S202)。この関連ワードの収集処理および収集条件の設定は、たとえば設定した収集条件毎に、図5のS101~S107と同様の処理を実行すればよく、詳細な説明を省略する。
次に、情報処理部16は、各解析結果の集計処理を行う(S204)。この集計処理では、たとえば先に述べたように、収集条件の違いに基づく集計数などの相違に対する調整処理を含むとともに、重複する関連ワードの抽出領域48への格納、各関連ワードへの評価値の設定、ランク付けなどを含む。
そして情報処理部16は、たとえば出現回数やランクの順位などの抽出条件に基づき、抽出領域48に格納された関連ワードを1または複数抽出し、抽出ワード情報を生成し(S205)、テーマワードを提供したユーザー端末6に対して提示する(S206)。
斯かる構成によれば、以下のいずれかの効果が期待できる。
(1) 第1の実施形態と同様の効果が得られる。
(2) 異なる収集条件に基づいて関連ワードを収集し、その収集傾向に基づいて閲覧ユーザーが求める情報のニーズや嗜好、興味の方向性が現れるキーワードを推測することができる。
(3) 検索サービスなどの情報供給手段に対し、異なる観点で収集や蓄積、または情報供給手段が予測して提示するキーワードを組み合せて解析し、評価したキーワードを抽出することで、閲覧ユーザーが求める情報の内容や方向性への適合性が高められる。
次に、情報供給手段8からの関連ワードの収集と、収集した関連ワードに対する解析処理例を示す。図9は実施例に係る関連ワードの収集処理例を示している。
情報処理装置4は、たとえば情報供給手段8として、検索サービスサイトや入力情報に対して回答を出力する、所謂対話型のAIを利用するサービスに対し、テーマワードまたは先に収集した関連ワードを入力し、その関連ワードを取得する場合を示す。
その結果、I階層目の収集処理では、たとえば「スマートフォン」に対し、
1)「モバイル端末」、
2)「iOS」、
3)「Android(登録商標)」、
4)「アプリケーション」
5)「スマートウォッチ」
6)「モバイル決済」
7)「モバイルバッテリー」
・・・等の関連ワードが提示される。
次に、II階層目の収集処理として、たとえば「モバイル端末」を検索ワードとすると、
a)「スマートフォン」
b)「タブレット」
c)「ノートパソコン」
d)「モバイルWi-Fi」
e)「モバイルルーター」
f)「イヤホン・ヘッドホン」
g)「ポータブルスピーカー」
h)「スマートウォッチ」
・・・等の関連ワードが提示される。
また、収集条件が「サジェストキーワード」であれば、「スマートフォン」のキーワードに対し、検索サービスやAIなどの予測処理により、閲覧ユーザーが検索ワードとともに組み合せて検索する可能性が高いものとして、「スマートウォッチ」が重複することを表わしている。この結果から、「再検索キーワード」の場合と同様に、「スマートウォッチ」に閲覧ユーザーの関心が集まっている、もしくは多くの閲覧ユーザーの潜在的な関心が高まりつつあると推測することができる。
情報処理部16は、たとえば情報供給手段8である検索サービスに対し、検索ワードとして「中古ドメイン」のテーマワードとして検索処理を行うと、表示部26などにその検索結果画面に複数のウェブサイトのURL(アドレス)が表示させる。この検索結果画面には、たとえば閲覧ユーザーのアクセス数やページの構成、内容について検索サービスにより設定された評価に基づく順位に沿ってURLが列挙されている。
さらに、情報処理部16は、たとえば「中古 ドメイン」を含む、またはこれに関連するキーワードを「競合キーワード」として設定し、その検索結果に現れるURLの数やそのサイトに対し、所定期間内の閲覧ユーザーのアクセス数などの情報を収集する。そして、情報処理部16は、このアクセス数やURLの数などを評価値として解析し、その評価値に基づいて「競合キーワード」の中から所定のキーワードを抽出ワード情報として抽出する。
〔変形例〕
つまり、キーワード収集システム2は、たとえばユーザーが作成するコンテンツやウェブサイトの閲覧対象がPCまたはそれに類似する端末か、またはモバイル端末かにより、閲覧ユーザーの嗜好性、または検索処理で入力するキーワードの種類や長さなどが異なるため、端末の種別において抽出ワードの内容を異ならせるようにすればよい。
情報処理装置4は、たとえば同一のテーマワードで、かつ共通の収集条件であって、異なる複数の検索サービスなどから関連ワードを収集し、その収集傾向を解析して抽出ワード情報を生成してもよい。また、この場合、ユーザーの設定により、もしくは検索サービスの利用者数などの情報に基づき、情報供給手段8ごとの収集結果に対して重み付けを設定して評価値を割り出してもよい。具体的には、利用者数の多い検索サービスで収集した関連ワードに対する評価値を大きく設定するようにしてもよい。これにより、利用者数が多い=閲覧ユーザーの嗜好性や流行性、情報のニーズが反映し易くなり、よりユーザーが検索し易いキーワードの抽出の精度が高められる。
4 情報処理装置
6、6-1、6-2、・・・6-N ユーザー端末
8 情報供給手段
10 通信機能部
12 情報収集部
14 格納部
16 情報処理部
20 プロセッサ
22 記憶部
24 通信部
26 表示部
28 タイマー
30 RAM
32 データメモリ
34、34-1、34-2、・・・34-N 関連ワードDB
40 テーマワード
42 処理領域
44 ワード情報部
46 収集結果部
48 抽出領域
50 抽出ワード情報部
52 評価値情報部
341 検索ワード部
342 関連ワード部
343 日時部
344 識別情報部
345 収集条件部
346 出現回数部
347 評価基準情報部
348 ランク情報部
Claims (15)
- コンピュータにより実行するキーワード収集方法であって、
通信機能部が、特定のキーワードに対する関連ワードを供給する情報供給手段にネットワークを介してアクセスする工程と、
情報収集部が、ユーザー端末からテーマワードを取得する工程と、
前記情報収集部が、設定した収集条件に応じて前記情報供給手段から、前記テーマワードに基づく関連ワード、および先に収集した関連ワードに基づく関連ワードを収集する工程と、
収集した前記関連ワードを格納部に格納する工程と、
情報処理部が、前記関連ワードの収集傾向を解析し、この解析結果を利用して抽出条件に適合する前記関連ワードを含む抽出ワード情報を生成する工程と、
情報提示部が、前記抽出ワード情報を前記ユーザー端末に提示する工程と、
を含む、キーワード収集方法。 - 前記情報処理部が、前記格納部の関連ワードの出現回数を計数し、前記出現回数による順位を付けて収集傾向を解析するとともに、前記抽出条件として設定された前記出現回数または前記順位に対する閾値を満たす関連ワードを抽出して前記抽出ワード情報を生成する工程を含む、請求項1に記載のキーワード収集方法。
- 前記情報収集部が、前記関連ワードとともに、前記関連ワードの利用回数、提示位置情報、利用状態情報、価値情報のいずれかまたは2以上を含む評価基準情報を、前記情報供給手段からの提示情報から前記収集条件に基づいて抽出する工程と、
前記情報処理部が、前記関連ワードごとに前記評価基準情報を対比し、その対比結果に基づいて前記収集傾向を解析する工程と
を含む、請求項1または2に記載のキーワード収集方法。 - 前記情報収集部が、関連ワードの収集回数を計数し、または前記情報処理部が計数した関連ワードの出現回数を取得して、前記収集回数または前記出現回数が設定条件を満たすまで繰り返して、関連ワードを収集する工程を含む、請求項1または2に記載のキーワード収集方法。
- 前記情報収集部が、前記情報供給手段から収集した関連ワードとともに、少なくとも収集日時情報、前記情報供給手段の識別情報を取得して前記格納部に格納する工程と、
前記格納部は、取得した前記関連ワードに対して前記収集日時情報および前記識別情報を関連付けたデータベースを生成する工程と、
を含む、請求項1または2に記載のキーワード収集方法。 - 特定のキーワードに対する関連ワードを供給する情報供給手段にネットワークを介してアクセスする通信機能部と、
ユーザー端末からテーマワードを取得し、設定した収集条件に応じて前記情報供給手段から、前記テーマワードに基づく関連ワード、および先に収集した関連ワードに基づく関連ワードを収集する情報収集部と、
収集した前記関連ワードを格納する格納部と、
前記関連ワードの収集傾向を解析し、この解析結果を利用して抽出条件に適合する前記関連ワードを含む抽出ワード情報を生成する情報処理部と、
前記抽出ワード情報を前記ユーザー端末に提示する情報提示部と、
を含む、情報処理装置。 - 前記情報処理部が、前記格納部の関連ワードの出現回数を計数し、前記出現回数による順位を付けて収集傾向を解析するとともに、前記抽出条件として設定された前記出現回数または前記順位に対する閾値を満たす関連ワードを抽出して前記抽出ワード情報を生成することを含む、請求項6に記載の情報処理装置。
- 前記情報収集部が、前記関連ワードとともに、前記関連ワードの利用回数、提示位置情報、利用状態情報、価値情報のいずれかまたは2以上を含む評価基準情報を、前記情報供給手段からの提示情報から前記収集条件に基づいて抽出し、
前記情報処理部が、前記関連ワードごとに前記評価基準情報を対比し、その対比結果に基づいて前記収集傾向を解析する、
ことを含む、請求項6または7に記載の情報処理装置。 - 前記情報収集部が、関連ワードの収集回数を計数し、または前記情報処理部が計数した関連ワードの出現回数を取得して、前記収集回数または前記出現回数が設定条件を満たすまで繰り返して、関連ワードを収集することを含む、請求項6または7に記載の情報処理装置。
- 前記情報収集部が、前記情報供給手段から収集した関連ワードとともに、少なくとも収集日時情報、前記情報供給手段の識別情報を取得して前記格納部に格納し、
取得した前記関連ワードに対して前記収集日時情報および前記識別情報を関連付けたデータベースを生成することを含む、請求項6または7に記載の情報処理装置。 - 前記情報供給手段は、情報検索サービスを提供するウェブサイト、AIを利用した情報提供サービスサイト、または情報検索機能を備えるデータベースの何れかまたは2以上が含まれることを含む、請求項6または7に記載の情報処理装置。
- 前記情報収集部は、前記情報供給手段が蓄積した検索記録から割り出したワード、または該検索記録に基づく予測処理で割り出したワード、前記テーマワードまたは収集した関連ワードを利用して検索したウェブサイトのページに用いられるワード、前記テーマワードまたは収集した関連ワードを利用した検索結果ページに含まれる広告表示に用いられたワード、入力された文字に対して文書による対話が可能なAIの回答に含まれるワードのいずれか、またはこれら2以上を収集条件として、前記関連ワードを収集することを特徴とする請求項11に記載の情報処理装置。
- コンピュータにより実現させるキーワード収集プログラムであって、
特定のキーワードに対する関連ワードを供給する情報供給手段にネットワークを介してアクセスし、設定した収集条件に応じて前記情報供給手段から、ユーザー端末を通じて取得したテーマワードに基づく関連ワード、および先に収集した関連ワードに基づく関連ワードを収集する機能と、
前記関連ワードの収集傾向を解析し、この解析結果を利用して抽出条件に適合する前記関連ワードを含む抽出ワード情報を生成する機能と、
前記抽出ワード情報を前記ユーザー端末に提示する機能と、
をコンピュータに実行させるキーワード収集プログラム。 - 収集した前記関連ワードの出現回数を計数し、前記出現回数による順位を付けて収集傾向を解析するとともに、前記抽出条件として設定された前記出現回数または前記順位に対する閾値を満たす関連ワードを抽出して前記抽出ワード情報を生成することを含む、請求項13に記載のキーワード収集プログラム。
- 前記関連ワードとともに、前記関連ワードの利用回数、提示位置情報、利用状態情報、価値情報のいずれかまたは2以上を含む評価基準情報を、前記情報供給手段からの提示情報から前記収集条件に基づいて抽出する機能と、
前記関連ワードごとに前記評価基準情報を対比し、その対比結果に基づいて前記収集傾向を解析する機能と
を含む、請求項13または14に記載のキーワード収集プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023096659A JP7462198B1 (ja) | 2023-06-13 | 2023-06-13 | キーワード収集方法、情報処理装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023096659A JP7462198B1 (ja) | 2023-06-13 | 2023-06-13 | キーワード収集方法、情報処理装置およびプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP7462198B1 true JP7462198B1 (ja) | 2024-04-05 |
Family
ID=90526547
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023096659A Active JP7462198B1 (ja) | 2023-06-13 | 2023-06-13 | キーワード収集方法、情報処理装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7462198B1 (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019159404A (ja) | 2018-03-07 | 2019-09-19 | ヤフー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP2020042637A (ja) | 2018-09-12 | 2020-03-19 | エクセライクマーケティング株式会社 | 情報処理装置 |
-
2023
- 2023-06-13 JP JP2023096659A patent/JP7462198B1/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019159404A (ja) | 2018-03-07 | 2019-09-19 | ヤフー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP2020042637A (ja) | 2018-09-12 | 2020-03-19 | エクセライクマーケティング株式会社 | 情報処理装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11036814B2 (en) | Search engine that applies feedback from users to improve search results | |
US9355185B2 (en) | Infinite browse | |
US8041601B2 (en) | System and method for automatically targeting web-based advertisements | |
US8078607B2 (en) | Generating website profiles based on queries from webistes and user activities on the search results | |
US8321278B2 (en) | Targeted advertisements based on user profiles and page profile | |
US7761423B1 (en) | System and method for indexing a network of interrelated elements | |
TWI519974B (zh) | 最佳化一主題頁面上的內容之方法 | |
US20090164408A1 (en) | Method, System and Computer Program for Managing Delivery of Online Content | |
US20090228774A1 (en) | System for coordinating the presentation of digital content data feeds | |
US20130046584A1 (en) | Page reporting | |
CN102037464A (zh) | 具有最多点击的下一个对象的搜索结果 | |
JP2008507041A (ja) | 検索結果内におけるプレーストコンテンツの順序付けのパーソナライズ | |
KR20110085995A (ko) | 검색 결과들의 제공 | |
WO2009030972A1 (en) | Method and system of generating and presenting search results | |
KR20020007742A (ko) | 사용자별 정보선호 분석 및 정보 내용 인기도 평가를 통한정보추천 방법 및 그 시스템 | |
CN102708174A (zh) | 一种浏览器中的富媒体信息的展示方法和装置 | |
CN101382954A (zh) | 提供网址收藏名称的方法及系统 | |
Samper et al. | NectaRSS, an intelligent RSS feed reader | |
WO2018042179A1 (en) | Method and system for providing content | |
JP7462198B1 (ja) | キーワード収集方法、情報処理装置およびプログラム | |
WO2008032037A1 (en) | Method and system for filtering and searching data using word frequencies | |
Chen et al. | Tianji: implementation of an efficient tracking engine in the mobile Internet era | |
Wen | Development of personalized online systems for web search, recommendations, and e-commerce | |
Olawale | Search engine optimization: concepts, techniques and challenges | |
Ma et al. | Creative computing for personalised meta-search engine based on semantic web |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231018 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20231018 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231219 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240305 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240313 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7462198 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |