JP2011013969A - Apparatus and method for supporting link creation, and program - Google Patents
Apparatus and method for supporting link creation, and program Download PDFInfo
- Publication number
- JP2011013969A JP2011013969A JP2009158003A JP2009158003A JP2011013969A JP 2011013969 A JP2011013969 A JP 2011013969A JP 2009158003 A JP2009158003 A JP 2009158003A JP 2009158003 A JP2009158003 A JP 2009158003A JP 2011013969 A JP2011013969 A JP 2011013969A
- Authority
- JP
- Japan
- Prior art keywords
- link
- candidate
- setting range
- word
- link setting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、リンク作成支援装置、リンク作成支援方法およびプログラムに関する。 The present invention relates to a link creation support apparatus, a link creation support method, and a program.
一般に、ブログ等のWebコンテンツ(以下、単に「コンテンツ」という)の作成者は、コンテンツの作成時(記述時)に、作成中のコンテンツを充実させるために、作成中のコンテンツ内に他のコンテンツへのリンクを作成する。リンク作成は、通常、作成中のコンテンツ上に、リンクを作成する範囲(アンカーテキスト)を指定し、当該指定範囲にはるリンク先を検索し、探し出したリンク先のURLを当該指定範囲に記述する。作成者は、リンクを1つ作成する毎、上述の煩雑な作業を行う。従って、リンク作成時の作成者の負担を軽減できる仕組みが望まれている。 In general, creators of web contents such as blogs (hereinafter simply referred to as “contents”) add other contents within the contents being created in order to enrich the contents being created when the contents are created (description). Create a link to Link creation usually specifies the range (anchor text) for creating a link on the content being created, searches for the link destination within the designated range, and describes the URL of the found link destination in the designated range. To do. Every time a creator creates one link, the creator performs the above-described complicated work. Therefore, a mechanism that can reduce the burden on the creator when creating a link is desired.
現在、リンク作成時の作成者の負担を軽減できる仕組みとして、キーワードと当該キーワードを解説する解説ページのURLを格納したデータベースを予め構築し、要求があった際に、ページ中のキーワードに解説ページへのリンクを自動付与する方法が知られている(例えば、特許文献1参照)。 Currently, as a mechanism that can reduce the burden on creators when creating links, a database that stores keywords and URLs of explanation pages that explain the keywords is built in advance. A method of automatically assigning a link to is known (for example, see Patent Document 1).
また、コンテンツ等の文書作成時に、作成中の文書中に出現する対象(例:レストランA)と属性(例:営業時間)の組を文法的なパターンから認識し、属性に対する値(例:10:00−24:00)が記載されているコンテンツを、リスト構造などの情報を基に自動取得し、作成者に提示する方法も提案されている(例えば、非特許文献1参照)。 Further, when creating a document such as content, a set of an object (eg, restaurant A) and an attribute (eg, business hours) appearing in the document being created is recognized from a grammatical pattern, and a value for the attribute (eg, 10). 0: 00-24: 00) is automatically acquired based on information such as a list structure and presented to the creator (for example, see Non-Patent Document 1).
しかしながら、特許文献1の方法は、データベース内のキーワードしか対応できないため、リンク作成時の作成者の負担を十分に軽減することができないという問題がある。また、非特許文献1の方法は、対象と属性の組しか対応できないため、リンク作成時の作成者の負担を十分に軽減することができないという問題がある。即ち、上記2方法は、作成者に、少なからず負担を感じさせてしまうという問題がある。
However, since the method of
本発明は、このような事情に鑑みてなされたものであり、リンク作成時の作成者の負担を大幅に軽減させる技術を提供することを目的とする。 The present invention has been made in view of such circumstances, and an object of the present invention is to provide a technique for greatly reducing the burden on the creator when creating a link.
上記問題を解決するために、本発明の一態様であるリンク作成支援装置は、作成中のコンテンツ内から、アンカーテキストとしてリンク先を設定するべきリンク設定範囲の候補となるリンク設定範囲候補を抽出するときに基準となる基準単語を抽出する基準単語抽出部と、作成中のコンテンツ内から、基準単語を基準にして、リンク作成の目的であるリンク目的の候補となるリンク目的候補毎に、1以上のリンク設定範囲候補を抽出するリンク設定範囲候補抽出部と、リンク目的候補とリンク設定範囲候補とに応じた検索方法を用いて、リンク目的候補とリンク設定範囲候補の組毎にリンク先の候補となるリンク先候補を検索するリンク先候補検索部と、リンク目的候補とリンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第1の評価値を算出し、第1の評価値をリンク目的候補別に集計し、集計後の第1の評価値に基づいてリンク目的候補からリンク目的を決定する第1決定部と、第1決定部によって決定されたリンク目的において、リンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第2の評価値を算出し、第2の評価値に基づいてリンク設定範囲候補からリンク設定範囲を決定する第2決定部とを備えることを特徴とする。 In order to solve the above problem, the link creation support apparatus according to one aspect of the present invention extracts link setting range candidates that are candidates for the link setting range in which a link destination should be set as anchor text from the content being created. A reference word extraction unit that extracts a reference word that serves as a reference, and for each link purpose candidate that is a link purpose candidate that is the purpose of link creation from the content being created, based on the reference word Using the link setting range candidate extraction unit for extracting the link setting range candidates and the search method according to the link purpose candidate and the link setting range candidate, the link destination candidate and link setting range candidate for each set of link destination candidates Link destination candidate search unit that searches for candidate link destination candidates, and appropriateness as a link destination for each set of link purpose candidates, link setting range candidates, and link destination candidates A first determination unit that calculates a first evaluation value to be displayed, aggregates the first evaluation value for each link purpose candidate, and determines a link purpose from the link purpose candidate based on the first evaluation value after the aggregation; For the link purpose determined by one determination unit, a second evaluation value indicating appropriateness as a link destination is calculated for each set of link setting range candidates and link destination candidates, and link setting is performed based on the second evaluation value And a second determination unit that determines a link setting range from the range candidates.
上記リンク作成支援装置において、第1決定部は、一のリンク先を設定するべき一のリンク設定範囲の候補となるリンク設定範囲候補の群毎に、リンク目的候補からリンク目的を決定し、第2決定部は、一のリンク先を設定するべき一のリンク設定範囲の候補となるリンク設定範囲候補の群毎に、リンク設定範囲候補からリンク設定範囲を決定するようにしてもよい。 In the link creation support apparatus, the first determination unit determines the link purpose from the link purpose candidates for each group of link setting range candidates that are candidates for one link setting range for which one link destination is to be set, The 2 determining unit may determine the link setting range from the link setting range candidates for each group of link setting range candidates that are candidates for one link setting range for which one link destination is to be set.
上記リンク作成支援装置において、第1決定部は、集計後の第1の評価値が最高のリンク目的候補をリンク目的として決定し、第2決定部は、第2の評価値が最高の組のリンク設定範囲候補をリンク設定範囲として決定するようにしてもよい。 In the link creation support apparatus, the first determination unit determines the link purpose candidate with the highest first evaluation value after aggregation as the link purpose, and the second determination unit determines the set with the highest second evaluation value. You may make it determine a link setting range candidate as a link setting range.
上記リンク作成支援装置において、第1決定部は、多変量解析によって生成された第1の予測モデルを用いて、第1の評価値を算出し、第2決定部は、多変量解析によって生成された第2の予測モデルを用いて、第2の評価値を算出するようにしてもよい。 In the link creation support apparatus, the first determination unit calculates a first evaluation value using the first prediction model generated by multivariate analysis, and the second determination unit is generated by multivariate analysis. Alternatively, the second evaluation value may be calculated using the second prediction model.
上記リンク作成支援装置において、リンク設定範囲候補抽出部は、リンク目的候補に応じて異なる単語数のリンク設定範囲候補を抽出するようにしてもよい。 In the link creation support apparatus, the link setting range candidate extraction unit may extract link setting range candidates having different numbers of words according to the link purpose candidates.
上記リンク作成支援装置において、基準単語抽出部は、一の単語が当該単語を含むコンテンツ内においてリンク設定範囲となる頻度を示す単語スコアに基づいて、基準単語を抽出するようにしてもよい。 In the link creation support apparatus, the reference word extraction unit may extract a reference word based on a word score indicating a frequency at which one word is in a link setting range in content including the word.
上記リンク作成支援装置において、リンク設定範囲候補抽出部は、単語スコアに応じて異なる単語数のリンク設定範囲候補を抽出するようにしてもよい。 In the link creation support apparatus, the link setting range candidate extraction unit may extract link setting range candidates having different numbers of words according to the word score.
上記リンク作成支援装置において、単語スコアは、単語を構成する文字列と単語の属性の組毎に付されているものであってもよい。 In the link creation support apparatus, the word score may be assigned to each set of a character string and a word attribute constituting the word.
上記リンク作成支援装置において、単語スコアは、自分が作成したコンテンツ内においてリンク設定範囲である場合は、他人が作成したコンテンツ内においてリンク設定範囲である場合に比べ、高いスコアが付されているものであってよい。 In the link creation support apparatus, the word score is higher in the link setting range in the content created by the user than in the link setting range in the content created by others. It may be.
上記リンク作成支援装置において、作成中のコンテンツ内において、リンク設定範囲にリンク先を設定するアンカーテキスト設定部を更に備え、第2決定部は、第2の評価値に基づいてリンク設定範囲候補から一のリンク設定範囲を決定するとともに、当該リンク設定範囲に対応する一のリンク先候補をアンカーテキスト設定部に供給し、アンカーテキスト設定部は、第2決定部から取得したリンク設定範囲に、第2決定部から取得したリンク先候補を設定するようにしてもよい。 The link creation support apparatus further includes an anchor text setting unit that sets a link destination in the link setting range in the content being created, and the second determination unit determines from the link setting range candidates based on the second evaluation value. One link setting range is determined, and one link destination candidate corresponding to the link setting range is supplied to the anchor text setting unit. The anchor text setting unit adds the first link setting range to the link setting range acquired from the second determination unit. 2 You may make it set the link destination candidate acquired from the determination part.
上記問題を解決するために、本発明の他の態様であるリンク作成支援方法は、作成中のコンテンツ内から、アンカーテキストとしてリンク先を設定するべきリンク設定範囲の候補となるリンク設定範囲候補を抽出するときに基準となる基準単語を抽出する基準単語抽出手段と、作成中のコンテンツ内から、基準単語を基準にして、リンク作成の目的であるリンク目的の候補となるリンク目的候補毎に、1以上のリンク設定範囲候補を抽出するリンク設定範囲候補抽出手段と、リンク目的候補とリンク設定範囲候補とに応じた検索方法を用いて、リンク目的候補とリンク設定範囲候補の組毎にリンク先の候補となるリンク先候補を検索するリンク先候補検索手段と、リンク目的候補とリンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第1の評価値を算出し、第1の評価値をリンク目的候補別に集計し、集計後の第1の評価値に基づいてリンク目的候補からリンク目的を決定する第1決定手段と、第1決定手段によって決定されたリンク目的において、リンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第2の評価値を算出し、第2の評価値に基づいてリンク設定範囲候補からリンク設定範囲を決定する第2決定手段とを備えることを特徴とする。 In order to solve the above-described problem, a link creation support method according to another aspect of the present invention includes a link setting range candidate to be a link setting range candidate to set a link destination as anchor text from within the content being created. Reference word extraction means for extracting a reference word that serves as a reference when extracting, and for each link purpose candidate that becomes a link purpose candidate that is the purpose of link creation, based on the reference word from the content being created, Link destination for each set of link purpose candidates and link setting range candidates using link setting range candidate extracting means for extracting one or more link setting range candidates and a search method according to the link purpose candidates and link setting range candidates Link destination candidate search means for searching for link destination candidates that are candidates for the link, and a link destination for each set of link purpose candidates, link setting range candidates, and link destination candidates First determination means for calculating a first evaluation value indicating appropriateness, totaling the first evaluation value for each link purpose candidate, and determining a link purpose from the link purpose candidate based on the first evaluation value after the totalization And, for the link purpose determined by the first determining means, a second evaluation value indicating the appropriateness as the link destination is calculated for each set of the link setting range candidate and the link destination candidate, and the second evaluation value is calculated based on the second evaluation value. And second determining means for determining the link setting range from the link setting range candidates.
上記問題を解決するために、本発明の一態様であるプログラムは、リンク作成を支援するリンク作成支援装置のコンピュータに、作成中のコンテンツ内から、アンカーテキストとしてリンク先を設定するべきリンク設定範囲の候補となるリンク設定範囲候補を抽出するときに基準となる基準単語を抽出する基準単語抽出ステップと、作成中のコンテンツ内から、基準単語を基準にして、リンク作成の目的であるリンク目的の候補となるリンク目的候補毎に、1以上のリンク設定範囲候補を抽出するリンク設定範囲候補抽出ステップと、リンク目的候補とリンク設定範囲候補とに応じた検索方法を用いて、リンク目的候補とリンク設定範囲候補の組毎にリンク先の候補となるリンク先候補を検索するリンク先候補検索ステップと、リンク目的候補とリンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第1の評価値を算出し、第1の評価値をリンク目的候補別に集計し、集計後の第1の評価値に基づいてリンク目的候補からリンク目的を決定する第1決定ステップと、第1決定ステップによって決定されたリンク目的において、リンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第2の評価値を算出し、第2の評価値に基づいてリンク設定範囲候補からリンク設定範囲を決定する第2決定ステップとを実行させることを特徴とする。 In order to solve the above problem, a program according to an aspect of the present invention provides a link setting range in which a link destination should be set as anchor text from the content being created on a computer of a link creation support apparatus that supports link creation. A reference word extraction step for extracting a reference word as a reference when extracting a link setting range candidate that is a candidate for the link, and a link purpose that is the purpose of creating a link based on the reference word from the content being created Link target candidates and links using a link setting range candidate extraction step for extracting one or more link setting range candidates for each candidate link purpose candidate, and a search method according to the link purpose candidate and the link setting range candidate Link destination candidate search step for searching for link destination candidates as link destination candidates for each set of setting range candidates, The first evaluation value indicating the appropriateness as the link destination is calculated for each set of the link setting range candidate and the link destination candidate, the first evaluation value is aggregated for each link purpose candidate, and the first evaluation after the aggregation is performed. In the first determination step of determining the link purpose from the link purpose candidates based on the value, and the link purpose determined in the first determination step, the appropriateness as the link destination is determined for each set of the link setting range candidate and the link destination candidate. A second evaluation value is calculated, and a second determination step of determining a link setting range from a link setting range candidate based on the second evaluation value is executed.
本発明によれば、リンク作成時の作成者の負担を大幅に軽減させることができるようになる。 According to the present invention, the burden on the creator when creating a link can be greatly reduced.
(第1の実施形態)
以下、本発明の第1の実施形態によるリンク作成支援10について説明する。リンク作成支援10は、コンテンツ作成を支援する装置であって、コンテンツの作成者のリンク目的に沿うようなリンク(リンクの作成位置など)を作成者に提示する。なお、リンク目的とは、作成中のコンテンツ内にリンクを作成する際のリンク作成の目的、意図である。リンクを作成する際には、複数のリンク目的が存在し、リンク目的毎に適切なリンク先は異なる。従って、適切なリンク先を決定(推定)するためには、適切なリンク目的を決定(推定)する必要がある。
(First embodiment)
The link creation support 10 according to the first embodiment of the present invention will be described below. The
代表的なリンク目的は次の通りである。
・過去記事参照
作成者自身が過去に作成したコンテンツ(過去記事)であって作成中のコンテンツに関連するコンテンツを参照する目的である。換言すえば、「過去記事参照」をリンク目的とするリンクは、過去記事を参照するためのリンクである。
・キーワード解説
特定のキーワードの意味について解説している辞書サイトなどのコンテンツ(解説コンテンツ)を参照する目的である。換言すえば、「キーワード解説」をリンク目的とするリンクは、解説コンテンツを参照するためのリンクである。
・公式サイト参照
企業やサービスなどの公式サイトを参照する目的である。換言すえば、「公式サイト参照」をリンク目的とするリンクは、公式サイトを参照するためのリンクである。
・情報源ページ参照
作成中のコンテンツの記述内容に関連する情報を詳細に伝えているコンテンツや記述内容の根拠となるコンテンツ(情報源ページ)を参照する目的である。換言すえば、「情報源ページ参照」をリンク目的とするリンクは、情報源ページを参照するためのリンクである。
Typical link objectives are:
-Past article reference The purpose is to refer to content (past article) created by the creator himself in the past and related to the content being created. In other words, a link whose purpose is “reference past article” is a link for referring to a past article.
・ Keyword explanation The purpose is to refer to contents (explanatory contents) such as dictionary sites that explain the meaning of specific keywords. In other words, a link whose purpose is “keyword commentary” is a link for referring to commentary content.
・ Official website reference The purpose is to refer to official websites of companies and services. In other words, a link whose purpose is “reference official site” is a link for referring to the official site.
-Reference to information source page This is for the purpose of referring to the content (information source page) that provides detailed information related to the description content of the content being created and the basis of the description content. In other words, the link for the purpose of “information source page reference” is a link for referring to the information source page.
以下、リンク作成支援10について図面を参照して説明する。リンク作成支援10は、図1に示すように、入出力部100、基準単語抽出部110、リンク設定範囲候補抽出部120、リンク先候補検索部130、第1決定部140、第2決定部150、予測モデル生成部160、単語スコア算出部180、単語DB190、過去記事DB191、外部取得コンテンツDB192および予測モデルDB193を備える。
Hereinafter, the
入出力部100は、作成中のコンテンツ(作成後に修正するコンテンツも含む)を取得する。入出力部100は、作成中のコンテンツを基準単語抽出部110に供給する。入出力部100は、作成後のコンテンツを過去記事DB191に供給する。また、作成者に対する種々のメッセージを出力する。
The input /
基準単語抽出部110は、入出力部100から、作成中のコンテンツを取得する。基準単語抽出部110は、作成中のコンテンツを取得した場合、作成中のコンテンツ内から、アンカーテキストとしてリンク先を設定するべきリンク設定範囲の候補となるリンク設定範囲候補を抽出するときに基準となる基準単語(特徴的な単語)を抽出する。具体的には、基準単語抽出部110は、一の単語が当該単語を含むコンテンツ内においてリンク設定範囲となる頻度(アンカーテキストへの含まれやすさ)を示す単語スコアに基づいて、基準単語を抽出する。
The reference
以下、詳細に説明する。まず、基準単語抽出部110は、作成中のコンテンツ内から、形態素解析によって単語を抽出する。基準単語抽出部110が抽出する単語は、名詞、動詞であって、助詞、助動詞などの機能語は抽出しない。
This will be described in detail below. First, the reference
続いて、基準単語抽出部110は、単語DB190を参照し、作成中のコンテンツ内から抽出した単語(名詞、動詞)に単語スコアを付与する。なお、単語DB190には、単語スコア算出部180によって算出された単語スコアが記憶されている。なお、単語スコア算出部180は、既存のコンテンツおよびアンカーテキストを解析し、各単語の単語スコアを算出するが、単語スコアの算出については後述する。
Subsequently, the reference
続いて、基準単語抽出部110は、単語スコアが第1の閾値以上である単語または第2の閾値以下である単語を更に抽出(基準単語として抽出)する。なお、基準単語抽出部110は、単語スコアが第1の閾値以上である単語または第2の閾値以下である単語が0個の場合には、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を入出力部100に通知してもよい。なお、当該通知を取得した入出力部100は、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を示すメッセージを出力する。
Subsequently, the reference
続いて、基準単語抽出部110は、単語スコアが第1の閾値以上である単語または第2の閾値以下である単語に対し、単語DB190に格納されている専門用語辞書や百科事典への登録状況およびアンカーテキストの直前や直後に出現する頻度に基づいて、「アンカー単語」「アンカー付属単語」または「アンカー隣接単語」の何れかを示すラベルを付与する。例えば、基準単語抽出部110は、単語スコアが第1の閾値以上であって専門用語辞書に登録されている一般的な単語に相当しない単語には「アンカー中心単語」を示すラベルを付与し、単語スコアが第1の閾値以上であって専門用語辞書に登録されていない一般的な単語に相当する単語には、「アンカー付属単語」を示すラベルを付与する。また、単語スコアが第2の閾値以下であって単語DB190に格納されているアンカーテキストの直前や直後に出現する割合が第3の閾値以上である単語には「アンカー隣接単語」を示すラベルを付与する。
Subsequently, the reference
なお、アンカー中心単語とは、アンカーテキストに含まれやすく、かつ、アンカーテキストが示す内容の中心事項となりやすい単語である。アンカー中心単語は、単独でアンカーテキストを構成することができる。アンカー中心単語の一例は、企業名、地名、人名などである。アンカー付属単語とは、アンカーテキストに含まれやすく、かつ、一般的な単語である。アンカー付属単語は、単独ではアンカーテキストを構成することができない。アンカー付属単語の一例は、「記事」「発表」などである。アンカー隣接単語とは、アンカーテキストには含まれにくく、かつ、アンカーテキストの直前や直後に出現しやすい単語である。アンカー隣接単語の一例は、「による」の「よる」や「を読んだ」の「読む」といった動詞であり、リンク先の内容をアンカーテキストに明示した後に続く単語である。 The anchor center word is a word that is easily included in the anchor text and is likely to be a central matter of the content indicated by the anchor text. An anchor center word can constitute anchor text by itself. An example of the anchor center word is a company name, a place name, a person name, or the like. The anchor attached word is a general word that is easily included in the anchor text. An anchor attached word cannot constitute anchor text by itself. Examples of anchor attached words are “article” and “announcement”. An anchor adjacent word is a word that is unlikely to be included in anchor text and is likely to appear immediately before or after the anchor text. An example of an anchor adjacent word is a verb such as “by” of “by” or “read” of “read”, and is a word following the contents of the link destination in the anchor text.
最後に、基準単語抽出部110は、入出力部100から取得した作成中のコンテンツとともに、基準単語(ラベル付)をリンク設定範囲候補抽出部120に供給する。なお、基準単語抽出部110は、作成中のコンテンツおよび基準単語(ラベル付)に加え、各基準単語の単語スコアをリンク設定範囲候補抽出部120に供給してもよい。
Finally, the reference
単語スコアの算出について説明する。なお、過去記事DB191には、入出力部100から取得したコンテンツ(過去記事)が格納され、外部取得コンテンツDB192には、ウェブクローリング(web crawling)により収集(取得)された外部のコンテンツが格納されている。単語スコア算出部180は、過去記事DB191および外部取得コンテンツDB192を参照し、ある単語を含むウェブページ、アンカーテキストに出現する単語、ある単語がアンカーテキストに含まれる割合、ある単語のアンカーテキスト内およびアンカーテキスト外の出現位置などの統計情報を解析し、単語スコアを算出する。
The calculation of the word score will be described. The
具体的には、例えば、単語スコア算出部180は、図2に示すように、外部取得コンテンツDB192内の既存のコンテンツの集合および過去記事DB191内の過去記事の集合から、ある単語が出現するコンテンツ数をX、X中で当該単語をアンカーテキスト中に含むコンテンツ数をYとしたとき、Y/Xを当該単語の単語スコアとして算出する。
Specifically, for example, as shown in FIG. 2, the word
図2の例では、単語毎に、コンテンツ数X、コンテンツ数Y、単語スコアX/Yを算出しているが、精度向上のため、単語の属性(例えば、地名、人名)を考慮して、コンテンツ数X、コンテンツ数Y、単語スコアX/Yを算出してもよい。即ち、例えば、単語を構成する文字列と単語の属性の組毎に単語スコアを付与してもよい(例えば、「山口」−「地名」と「山口」−「人名」とで異なる単語スコアを付与する)。また、自分が作成したコンテンツ(過去記事)内におけるアンカーテキストである場合は、他人が作成したコンテンツ内におけるアンカーテキストである場合に比べ、高いスコアを付与してもよい。 In the example of FIG. 2, the number of contents X, the number of contents Y, and the word score X / Y are calculated for each word. However, in order to improve accuracy, the attribute of the word (for example, place name, person name) is considered, The number of contents X, the number of contents Y, and the word score X / Y may be calculated. That is, for example, a word score may be assigned to each set of character strings and word attributes constituting a word (for example, different word scores for “Yamaguchi”-“place name” and “Yamaguchi”-“person name”). Give). Further, when the anchor text is in the content (past article) created by the user, a higher score may be given compared to the anchor text in the content created by another person.
リンク設定範囲候補抽出部120は、基準単語抽出部110から、作成中のコンテンツとともに、基準単語(ラベル付)を取得する。作成中のコンテンツとともに基準単語を取得したリンク設定範囲候補抽出部120は、作成中のコンテンツ内から、基準単語を基準にして、リンク目的の候補となるリンク目的候補毎に、1以上のリンク設定範囲候補を抽出する。リンク設定範囲候補抽出部120は、リンク目的候補に応じて異なる単語数のリンク設定範囲候補を抽出してもよい。なお、リンク設定範囲候補抽出部120は、作成中のコンテンツおよび基準単語に加え、各基準単語の単語スコアを基準単語抽出部110から取得した場合には、単語スコアに応じて、または、リンク目的候補および単語スコアに応じて、異なる単語数のリンク設定範囲候補を抽出してもよい。
The link setting range
リンク設定範囲候補抽出部120は、リンク目的候補毎にリンク設定範囲候補を抽出した場合、リンク目的候補毎のリンク設定範囲候補をリンク先候補検索部130に供給する。換言すれば、リンク設定範囲候補抽出部120は、リンク目的候補−リンク設定範囲候補の組をリンク先候補検索部130に供給する。
When the link setting range
以下、リンク設定範囲候補の抽出について詳細に説明する。リンク設定範囲候補抽出部120は、基準単語抽出部110において抽出された各ラベルの基準単語に基づき、作成中のコンテンツ内の基準単語(アンカー中心単語、アンカー付属単語、アンカー隣接単語)を基準に、単語を漸次追加(追加制限数nを設定する)し、作成中のコンテンツ上での範囲を漸次拡張し、リンク目的候補毎に、当該作成中のコンテンツから、複数のリンク設定範囲候補(リンク設定範囲候補のパターン)を抽出する。換言すれば、リンク設定範囲候補抽出部120は、図3に示すように、例えば、基準単語W1について、リンク目的候補毎にリンク設定範囲候補のパターンを抽出し、リンク目的候補−リンク設定範囲候補の組を格納するリストLW1を生成する。リンク設定範囲候補抽出部120は、作成中のコンテンツ全体の全基準単語に対し同様の処理を行い、リンク目的候補−リンク設定範囲候補の組を格納したリストL=[LW1、LW2、…]を生成する。換言すれば、リンク設定範囲候補抽出部120は、基準単語Wkを基準とした場合、全リンク目的分のリンク設定範囲候補のパターンを抽出する。
Hereinafter, extraction of a link setting range candidate will be described in detail. The link setting range
なお、上記追加制限数nは、リンク目的に応じて異なる値を設定する。リンク目的「キーワード解説」、リンク目的「公式サイト参照」の場合のアンカーテキスト中の単語数は短く、リンク目的「情報源ページ参照」、リンク目的「過去記事参照」の場合のアンカーテキスト中の単語数は長いなどリンク目的とアンカーテキスト中の単語数には相関があるためである。図3に示す例においては、リンク目的「キーワード解説」の場合には、前後1語を追加制限数(追加制限数n=1)とし、リンク目的「情報源ページ参照」の場合には、前後3語を追加制限数(追加制限数n=3)としている。また、単語スコアに応じて異なる値を設定してもよい。但し、追加制限数nにかかわらず、拡張範囲は、当該基準単語の属する一文(句点区切り)の範囲内までとする(同一文内を限度として拡張するものとする)。 The additional limit number n is set to a different value depending on the link purpose. The number of words in the anchor text for the link purpose “keyword explanation” and the link purpose “refer to the official website” is short, and the word in the anchor text for the link purpose “reference source page” and the link purpose “reference past article” This is because there is a correlation between the purpose of the link and the number of words in the anchor text, such as a long number. In the example shown in FIG. 3, in the case of the link purpose “keyword explanation”, the one word before and after is set as an additional limit number (additional limit number n = 1), and in the case of the link purpose “reference information source page”, before and after. Three words are set as the additional limit number (additional limit number n = 3). Different values may be set according to the word score. However, regardless of the additional limit number n, the extended range is limited to the range of one sentence (punctuation break) to which the reference word belongs (the same sentence is extended as a limit).
なお、リンク設定範囲候補抽出部120は、基準単語がアンカー中心単語、アンカー付属単語、アンカー隣接単語であるかを考慮して、リンク設定範囲候補のパターンを抽出してもよい。例えば、リンク設定範囲候補抽出部120は、一の文がアンカー中心単語である基準単語を含む場合、当該文においてアンカー中心単語である基準単語を基準(当該アンカー中心単語を基点(軸))としてリンク設定範囲候補のパターンを抽出する。リンク設定範囲候補抽出部120は、一の文がアンカー中心単語である基準単語を含まずアンカー付属単語である基準単語を含む場合、当該文においてアンカー付属単語を基準(当該アンカー付属単語を基点)としてリンク設定範囲候補のパターンを抽出する。また、リンク設定範囲候補抽出部120は、一の文がアンカー中心単語である基準単語およびアンカー付属単語である基準単語を含まずアンカー隣接単語である基準単語を含む場合、当該文においてアンカー隣接単語を基準(当該アンカー隣接単語の直前または直後の単語を基点)としてリンク設定範囲候補のパターンを抽出する。なお、リンク設定範囲候補抽出部120は、基準単語を含まない場合、当該文からはリンク設定範囲候補のパターンを抽出しない。
The link setting range
以下、図4のフローチャートを用いて、リンク設定範囲候補抽出部120による上記動作を説明する。図4において、リンク設定範囲候補抽出部120は、作成中のコンテンツを構成する文のインデックスiを初期化する(ステップS201)。リンク設定範囲候補抽出部120は、作成中のコンテンツからi番目の文を抽出する(ステップS202)。リンク設定範囲候補抽出部120は、i番目の文にアンカー中心単語である基準単語が含まれているか否かを判断する(ステップS203)。リンク設定範囲候補抽出部120は、i番目の文にアンカー中心単語である基準単語が含まれていると判断した場合(ステップS203:Yes)、アンカー中心単語である基準単語を基準にして、上述の如く、リンク設定範囲候補のパターンを抽出する(ステップS210)。
Hereinafter, the operation by the link setting range
即ち、リンク設定範囲候補抽出部120は、i番目の文がアンカー中心単語である基準単語Waを含む場合には、基準単語Waを基点としたリンク目的−リンク設定範囲候補を格納するリストLWaを生成する。より詳細には、まず、リンク設定範囲候補抽出部120は、あるリンク目的−基準単語Waを格納するLWaを生成する。次に、リンク設定範囲候補抽出部120は、単語追加数sを1とし、s+1個の単語から構成されるリンク設定範囲候補のうち、t番目の単語が基準単語Waであるリンク設定範囲候補をLWaに追加(処理1)する。リンク設定範囲候補抽出部120は、上記処理1を1以上(s+1)以下のtについて繰り返し実行(処理2)する。更に、リンク設定範囲候補抽出部120は、上記処理2を1以上n(追加制限数)以下のsについて繰り返し実行する(ステップS210)。
That is, when the i-th sentence includes the reference word Wa that is the anchor center word, the link setting range
一方、リンク設定範囲候補抽出部120は、i番目の文にアンカー中心単語である基準単語が含まれていないと判断した場合(ステップS203:No)、i番目の文にアンカー付属単語である基準単語が含まれているか否かを判断する(ステップS204)。リンク設定範囲候補抽出部120は、i番目の文にアンカー付属単語である基準単語が含まれていると判断した場合(ステップS204:Yes)、アンカー付属単語である基準単語を基準にして、上述の如く、リンク設定範囲候補のパターンを抽出する(ステップS220)。
On the other hand, when the link setting range
即ち、リンク設定範囲候補抽出部120は、i番目の文がアンカー中心単語である基準単語を含まずアンカー付属単語である基準単語Wbを含む場合には、基準単語Wbを基点としたリンク目的−リンク設定範囲候補を格納するリストLWbを生成する。より詳細には、まず、リンク設定範囲候補抽出部120は、単語追加数sを1とし、s+1個の単語から構成されるリンク設定範囲候補のうち、t番目の単語が基準単語Wbであるリンク設定範囲候補をLWbに追加(処理1)する。リンク設定範囲候補抽出部120は、上記処理1を1以上(s+1)以下のtについて繰り返し実行(処理2)する。なお、LWbは、例えば、上記処理1の1回目の実行時に生成する。更に、リンク設定範囲候補抽出部120は、上記処理2を1以上n(追加制限数)以下のsについて繰り返し実行する(ステップS220)。
That is, the link setting range
一方、リンク設定範囲候補抽出部120は、i番目の文にアンカー付属単語である基準単語が含まれていないと判断した場合(ステップS204:No)、i番目の文にアンカー隣接単語である基準単語が含まれているか否かを判断する(ステップS205)。リンク設定範囲候補抽出部120は、i番目の文にアンカー隣接単語である基準単語が含まれていると判断した場合(ステップS205:Yes)、アンカー隣接単語である基準単語を基準にして、上述の如く、リンク設定範囲候補のパターンを抽出する(ステップS230)。
On the other hand, when the link setting range
即ち、リンク設定範囲候補抽出部120は、i番目の文がアンカー中心単語である基準単語およびアンカー付属単語である基準単語を含まずアンカー隣接単語である基準単語Wcを含む場合には、基準単語Wcの直前または直後の単語を基点としたリンク目的−リンク設定範囲候補を格納するリストLWcを生成する。より詳細には、まず、リンク設定範囲候補抽出部120は、単語追加数sを0とし、s+1個の単語から構成されるリンク設定範囲候補のうち、s+1番目の単語が基準単語Wcの1個前またはs+1個後の単語であるリンク設定範囲候補をLWcに追加(処理1)する。リンク設定範囲候補抽出部120は、上記処理1を0以上n(追加制限数)以下のsについて繰り返し実行する(ステップS230)。なお、LWcは、例えば、上記処理1の1回目の実行時に生成する。
That is, the link setting range
リンク設定範囲候補抽出部120は、アンカー中心単語である基準単語を基準にしてリンク設定範囲候補のパターンを抽出した場合(ステップS210)、アンカー付属単語である基準単語を基準にしてリンク設定範囲候補のパターンを抽出した場合(ステップS220)、アンカー隣接単語である基準単語を基準にしてリンク設定範囲候補のパターンを抽出した場合(ステップS230)、または、i番目の文にアンカー隣接単語である基準単語が含まれていないと判断した場合(ステップS205:No)、インデックスiをカウントアップする(ステップS206)。続いて、リンク設定範囲候補抽出部120は、作成中のコンテンツにインデックスiの文が存在するか否かを判断する(ステップS207)。リンク設定範囲候補抽出部120は、インデックスiの文が存在すると判断した場合(ステップS207:Yes)、ステップS202に戻って次の一文を抽出する。一方、リンク設定範囲候補抽出部120は、インデックスiの文が存在しないと判断した場合(ステップS207:No)、少なくとも1つのリンク設定範囲候補を抽出したか否かを判断する(ステップS208)。
When the link setting range
リンク設定範囲候補抽出部120は、少なくとも1つのリンク設定範囲候補を抽出したと判断した場合(ステップS208:Yes)、本フローチャートは終了する。一方、リンク設定範囲候補抽出部120は、リンク設定範囲候補を1つも抽出していないと判断した場合(ステップS208:No)、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を入出力部100に通知し、当該通知を取得した入出力部100は、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を示すメッセージ(例えば、「抽出数0」)出力する(ステップS209)。そして本フローチャートは終了する。
When the link setting range
リンク先候補検索部130は、リンク設定範囲候補抽出部120から、リンク目的候補毎のリンク設定範囲候補を取得する。リンク目的候補毎のリンク設定範囲候補を取得したリンク先候補検索部130は、リンク目的候補とリンク設定範囲候補とに応じた検索方法を用いて、図5に示すように、リンク目的候補とリンク設定範囲候補の組毎に、リンク先の候補となるリンク先候補を検索する。例えば、図5に示す例において、リンク先候補検索部130は、リンク目的候補「キーワード解説」とリンク設定範囲候補「A」の組について、リンク先候補「K1」「K2」…「K5」を検索している。
The link
リンク目的候補とリンク設定範囲候補とに応じた検索方法とは、リンク先候補の検索に際し、リンク目的候補とリンク設定範囲候補とに応じて異なる検索条件(検索文字列)を用いることである。即ち、リンク先候補検索部130は、リンク目的候補とリンク設定範囲候補の組毎に異なる検索条件を生成し、外部のインターネットの汎用検索APIを利用してリンク先候補(リンク先候補であるコンテンツ)を検索する。
The search method according to the link purpose candidate and the link setting range candidate is to use different search conditions (search character strings) according to the link purpose candidate and the link setting range candidate when searching for the link destination candidate. That is, the link destination
例えば、リンク先候補検索部130は、リンク目的候補が「キーワード解説」、リンク設定範囲候補が「タイヤ交換」である場合には、「タイヤ交換とは」というような検索文字列を生成し、当該検索文字列の集合(検索文字列全体)を含むコンテンツを検索する。
For example, when the link destination candidate is “keyword commentary” and the link setting range candidate is “tire replacement”, the link destination
例えば、リンク先候補検索部130は、リンク目的候補が「公式サイト参照」である場合には、リンク設定範囲候補を検索文字列とし、当該検索文字列を含むコンテンツを検索する。
For example, when the link destination candidate is “reference to official site”, the link destination
例えば、リンク先候補検索部130は、リンク目的候補が「情報源ページ参照」である場合には、例えば、文章中の特徴的な単語や重要とみなされる単語を抽出するアルゴリズムであるTF−IDF(Term Frequency −Inverse Document Frequency)を使用して各単語の重要度を算出し、各単語が含まれる例えば、リンク設定範囲候補の範囲内であるか、リンク設定範囲候補の前後の所定長の文字列の範囲内であるか、その他の作成中のコンテンツ全体内であるかの場所に対応して予め定められた優先順位に基づいて検索に用いる単語(検索文字列)を選択し、当該単語を少なくとも1つ含むコンテンツを検索する。
For example, when the link destination candidate is “reference to the information source page”, the link
例えば、リンク先候補検索部130は、リンク目的候補が「過去記事参照」である場合には、例えば、過去記事DB191を指定して、リンク目的候補が「情報源ページ参照」である場合と同様にコンテンツを検索する。なお、リンク設定範囲候補または作成中のコンテンツに時間や時期を示す単語(例えば、「昨夜」「昨日」「前回」)が含まれる場合には、上記時間を用いて対象を絞り込んでもよい。
For example, when the link destination candidate is “reference past article”, for example, the link destination
リンク先候補検索部130は、リンク目的候補とリンク設定範囲候補の組毎にリンク先候補を検索した場合、リンク目的候補とリンク設定範囲候補とに対応付けて、リンク先候補を特定する情報(例えば、URL)を第1決定部140に供給する。換言すれば、リンク先候補検索部130は、リンク目的候補とリンク設定範囲候補とリンク先候補の組を第1決定部140に供給する。
When the link destination
なお、リンク先候補検索部130は、予め定められた件数以上のリンク先候補を検索できなかった場合には、検索条件を変更して予め定められた件数以上のリンク先候補を検索するようにしてもよい。
If the link destination
第1決定部140は、リンク先候補検索部130から、リンク目的候補とリンク設定範囲候補とに対応付けて、リンク先候補を特定する情報(例えば、URL)を取得する。換言すれば、第1決定部140は、リンク目的候補とリンク設定範囲候補とリンク先候補の組を取得する。リンク目的候補とリンク設定範囲候補とリンク先候補の組を取得した第1決定部140は、リンク目的候補とリンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第1の評価値を算出し、第1の評価値をリンク目的候補別に集計し、集計後の第1の評価値に基づいてリンク目的候補からリンク目的を決定(採用)する。具体的には、第1決定部140は、一のリンク先を設定するべき一のリンク設定範囲の候補となるリンク設定範囲候補の群毎に、リンク目的候補からリンク目的を決定する。換言すれば、第1決定部140は、リンク設定範囲候補抽出時に基準となった基準単語毎にリンク目的を決定する(1つのリンク先に対し1つのリンク目的を決定する)。なお、第1の評価値に係る具体例は後述する。
The
第1決定部140は、例えば、集計後の第1の評価値の高い順に上位N個(Nは2以上)のリンク目的候補をリンク目的として決定してもよい。また、第1決定部140は、集計後の第1の評価値が最高のリンク目的候補をリンク目的として決定してもよい。
The
第1決定部140は、リンク目的候補からリンク目的を決定した場合、当該リンク目的と当該リンク目的に対応するリンク設定範囲候補とリンク先候補を特定する情報(例えば、URL)とを第2決定部150に供給する。換言すれば、第1決定部140は、リンク目的とリンク設定範囲候補とリンク先候補の組を第2決定部150に供給する。
When the link purpose is determined from the link purpose candidates, the
つまり、第1決定部140は、作成中のコンテンツ全体の全基準単語を対象とし、リンク目的候補−リンク設定範囲候補の組を格納したリストL=[LW1、LW2、…]について、各基準単語[W1、W2、…]毎にリンク目的を決定し、当該リンク目的−リンク設定範囲候補の組と、当該リンク目的−リンク設定範囲候補の組に対応するリンク先候補を第2決定部150に供給する。例えば、第1決定部140は、基準単語W1に係るリンク目的候補−リンク設定範囲候補の組を格納するリストLW1からリンク目的を決定し、当該リンク目的−リンク設定範囲候補の組と、当該リンク目的−リンク設定範囲候補の組に対応するリンク先候補を第2決定部150に供給する。
That is, the
以下、第1の評価値について更に説明する。第1決定部140は、多変量解析によって生成された第1の予測モデルを用いて第1の評価値を算出する。第1の予測モデルは、リンク目的(リンク目的候補)に特化(依存)しない予測モデルである。なお、第1の予測モデルについての詳細は後述する。
Hereinafter, the first evaluation value will be further described. The
例えば、基準単語Waを基準として抽出されたリストLWaについて処理を行う場合、まず、第1決定部140は、予測モデルDB193に格納されている第1の予測モデルに、リストLWaの一の組(リンク目的候補−リンク設定範囲候補)と当該組に対応するリンク先候補を入力し、第1の評価値を取得する。例えば、図5に示す例において、第1決定部140は、リンク目的候補「キーワード解説」、リンク設定範囲候補「A」、リンク先候補「K1」のURL「http://www.k1/…」を入力し、第1の評価値「0.65」を取得する。第1決定部140は、リストLWa内の他の全ての組について上記処理を同様に行う。
For example, when processing is performed on the list LW extracted using the reference word Wa as a reference, first, the
次に、第1決定部140は、リンク目的候補毎に第1の評価値の平均値を算出する。例えば、図5に示す例において、第1決定部140は、リンク目的候補「キーワード解説」に係る第1の評価値の平均値「0.43」を算出している。次に、第1決定部140は、例えば、最も高い第1の評価値の平均値であるリンク目的候補をリンク目的として決定する。例えば、図5に示す例において、第1決定部140は、最も高い第1の評価値の平均値「0.62」であるリンク目的候補「公式サイト参照」をリンク目的として決定する。以上のようにして、第1決定部140は、基準単語Wa(リストLWa)に係るリンク目的「公式サイト参照」を決定する。第1決定部140は、他の全てのリストについて上記処理を同様に行う。
Next, the
なお、第1決定部140は、精度向上のため、第1の評価値の平均値が所定の閾値以上である場合に、リンク目的として決定するようにしてもよい。所定の閾値以上であるリンク目的候補が存在しない場合、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を入出力部100に通知してもよい。なお、当該通知を取得した入出力部100は、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を示すメッセージを出力する。
Note that the
なお、第1決定部140は、リンク先候補以外に、予め構築したリンク目的別のリンク設定範囲の構成パターン(単語ラベルおよび品詞(例えば、名詞、助詞))とのマッチ度を用いて、リンク目的決定時の精度向上および計算量削減を図ってもよい。当該マッチ度は、上記構成パターンに対する、リンク目的候補−リンク設定範囲候補の類似度を示すスコアである。
In addition, the
なお、リンク目的(リンク目的候補)とリンク設定範囲候補とリンク先候補の組毎の第1の評価値、または、リンク目的(リンク目的候補)別に集計(平均)した第1の評価値を、第2決定部150によるリンク設定範囲の決定時(後述)に利用してもよい。
The first evaluation value for each set of link purpose (link purpose candidate), link setting range candidate and link destination candidate, or the first evaluation value calculated (averaged) for each link purpose (link purpose candidate), It may be used when the
第2決定部150は、第1決定部140から、リンク目的とリンク設定範囲候補とリンク先候補(リンク先候補を特定する情報(例えば、URL))の組を取得する。リンク目的とリンク設定範囲候補とリンク先候補の組を取得した第2決定部150は、当該リンク目的において、リンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第2の評価値を算出し、第2の評価値に基づいてリンク設定範囲候補からリンク設定範囲を決定(採用)する。具体的には、第2決定部140は、一のリンク先を設定するべき一のリンク設定範囲の候補となるリンク設定範囲候補の群毎に、リンク設定範囲候補からリンク設定範囲を決定する。換言すれば、第2決定部150は、リンク設定範囲候補抽出時に基準となった基準単語毎にリンク設定範囲を決定する(1つのリンク先に対し1つのリンク設定範囲を決定する)。なお、第2の評価値に係る具体例は後述する。
The
第2決定部150は、例えば、第2の評価値の高い順に上位M個(Mは2以上)のリンク設定範囲候補をリンク設定範囲として決定してもよい。また、第2決定部150は、第2の評価値が最高のリンク設定範囲候補をリンク設定範囲として決定してもよい。
For example, the
第2決定部150は、リンク設定範囲候補からリンク設定範囲を決定した場合、リンク設定範囲と、当該リンク設定範囲に対応するリンク目的とを入出力部110に供給する。換言すれば、第2決定部150は、リンク設定範囲に対応付けてリンク目的を入出力部110に供給する。なお、第2決定部150からリンク設定範囲に対応付けてリンク目的を取得した入出力部110は、非図示の表示部を介して、リンク設定範囲に対応付けてリンク目的を作成者に提示(表示)する。
When determining the link setting range from the link setting range candidates, the second determining
また、第2決定部150は、リンク設定範囲候補からリンク設定範囲を決定した場合、リンク設定範囲と、当該リンク設定範囲に対応するリンク目的と、リンク先(当該リンク設定範囲に対応するリンク先候補)とを、入出力部110に供給するようにしてもよい。換言すれば、第2決定部150は、リンク設定範囲に対応付けてリンク目的およびリンク先を入出力部110に供給する。なお、第2決定部150からリンク設定範囲に対応付けてリンク目的およびリンク先を取得した入出力部110は、非図示の表示部を介して、リンク設定範囲に対応付けてリンク目的およびリンク先を作成者に提示(表示)する。
Further, when the
以下、第2の評価値について更に説明する。第2決定部150は、多変量解析によって生成された第2の予測モデルを用いて、第2の評価値を算出する。第2の予測モデルは、リンク目的に特化(依存)する予測モデルである。なお、第2の予測モデルについての詳細は後述する。
Hereinafter, the second evaluation value will be further described. The
例えば、第1決定部140により決定されたリンク目的に係る組のみを含む、リストLWaについて処理を行う場合、まず、第2決定部150は、予測モデルDB193に格納されている、当該リンク目的に特化した第2の予測モデルに、リストLWaの一の組(リンク目的−リンク設定範囲候補)のリンク設定範囲候補と、当該リンク設定範囲に対応するリンク先候補を入力し、第2の評価値を取得する。
For example, when processing the list LWa that includes only the set related to the link purpose determined by the
但し、第2決定部150は、リンク目的を決定する際に利用した第1の評価値を第2の評価値として利用する場合には、図5に示す例において、リンク目的「公式サイト参照」において、リンク設定範囲候補「A」、リンク先候補「K21」のURL「http://www.k21/…」を入力し、第1(第2)の評価値「0.65」を取得する。第2決定部150は、他の全ての組について上記処理を同様に行う。なお、第2決定部150は、第1の評価値を第2の評価値として利用する場合には、該当する第1の評価値を第1決定部140から取得してもよい。
However, when the
次に、第2決定部150は、例えば、最も高い第2の評価値であるリンク設定範囲候補およびリンク先候補の組をリンク設定範囲およびリンク先として決定する。第2決定部150は、他の全てのリストについて上記処理を同様に行う。
Next, the
なお、第2決定部150は、精度向上のため、第2の評価値の平均値が所定の閾値以上である場合に、リンク設定範囲(およびリンク先)として決定するようにしてもよい。所定の閾値以上であるリンク設定範囲(およびリンク先)が存在しない場合、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を入出力部100に通知してもよい。なお、当該通知を取得した入出力部100は、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を示すメッセージを出力する。
Note that the
続いて、第1の予測モデルおよび第2の予測モデルについて説明する。第1の予測モデルおよび第2の予測モデルは、予測モデル生成部160によって生成される。予測モデル生成部160は、予測モデル学習用データを用いて、第1の予測モデルおよび第2の予測モデルを生成する。予測モデル学習用データは、例えば、外部取得コンテンツDB192内に記憶される。
Next, the first prediction model and the second prediction model will be described. The first prediction model and the second prediction model are generated by the prediction
図6は、予測モデル学習用データの一例である。図6に示す予測モデル学習用データは、既存のコンテンツ中に存在するリンク(とアンカーテキストに対して)に対するリンク先候補1件が1エントリに相当する。また、各カラムは下記の通りである。
(各カラムの内容)
「リンク先候補URL」:検索により取得したリンク先候補のURL
「リンク目的」:各リンク先候補に係るリンク目的(人手にて付与)
「評価値」:各リンク先候補の適切さ(人手にて付与)
「尺度」:リンク元とリンク先候補コンテンツから算出される、リンク先候補のコンテンツ特徴量
FIG. 6 is an example of prediction model learning data. In the prediction model learning data shown in FIG. 6, one link destination candidate for a link (and an anchor text) existing in existing content corresponds to one entry. Each column is as follows.
(Content of each column)
“Link destination candidate URL”: URL of the link destination candidate acquired by the search
"Link purpose": Link purpose related to each link destination candidate (given manually)
"Evaluation value": Appropriateness of each link destination candidate (given manually)
"Scale": Content feature amount of link destination candidate calculated from link source and link destination candidate content
図6に示す鮮度は、コンテンツの新しさを表す尺度である。鮮度の値は、最終更新日が新しいリンク先候補ほど高い。最終更新日については、例えばリンク先候補のHTTPヘッダに含まれるLast-Modifiedフィールド値を参照する。信頼度は、リンク先候補のコンテンツの信頼性を表す尺度である。信頼度の値は、情報源として信頼できると考えられるWebサイトに属するリンク先候補ほど高い。例えば、信頼できるドメイン(“go.jp”といった政府系ドメイン等)に属するリンク先候補は高い。類似度は、リンク元のコンテンツ本文とリンク先候補のコンテンツ本文とにおける内容の類似度を表す尺度である。類似度の値は、本文の内容がリンク元のコンテンツと類似するリンク先候補ほど高い。URL/タイトル一致度は、リンク元のアンカーテキストに含まれる単語と、リンク先候補のURLまたはタイトルとの一致度を表す尺度である。URL/タイトル一致度の値は、リンク元のアンカーテキストに含まれる単語が、リンク先候補のURLまたはタイトル中に多く含まれるほど高い。 The freshness shown in FIG. 6 is a measure representing the novelty of the content. The freshness value is higher for a link destination candidate with a new last update date. For the last update date, for example, refer to the Last-Modified field value included in the HTTP header of the link destination candidate. The reliability is a measure representing the reliability of the content of the link destination candidate. The reliability value is higher for link destination candidates belonging to Web sites that are considered to be reliable as information sources. For example, link destination candidates belonging to a trusted domain (such as a government domain such as “go.jp”) are high. The similarity is a scale representing the similarity between the content text of the link source and the content text of the link destination candidate. The similarity value is higher for link destination candidates whose contents are similar to the link source content. The URL / title matching degree is a scale representing the degree of matching between the word included in the link source anchor text and the link destination candidate URL or title. The URL / title matching value is higher as the number of words included in the link source anchor text is included in the URL or title of the link destination candidate.
予測モデル生成部160は、評価値を目的変数、尺度の値を説明変数とし、多変量解析を行うことで、第1の予測モデルおよび第2の予測モデルを構築する。多変量解析としては、重回帰分析、SVM(Support Vector Machine)、NN(Neural Network)等、種々の方法が利用可能であるが、重回帰分析の例を説明する。なお、説明変数の値(尺度の値)をそれぞれf,r,s,uとし、それぞれの係数(重視する度合い)をa,b,c,dとしたとき、目的変数であるリンク先候補の評価値yは、下記式(1)によって表されるものとする。
The prediction
y=a×f+b×r+c×s+d×u+i…(1)
但し、iは切片である。
y = a * f + b * r + c * s + d * u + i (1)
However, i is an intercept.
予測モデル生成部160は、学習用データに重回帰分析を施すことにより、各尺度の重み(a,b,c,d)を算出する。予測モデルは、この算出した重みを用いた数式である。具体的には、予測モデル生成部160は、学習用データ全体を用いて重みを算出して第1の予測モデルを構築する。例えば、予測モデル生成部160は、図6のNo.1〜8のデータを用いて第1の予測モデルを構築する。また、予測モデル生成部160は、リンク目的固有の学習用データを用いて重みを算出して第2の予測モデルを構築する。例えば、予測モデル生成部160は、図6のNo.1〜4のデータを用いてリンク目的「キーワード解説」用の第2の予測モデルを構築し、予測モデル生成部160は、図6のNo.5〜8のデータを用いてリンク目的「公式サイト参照」用の第2の予測モデルを構築する。
The prediction
続いて、図7を用いて、リンク作成支援10の動作を説明する。なお、図7に示すフローチャートは、基準単語抽出部110が、入出力部100から作成中のコンテンツを取得することにより開始する。基準単語抽出部110は、作成中のコンテンツ内からリンク設定範囲候補を抽出するときに基準となる基準単語を抽出する(ステップS100)。基準単語を抽出した基準単語抽出部110は、作成中のコンテンツとともに基準単語(ラベル付)をリンク設定範囲候補抽出部120に供給する。
Subsequently, the operation of the
作成中のコンテンツとともに基準単語(ラベル付)を取得したリンク設定範囲候補抽出部120は、作成中のコンテンツ内からリンク設定範囲候補を抽出する(ステップS200)。なお、当該処理は、図4に示すとおりである。リンク設定範囲候補を抽出したリンク設定範囲候補抽出部120は、リンク目的候補−リンク設定範囲候補の組をリンク先候補検索部130に供給する。
The link setting range
リンク目的候補−リンク設定範囲候補の組を取得したリンク先候補検索部130は、リンク目的候補とリンク設定範囲候補の組毎に、リンク先候補を検索する(ステップS300)。リンク目的候補とリンク設定範囲候補の組毎にリンク先候補を検索したリンク先候補検索部130は、リンク先候補検索部130は、リンク目的候補とリンク設定範囲候補とリンク先候補の組を第1決定部140に供給する。
The link destination
リンク目的候補とリンク設定範囲候補とリンク先候補の組を取得した第1決定部140は、リンク設定範囲候補抽出時に基準となった基準単語毎にリンク目的を決定する(ステップS400)。基準単語毎にリンク目的を決定した第1決定部140は、リンク目的とリンク設定範囲候補とリンク先候補の組を第2決定部150に供給する。
The
リンク目的とリンク設定範囲候補とリンク先候補の組を取得した第2決定部150は、リンク設定範囲候補抽出時に基準となった基準単語毎にリンク設定範囲を決定する(ステップS500)。基準単語毎にリンク設定範囲を決定した第2決定部150は、リンク設定範囲に対応付けてリンク目的およびリンク先を入出力部110に供給する。
The
リンク設定範囲に対応付けてリンク目的およびリンク先を取得した入出力部110は、非図示の表示部を介して、リンク設定範囲に対応付けてリンク目的およびリンク先を作成者に出力(表示)する(ステップS600)。
The input /
以上、リンク作成支援装置10は、ブログ等のテキストベースのコンテンツ制作過程において、当該コンテンツ中にリンクを作成する範囲、および、当該範囲でリンクを作成する目的を推定し、リンクを作成する範囲などを自動的に提示する、リンク自動作成装置である。リンク作成支援装置10によれば、コンテンツの作成者のリンク目的に沿うようなリンク(リンク設定範囲、リンク目的/リンク設定範囲、リンク目的、リンク先)を作成者に提示するため、リンク作成時の作成者の負担を大幅に軽減させることができるようになる。なお、作成者の作成スタイルに応じて、ある基準単語について、1つのリンク目的と、1つのリンク設定範囲と、1つのリンク先を作成者に提示する態様としてもよいし、1つのリンク目的と、複数のリンク設定範囲と、各リンク設定範囲に対応するリンク先を作成者に提示する態様としてもよい。
As described above, in the text-based content production process such as a blog, the link
(第2の実施形態)
以下、本発明の第2の実施形態によるリンク作成支援12について説明する。リンク作成支援12は、コンテンツ作成を支援する装置であって、コンテンツの作成者のリンク目的に沿うようなリンクを作成中のコンテンツ内に自動的に作成する。
(Second Embodiment)
The
以下、リンク作成支援12について図面を参照して説明する。リンク作成支援12は、図8に示すように、入出力部100、基準単語抽出部110、リンク設定範囲候補抽出部120、リンク先候補検索部130、第1決定部140、第2決定部151、予測モデル生成部160、アンカーテキスト設定部170、単語スコア算出部180、単語DB190、過去記事DB191、外部取得コンテンツDB192および予測モデルDB193を備える。第2決定部151およびアンカーテキスト設定部170以外は、図1に示すリンク作成支援10と同様であるため、説明を省略する。
Hereinafter, the
第2決定部151は、第2決定部150と同様、リンク設定範囲候補からリンク設定範囲を決定する。但し、第2決定部151は、第2の評価値に基づいてリンク設定範囲候補から一のリンク設定範囲を決定する。即ち、第2決定部151は、第2の評価値が最高のリンク設定範囲候補をリンク設定範囲として決定する。
Similar to the
第2決定部151は、リンク設定範囲候補からリンク設定範囲を決定した場合、当該リンク設定範囲と、当該リンク設定範囲に対応するリンク先(当該リンク設定範囲に対応するリンク先候補)とをアンカーテキスト設定部170に供給する。換言すれば、第2決定部151は、リンク設定範囲に対応付けてリンク先をアンカーテキスト設定部170に供給する。
When determining the link setting range from the link setting range candidates, the second determining
また、第2決定部151は、リンク設定範囲候補からリンク設定範囲を決定した場合、当該リンク設定範囲と、当該リンク設定範囲に対応するリンク先と、当該リンク設定範囲に対応するリンク目的とをアンカーテキスト設定部170に供給してもよい。換言すれば、第2決定部151は、リンク設定範囲に対応付けてリンク先およびリンク目的をアンカーテキスト設定部170に供給してもよい。
Further, when the
アンカーテキスト設定部170は、例えば、入出力部100または基準単語抽出部110から、作成中のコンテンツを取得する。また、アンカーテキスト設定部170は、第2決定部151からリンク設定範囲に対応付けてリンク先を取得する。また、アンカーテキスト設定部170は、第2決定部151からリンク設定範囲に対応付けてリンク先およびリンク目的を取得してもよい。
For example, the anchor
リンク設定範囲に対応付けてリンク先を取得したアンカーテキスト設定部170は、作成中のコンテンツにおいて、当該リンク設定範囲に当該リンク先を設定する。また、リンク設定範囲に対応付けてリンク先およびリンク目的を取得したアンカーテキスト設定部170は、作成中のコンテンツにおいて、当該リンク設定範囲に当該リンク先を設定するとともに、当該リンク設定範囲の近傍にリンク目的を表示する(例えば、カーソルを当てた場合に表示するような表示態様であってもよい)。
The anchor
図9は、リンク作成支援12の動作の一例を示すフローチャートである。図9のステップS100、ステップS200、ステップS300、ステップS400、ステップS500は、図7に示すリンク作成支援10の動作と同様である。図9に示すように、リンク作成支援12の場合、アンカーテキスト設定部170が、作成中のコンテンツにおいて、リンク設定範囲にリンク先を設定する(ステップS610)。また、上述の如く、アンカーテキスト設定部170は、リンク設定範囲の近傍にリンク目的を表示する。
FIG. 9 is a flowchart illustrating an example of the operation of the
以上のように、リンク作成支援装置12は、ブログ等のテキストベースのコンテンツ制作過程において、当該コンテンツ中にリンクを作成する範囲、および、当該範囲でリンクを作成する目的を推定し、自動的にリンクを作成(リンクを作成する範囲、および、当該範囲によるリンク先を設定)する、リンク自動作成装置である。リンク作成支援装置12によれば、コンテンツの作成者のリンク目的に沿うようなリンク(リンク設定範囲、リンク先)を作成中のコンテンツ内に自動的に作成するため、リンク作成時の作成者の負担を更に大幅に軽減させることができるようになる。
As described above, in the text-based content production process such as a blog, the link
以上のように、リンク作成支援装置10またはリンク作成支援装置12によれば、作成者はリンク作成時に、アンカーテキストの選択、リンク先コンテンツの検索と選択、URLの転記といった煩雑な作業を必要とせず、リンク作成の負担を無くし(あるいは軽減し)、コンテンツ作成に注力できる。コンテンツ作成開始時に、内容に関して漠としたイメージであっても、本発明が提示する、アンカーテキスト−リンク目的−リンク先コンテンツを参照することにより、具体的な記述を支援することができる。自動的に内容が関連したコンテンツが提示されるため、これを参照することにより、作成者は自身が作成しているコンテンツ中の誤り等を発見可能である。これにより、Web上に誤った情報が公開されることを防ぐことが可能となる。本発明は、リンク目的別に適したコンテンツを推薦するため、これらへのリンクを作成することにより内容の充実を図れる。本発明を利用したコンテンツが多数作成されることにより、Web上に存在するコンテンツのうち、内容が充実しているコンテンツの割合を増加させることができる。これは、通常のWebの検索に対する満足度向上にも貢献する。
As described above, according to the link
なお、特許文献1、非特許文献1に記載の技術では、主に、リンク目的という概念しないため、作成者の意図に沿うような最適なリンク位置およびリンク先の提示、または、最適なリンク生成は非常に困難である。
The techniques described in
なお、本発明の一実施形態によるリンク作成支援装置10、12の各処理を実行するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、当該記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、本発明の一実施形態によるリンク作成支援装置10、12の各処理に係る上述した種々の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
Note that a program for executing each process of the link
さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。 Further, the “computer-readable recording medium” means a volatile memory (for example, DRAM (Dynamic DRAM) in a computer system that becomes a server or a client when a program is transmitted through a network such as the Internet or a communication line such as a telephone line. Random Access Memory)), etc., which hold programs for a certain period of time. The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line. The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, and what is called a difference file (difference program) may be sufficient.
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。 The embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to this embodiment, and includes designs and the like that do not depart from the gist of the present invention.
10、12 リンク作成支援装置 100 入出力部 110 基準単語抽出部 120 リンク設定範囲候補抽出部 130 リンク先候補検索部 140 第1決定部 150、151 第2決定部 160 予測モデル生成部 170 アンカーテスト設定部 180 単語スコア算出部 190 単語DB 191 過去記事DB 192 外部取得コンテンツDB 193 予測モデルDB
10, 12 Link
Claims (12)
作成中のコンテンツ内から、前記基準単語を基準にして、リンク作成の目的であるリンク目的の候補となるリンク目的候補毎に、1以上の前記リンク設定範囲候補を抽出するリンク設定範囲候補抽出部と、
前記リンク目的候補と前記リンク設定範囲候補とに応じた検索方法を用いて、前記リンク目的候補と前記リンク設定範囲候補の組毎にリンク先の候補となるリンク先候補を検索するリンク先候補検索部と、
前記リンク目的候補と前記リンク設定範囲候補と前記リンク先候補の組毎にリンク先としての適切さを示す第1の評価値を算出し、前記第1の評価値を前記リンク目的候補別に集計し、前記集計後の第1の評価値に基づいて前記リンク目的候補から前記リンク目的を決定する第1決定部と、
前記第1決定部によって決定された前記リンク目的において、前記リンク設定範囲候補と前記リンク先候補の組毎にリンク先としての適切さを示す第2の評価値を算出し、前記第2の評価値に基づいて前記リンク設定範囲候補から前記リンク設定範囲を決定する第2決定部と
を備えることを特徴とするリンク作成支援装置。 A reference word extraction unit that extracts a reference word that serves as a reference when extracting a link setting range candidate that is a candidate of a link setting range for which a link destination is to be set as an anchor text from the content being created;
A link setting range candidate extraction unit that extracts one or more link setting range candidates for each link purpose candidate that is a link purpose candidate that is the purpose of link creation from the content being created, based on the reference word When,
Link destination candidate search for searching for a link destination candidate as a link destination candidate for each set of the link purpose candidate and the link setting range candidate using a search method according to the link purpose candidate and the link setting range candidate And
A first evaluation value indicating appropriateness as a link destination is calculated for each set of the link purpose candidate, the link setting range candidate, and the link destination candidate, and the first evaluation value is aggregated for each link purpose candidate. A first determination unit that determines the link purpose from the link purpose candidates based on the first evaluation value after the aggregation;
In the link purpose determined by the first determination unit, a second evaluation value indicating suitability as a link destination is calculated for each set of the link setting range candidate and the link destination candidate, and the second evaluation is performed. A link creation support apparatus comprising: a second determination unit that determines the link setting range from the link setting range candidates based on a value.
一のリンク先に設定するべき一の前記リンク設定範囲の候補となる前記リンク設定範囲候補の群毎に、前記リンク目的候補から前記リンク目的を決定し、
前記第2決定部は、
一のリンク先に設定するべき一の前記リンク設定範囲の候補となる前記リンク設定範囲候補の群毎に、前記リンク設定範囲候補から前記リンク設定範囲を決定することを特徴とする請求項1に記載のリンク作成支援装置。 The first determination unit includes:
For each group of link setting range candidates that are candidates for one link setting range to be set to one link destination, the link purpose is determined from the link purpose candidates,
The second determination unit includes
The link setting range is determined from the link setting range candidates for each group of the link setting range candidates that are candidates for the one link setting range to be set as one link destination. The link creation support device described.
前記集計後の第1の評価値が最高の前記リンク目的候補を前記リンク目的として決定し、
前記第2決定部は、
前記第2の評価値が最高の前記組の前記リンク設定範囲候補を前記リンク設定範囲として決定することを特徴とする請求項1または請求項2に記載のリンク作成支援装置。 The first determination unit includes:
The link purpose candidate having the highest first evaluation value after the aggregation is determined as the link purpose,
The second determination unit includes
The link creation support apparatus according to claim 1 or 2, wherein the link setting range candidate of the set having the highest second evaluation value is determined as the link setting range.
多変量解析によって生成された第1の予測モデルを用いて、前記第1の評価値を算出し、
前記第2決定部は、
多変量解析によって生成された第2の予測モデルを用いて、前記第2の評価値を算出することを特徴とする請求項1から請求項3の何れかに記載のリンク作成支援装置。 The first determination unit includes:
Using the first prediction model generated by multivariate analysis, calculating the first evaluation value,
The second determination unit includes
The link creation support apparatus according to any one of claims 1 to 3, wherein the second evaluation value is calculated using a second prediction model generated by multivariate analysis.
前記リンク目的候補に応じて異なる単語数の前記リンク設定範囲候補を抽出することを特徴とする請求項1から請求項4の何れかに記載のリンク作成支援装置。 The link setting range candidate extraction unit
5. The link creation support apparatus according to claim 1, wherein the link setting range candidates having a different number of words are extracted according to the link purpose candidates.
一の単語が当該単語を含むコンテンツ内において前記リンク設定範囲となる頻度を示す単語スコアに基づいて、前記基準単語を抽出することを特徴とする請求項1から請求項5の何れかの請求項に記載のリンク作成支援装置。 The reference word extraction unit
6. The reference word according to claim 1, wherein the reference word is extracted based on a word score indicating a frequency at which one word is included in the link setting range in content including the word. The link creation support device described in 1.
前記単語スコアに応じて異なる単語数の前記リンク設定範囲候補を抽出することを特徴とする請求項6に記載のリンク作成支援装置。 The link setting range candidate extraction unit
The link creation support apparatus according to claim 6, wherein the link setting range candidates having a different number of words are extracted according to the word score.
単語を構成する文字列と単語の属性の組毎に付されていることを特徴とする請求項6または請求項7に記載のリンク作成支援装置。 The word score is
8. The link creation support apparatus according to claim 6, wherein the link creation support apparatus is attached to each set of a character string and a word attribute constituting the word.
自分が作成したコンテンツ内において前記リンク設定範囲である場合は、他人が作成したコンテンツ内において前記リンク設定範囲である場合に比べ、高いスコアが付されていることを特徴とする請求項6から請求項8の何れかの請求項に記載のリンク作成支援装置。 The word score is
7. The link setting range in the content created by the user is given a higher score than the case of the link setting range in the content created by another person. The link creation support apparatus according to claim 8.
を更に備え、
前記第2決定部は、
前記第2の評価値に基づいて前記リンク設定範囲候補から一の前記リンク設定範囲を決定するとともに、当該リンク設定範囲に対応する一のリンク先候補を前記アンカーテキスト設定部に供給し、
前記アンカーテキスト設定部は、
前記第2決定部から取得した前記リンク設定範囲に、前記第2決定部から取得した前記リンク先候補を設定することを特徴とする請求項1から請求項9に記載のリンク作成支援装置。 An anchor text setting unit that sets a link destination in the link setting range in the content being created,
The second determination unit includes
Determining one link setting range from the link setting range candidates based on the second evaluation value, and supplying one link destination candidate corresponding to the link setting range to the anchor text setting unit;
The anchor text setting unit
The link creation support apparatus according to claim 1, wherein the link destination candidate acquired from the second determination unit is set in the link setting range acquired from the second determination unit.
作成中のコンテンツ内から、前記基準単語を基準にして、リンク作成の目的であるリンク目的の候補となるリンク目的候補毎に、1以上の前記リンク設定範囲候補を抽出するリンク設定範囲候補抽出手段と、
前記リンク目的候補と前記リンク設定範囲候補とに応じた検索方法を用いて、前記リンク目的候補と前記リンク設定範囲候補の組毎にリンク先の候補となるリンク先候補を検索するリンク先候補検索手段と、
前記リンク目的候補と前記リンク設定範囲候補と前記リンク先候補の組毎にリンク先としての適切さを示す第1の評価値を算出し、前記第1の評価値を前記リンク目的候補別に集計し、前記集計後の第1の評価値に基づいて前記リンク目的候補から前記リンク目的を決定する第1決定手段と、
前記第1決定手段によって決定された前記リンク目的において、前記リンク設定範囲候補と前記リンク先候補の組毎にリンク先としての適切さを示す第2の評価値を算出し、前記第2の評価値に基づいて前記リンク設定範囲候補から前記リンク設定範囲を決定する第2決定手段と
を備えることを特徴とするリンク作成支援方法。 A reference word extraction unit that extracts a reference word that serves as a reference when extracting a link setting range candidate that is a candidate of a link setting range for which a link destination is to be set as an anchor text from the content being created;
Link setting range candidate extraction means for extracting one or more link setting range candidates for each link purpose candidate that is a link purpose candidate that is the purpose of link creation from the content being created with reference to the reference word When,
Link destination candidate search for searching for a link destination candidate as a link destination candidate for each set of the link purpose candidate and the link setting range candidate using a search method according to the link purpose candidate and the link setting range candidate Means,
A first evaluation value indicating appropriateness as a link destination is calculated for each set of the link purpose candidate, the link setting range candidate, and the link destination candidate, and the first evaluation value is aggregated for each link purpose candidate. First determining means for determining the link purpose from the link purpose candidates based on the first evaluation value after the aggregation;
For the link purpose determined by the first determining means, a second evaluation value indicating suitability as a link destination is calculated for each set of the link setting range candidate and the link destination candidate, and the second evaluation A link creation support method comprising: a second determination unit that determines the link setting range from the link setting range candidates based on a value.
作成中のコンテンツ内から、アンカーテキストとしてリンク先を設定するべきリンク設定範囲の候補となるリンク設定範囲候補を抽出するときに基準となる基準単語を抽出する基準単語抽出ステップと、
作成中のコンテンツ内から、前記基準単語を基準にして、リンク作成の目的であるリンク目的の候補となるリンク目的候補毎に、1以上の前記リンク設定範囲候補を抽出するリンク設定範囲候補抽出ステップと、
前記リンク目的候補と前記リンク設定範囲候補とに応じた検索方法を用いて、前記リンク目的候補と前記リンク設定範囲候補の組毎にリンク先の候補となるリンク先候補を検索するリンク先候補検索ステップと、
前記リンク目的候補と前記リンク設定範囲候補と前記リンク先候補の組毎にリンク先としての適切さを示す第1の評価値を算出し、前記第1の評価値を前記リンク目的候補別に集計し、前記集計後の第1の評価値に基づいて前記リンク目的候補から前記リンク目的を決定する第1決定ステップと、
前記第1決定ステップによって決定された前記リンク目的において、前記リンク設定範囲候補と前記リンク先候補の組毎にリンク先としての適切さを示す第2の評価値を算出し、前記第2の評価値に基づいて前記リンク設定範囲候補から前記リンク設定範囲を決定する第2決定ステップと
を実行させることを特徴とするプログラム。 In the computer of the link creation support device that supports link creation,
A reference word extraction step for extracting a reference word that serves as a reference when extracting a link setting range candidate to be a link setting range candidate for which a link destination should be set as an anchor text from within the content being created;
A link setting range candidate extraction step for extracting one or more link setting range candidates for each link purpose candidate that is a link purpose candidate that is a purpose of link creation from the content being created with reference to the reference word When,
Link destination candidate search for searching for a link destination candidate as a link destination candidate for each set of the link purpose candidate and the link setting range candidate using a search method according to the link purpose candidate and the link setting range candidate Steps,
A first evaluation value indicating appropriateness as a link destination is calculated for each set of the link purpose candidate, the link setting range candidate, and the link destination candidate, and the first evaluation value is aggregated for each link purpose candidate. A first determination step of determining the link purpose from the link purpose candidates based on the first evaluation value after the aggregation;
In the link purpose determined by the first determination step, a second evaluation value indicating suitability as a link destination is calculated for each set of the link setting range candidate and the link destination candidate, and the second evaluation And a second determination step of determining the link setting range from the link setting range candidates based on a value.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009158003A JP5277090B2 (en) | 2009-07-02 | 2009-07-02 | Link creation support device, link creation support method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009158003A JP5277090B2 (en) | 2009-07-02 | 2009-07-02 | Link creation support device, link creation support method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011013969A true JP2011013969A (en) | 2011-01-20 |
JP5277090B2 JP5277090B2 (en) | 2013-08-28 |
Family
ID=43592776
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009158003A Expired - Fee Related JP5277090B2 (en) | 2009-07-02 | 2009-07-02 | Link creation support device, link creation support method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5277090B2 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015062117A (en) * | 2013-09-22 | 2015-04-02 | 富士通株式会社 | Entity linkage method and entity linkage device |
JP2017167959A (en) * | 2016-03-17 | 2017-09-21 | ヤフー株式会社 | Evaluation device, evaluation method, and evaluation program |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000122774A (en) * | 1998-10-19 | 2000-04-28 | Toshihiko Okabe | Data transfer device and method, and recording medium |
JP2003208442A (en) * | 2002-01-15 | 2003-07-25 | Ricoh Co Ltd | Device and method for providing information, and program |
JP2005202895A (en) * | 2004-01-19 | 2005-07-28 | Hatena:Kk | Information display method, central processing unit, and computer program |
-
2009
- 2009-07-02 JP JP2009158003A patent/JP5277090B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000122774A (en) * | 1998-10-19 | 2000-04-28 | Toshihiko Okabe | Data transfer device and method, and recording medium |
JP2003208442A (en) * | 2002-01-15 | 2003-07-25 | Ricoh Co Ltd | Device and method for providing information, and program |
JP2005202895A (en) * | 2004-01-19 | 2005-07-28 | Hatena:Kk | Information display method, central processing unit, and computer program |
Non-Patent Citations (2)
Title |
---|
CSNG200910045021; 武吉 朋也: 'Webコンテンツ作成支援のためのリンク目的を意識したリンク先推薦手法' FIT2008 第7回情報科学技術フォーラム , 20080820, p.63〜64, 社団法人電子情報通信学会 * |
JPN6013019540; 武吉 朋也: 'Webコンテンツ作成支援のためのリンク目的を意識したリンク先推薦手法' FIT2008 第7回情報科学技術フォーラム , 20080820, p.63〜64, 社団法人電子情報通信学会 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015062117A (en) * | 2013-09-22 | 2015-04-02 | 富士通株式会社 | Entity linkage method and entity linkage device |
JP2017167959A (en) * | 2016-03-17 | 2017-09-21 | ヤフー株式会社 | Evaluation device, evaluation method, and evaluation program |
Also Published As
Publication number | Publication date |
---|---|
JP5277090B2 (en) | 2013-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9836511B2 (en) | Computer-generated sentiment-based knowledge base | |
EP2798540B1 (en) | Extracting search-focused key n-grams and/or phrases for relevance rankings in searches | |
US20150269163A1 (en) | Providing search recommendation | |
JP5710581B2 (en) | Question answering apparatus, method, and program | |
JP2019504413A (en) | System and method for proposing emoji | |
US10152478B2 (en) | Apparatus, system and method for string disambiguation and entity ranking | |
US20130060769A1 (en) | System and method for identifying social media interactions | |
US10810374B2 (en) | Matching a query to a set of sentences using a multidimensional relevancy determination | |
JP2009093649A (en) | Recommendation for term specifying ontology space | |
JP5391632B2 (en) | Determining word and document depth | |
US20170011092A1 (en) | Systems and methods for the creation, update and use of models in finding and analyzing content | |
US20110219299A1 (en) | Method and system of providing completion suggestion to a partial linguistic element | |
JP5768492B2 (en) | Information processing apparatus, information processing method, and program | |
JPWO2012096388A1 (en) | Unexpectedness determination system, unexpectedness determination method, and program | |
JP2014197300A (en) | Text information processor, text information processing method, and text information processing program | |
JP2018504686A (en) | Method and apparatus for processing search data | |
JP6664599B2 (en) | Ambiguity evaluation device, ambiguity evaluation method, and ambiguity evaluation program | |
US20190019094A1 (en) | Determining suitability for presentation as a testimonial about an entity | |
JP2013003663A (en) | Information processing apparatus, information processing method, and program | |
JP5427694B2 (en) | Related content presentation apparatus and program | |
Arguello et al. | Using query performance predictors to reduce spoken queries | |
JP5277090B2 (en) | Link creation support device, link creation support method, and program | |
JP6163143B2 (en) | Information providing apparatus, information providing method, and information providing program | |
CN111460177A (en) | Method and device for searching film and television expression, storage medium and computer equipment | |
JP5364529B2 (en) | Dictionary registration device, document label determination system, and dictionary registration program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120228 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20120229 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130423 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130425 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130520 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5277090 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |