JP2011013969A - Apparatus and method for supporting link creation, and program - Google Patents

Apparatus and method for supporting link creation, and program Download PDF

Info

Publication number
JP2011013969A
JP2011013969A JP2009158003A JP2009158003A JP2011013969A JP 2011013969 A JP2011013969 A JP 2011013969A JP 2009158003 A JP2009158003 A JP 2009158003A JP 2009158003 A JP2009158003 A JP 2009158003A JP 2011013969 A JP2011013969 A JP 2011013969A
Authority
JP
Japan
Prior art keywords
link
candidate
setting range
word
link setting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009158003A
Other languages
Japanese (ja)
Other versions
JP5277090B2 (en
Inventor
Tomoya Takeyoshi
朋也 武吉
Hajime Hattori
元 服部
Toshihiro Ono
智弘 小野
Yasuhiro Takishima
康弘 滝嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2009158003A priority Critical patent/JP5277090B2/en
Publication of JP2011013969A publication Critical patent/JP2011013969A/en
Application granted granted Critical
Publication of JP5277090B2 publication Critical patent/JP5277090B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide a technique for sharply reducing creator's loads in link creation.SOLUTION: A link creation supporting apparatus includes: a reference word extraction part 110 for extracting a reference word to be a reference for extracting a link setting range candidate; a link setting range candidate extraction part 120 for extracting link setting range candidates in each link purpose candidate to be a candidate of a link purpose; a link destination candidate retrieval part 130 for retrieving link destination candidates to be candidates of a link destination in each group of a link purpose candidate and a link setting range candidate; a first determination part 140 for calculating a first evaluation value in each group of a link purpose candidate, a link setting range candidate and a link destination candidate, totalizing the first evaluation values in each purpose candidate, and determining a link purpose from the link purpose candidates based on the totalized first evaluation value; and a second determination part 150 for calculating a second evaluation value in each group of a link setting range candidate and a link destination candidate in the link purpose determined by the first determination part, and determining a link setting range from link setting range candidates based on the second evaluation value.

Description

本発明は、リンク作成支援装置、リンク作成支援方法およびプログラムに関する。   The present invention relates to a link creation support apparatus, a link creation support method, and a program.

一般に、ブログ等のWebコンテンツ(以下、単に「コンテンツ」という)の作成者は、コンテンツの作成時(記述時)に、作成中のコンテンツを充実させるために、作成中のコンテンツ内に他のコンテンツへのリンクを作成する。リンク作成は、通常、作成中のコンテンツ上に、リンクを作成する範囲(アンカーテキスト)を指定し、当該指定範囲にはるリンク先を検索し、探し出したリンク先のURLを当該指定範囲に記述する。作成者は、リンクを1つ作成する毎、上述の煩雑な作業を行う。従って、リンク作成時の作成者の負担を軽減できる仕組みが望まれている。   In general, creators of web contents such as blogs (hereinafter simply referred to as “contents”) add other contents within the contents being created in order to enrich the contents being created when the contents are created (description). Create a link to Link creation usually specifies the range (anchor text) for creating a link on the content being created, searches for the link destination within the designated range, and describes the URL of the found link destination in the designated range. To do. Every time a creator creates one link, the creator performs the above-described complicated work. Therefore, a mechanism that can reduce the burden on the creator when creating a link is desired.

現在、リンク作成時の作成者の負担を軽減できる仕組みとして、キーワードと当該キーワードを解説する解説ページのURLを格納したデータベースを予め構築し、要求があった際に、ページ中のキーワードに解説ページへのリンクを自動付与する方法が知られている(例えば、特許文献1参照)。   Currently, as a mechanism that can reduce the burden on creators when creating links, a database that stores keywords and URLs of explanation pages that explain the keywords is built in advance. A method of automatically assigning a link to is known (for example, see Patent Document 1).

また、コンテンツ等の文書作成時に、作成中の文書中に出現する対象(例:レストランA)と属性(例:営業時間)の組を文法的なパターンから認識し、属性に対する値(例:10:00−24:00)が記載されているコンテンツを、リスト構造などの情報を基に自動取得し、作成者に提示する方法も提案されている(例えば、非特許文献1参照)。   Further, when creating a document such as content, a set of an object (eg, restaurant A) and an attribute (eg, business hours) appearing in the document being created is recognized from a grammatical pattern, and a value for the attribute (eg, 10). 0: 00-24: 00) is automatically acquired based on information such as a list structure and presented to the creator (for example, see Non-Patent Document 1).

特開2005−202895号公報JP 2005-202895 A

“Webから動的に獲得した属性/値を利用する文章作成支援環境,”中村和正、吉永直樹、鳥澤健太郎、DBWeb2007、Vol.5B−1“Text creation support environment using attributes / values dynamically acquired from the Web,” Kazumasa Nakamura, Naoki Yoshinaga, Kentaro Torizawa, DBWeb2007, Vol. 5B-1

しかしながら、特許文献1の方法は、データベース内のキーワードしか対応できないため、リンク作成時の作成者の負担を十分に軽減することができないという問題がある。また、非特許文献1の方法は、対象と属性の組しか対応できないため、リンク作成時の作成者の負担を十分に軽減することができないという問題がある。即ち、上記2方法は、作成者に、少なからず負担を感じさせてしまうという問題がある。   However, since the method of Patent Document 1 can only deal with keywords in the database, there is a problem that the burden on the creator at the time of creating a link cannot be reduced sufficiently. In addition, since the method of Non-Patent Document 1 can handle only a pair of an object and an attribute, there is a problem that the burden on the creator at the time of creating a link cannot be reduced sufficiently. That is, the above two methods have a problem that the creator feels a burden.

本発明は、このような事情に鑑みてなされたものであり、リンク作成時の作成者の負担を大幅に軽減させる技術を提供することを目的とする。   The present invention has been made in view of such circumstances, and an object of the present invention is to provide a technique for greatly reducing the burden on the creator when creating a link.

上記問題を解決するために、本発明の一態様であるリンク作成支援装置は、作成中のコンテンツ内から、アンカーテキストとしてリンク先を設定するべきリンク設定範囲の候補となるリンク設定範囲候補を抽出するときに基準となる基準単語を抽出する基準単語抽出部と、作成中のコンテンツ内から、基準単語を基準にして、リンク作成の目的であるリンク目的の候補となるリンク目的候補毎に、1以上のリンク設定範囲候補を抽出するリンク設定範囲候補抽出部と、リンク目的候補とリンク設定範囲候補とに応じた検索方法を用いて、リンク目的候補とリンク設定範囲候補の組毎にリンク先の候補となるリンク先候補を検索するリンク先候補検索部と、リンク目的候補とリンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第1の評価値を算出し、第1の評価値をリンク目的候補別に集計し、集計後の第1の評価値に基づいてリンク目的候補からリンク目的を決定する第1決定部と、第1決定部によって決定されたリンク目的において、リンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第2の評価値を算出し、第2の評価値に基づいてリンク設定範囲候補からリンク設定範囲を決定する第2決定部とを備えることを特徴とする。   In order to solve the above problem, the link creation support apparatus according to one aspect of the present invention extracts link setting range candidates that are candidates for the link setting range in which a link destination should be set as anchor text from the content being created. A reference word extraction unit that extracts a reference word that serves as a reference, and for each link purpose candidate that is a link purpose candidate that is the purpose of link creation from the content being created, based on the reference word Using the link setting range candidate extraction unit for extracting the link setting range candidates and the search method according to the link purpose candidate and the link setting range candidate, the link destination candidate and link setting range candidate for each set of link destination candidates Link destination candidate search unit that searches for candidate link destination candidates, and appropriateness as a link destination for each set of link purpose candidates, link setting range candidates, and link destination candidates A first determination unit that calculates a first evaluation value to be displayed, aggregates the first evaluation value for each link purpose candidate, and determines a link purpose from the link purpose candidate based on the first evaluation value after the aggregation; For the link purpose determined by one determination unit, a second evaluation value indicating appropriateness as a link destination is calculated for each set of link setting range candidates and link destination candidates, and link setting is performed based on the second evaluation value And a second determination unit that determines a link setting range from the range candidates.

上記リンク作成支援装置において、第1決定部は、一のリンク先を設定するべき一のリンク設定範囲の候補となるリンク設定範囲候補の群毎に、リンク目的候補からリンク目的を決定し、第2決定部は、一のリンク先を設定するべき一のリンク設定範囲の候補となるリンク設定範囲候補の群毎に、リンク設定範囲候補からリンク設定範囲を決定するようにしてもよい。   In the link creation support apparatus, the first determination unit determines the link purpose from the link purpose candidates for each group of link setting range candidates that are candidates for one link setting range for which one link destination is to be set, The 2 determining unit may determine the link setting range from the link setting range candidates for each group of link setting range candidates that are candidates for one link setting range for which one link destination is to be set.

上記リンク作成支援装置において、第1決定部は、集計後の第1の評価値が最高のリンク目的候補をリンク目的として決定し、第2決定部は、第2の評価値が最高の組のリンク設定範囲候補をリンク設定範囲として決定するようにしてもよい。   In the link creation support apparatus, the first determination unit determines the link purpose candidate with the highest first evaluation value after aggregation as the link purpose, and the second determination unit determines the set with the highest second evaluation value. You may make it determine a link setting range candidate as a link setting range.

上記リンク作成支援装置において、第1決定部は、多変量解析によって生成された第1の予測モデルを用いて、第1の評価値を算出し、第2決定部は、多変量解析によって生成された第2の予測モデルを用いて、第2の評価値を算出するようにしてもよい。   In the link creation support apparatus, the first determination unit calculates a first evaluation value using the first prediction model generated by multivariate analysis, and the second determination unit is generated by multivariate analysis. Alternatively, the second evaluation value may be calculated using the second prediction model.

上記リンク作成支援装置において、リンク設定範囲候補抽出部は、リンク目的候補に応じて異なる単語数のリンク設定範囲候補を抽出するようにしてもよい。   In the link creation support apparatus, the link setting range candidate extraction unit may extract link setting range candidates having different numbers of words according to the link purpose candidates.

上記リンク作成支援装置において、基準単語抽出部は、一の単語が当該単語を含むコンテンツ内においてリンク設定範囲となる頻度を示す単語スコアに基づいて、基準単語を抽出するようにしてもよい。   In the link creation support apparatus, the reference word extraction unit may extract a reference word based on a word score indicating a frequency at which one word is in a link setting range in content including the word.

上記リンク作成支援装置において、リンク設定範囲候補抽出部は、単語スコアに応じて異なる単語数のリンク設定範囲候補を抽出するようにしてもよい。   In the link creation support apparatus, the link setting range candidate extraction unit may extract link setting range candidates having different numbers of words according to the word score.

上記リンク作成支援装置において、単語スコアは、単語を構成する文字列と単語の属性の組毎に付されているものであってもよい。   In the link creation support apparatus, the word score may be assigned to each set of a character string and a word attribute constituting the word.

上記リンク作成支援装置において、単語スコアは、自分が作成したコンテンツ内においてリンク設定範囲である場合は、他人が作成したコンテンツ内においてリンク設定範囲である場合に比べ、高いスコアが付されているものであってよい。   In the link creation support apparatus, the word score is higher in the link setting range in the content created by the user than in the link setting range in the content created by others. It may be.

上記リンク作成支援装置において、作成中のコンテンツ内において、リンク設定範囲にリンク先を設定するアンカーテキスト設定部を更に備え、第2決定部は、第2の評価値に基づいてリンク設定範囲候補から一のリンク設定範囲を決定するとともに、当該リンク設定範囲に対応する一のリンク先候補をアンカーテキスト設定部に供給し、アンカーテキスト設定部は、第2決定部から取得したリンク設定範囲に、第2決定部から取得したリンク先候補を設定するようにしてもよい。   The link creation support apparatus further includes an anchor text setting unit that sets a link destination in the link setting range in the content being created, and the second determination unit determines from the link setting range candidates based on the second evaluation value. One link setting range is determined, and one link destination candidate corresponding to the link setting range is supplied to the anchor text setting unit. The anchor text setting unit adds the first link setting range to the link setting range acquired from the second determination unit. 2 You may make it set the link destination candidate acquired from the determination part.

上記問題を解決するために、本発明の他の態様であるリンク作成支援方法は、作成中のコンテンツ内から、アンカーテキストとしてリンク先を設定するべきリンク設定範囲の候補となるリンク設定範囲候補を抽出するときに基準となる基準単語を抽出する基準単語抽出手段と、作成中のコンテンツ内から、基準単語を基準にして、リンク作成の目的であるリンク目的の候補となるリンク目的候補毎に、1以上のリンク設定範囲候補を抽出するリンク設定範囲候補抽出手段と、リンク目的候補とリンク設定範囲候補とに応じた検索方法を用いて、リンク目的候補とリンク設定範囲候補の組毎にリンク先の候補となるリンク先候補を検索するリンク先候補検索手段と、リンク目的候補とリンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第1の評価値を算出し、第1の評価値をリンク目的候補別に集計し、集計後の第1の評価値に基づいてリンク目的候補からリンク目的を決定する第1決定手段と、第1決定手段によって決定されたリンク目的において、リンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第2の評価値を算出し、第2の評価値に基づいてリンク設定範囲候補からリンク設定範囲を決定する第2決定手段とを備えることを特徴とする。   In order to solve the above-described problem, a link creation support method according to another aspect of the present invention includes a link setting range candidate to be a link setting range candidate to set a link destination as anchor text from within the content being created. Reference word extraction means for extracting a reference word that serves as a reference when extracting, and for each link purpose candidate that becomes a link purpose candidate that is the purpose of link creation, based on the reference word from the content being created, Link destination for each set of link purpose candidates and link setting range candidates using link setting range candidate extracting means for extracting one or more link setting range candidates and a search method according to the link purpose candidates and link setting range candidates Link destination candidate search means for searching for link destination candidates that are candidates for the link, and a link destination for each set of link purpose candidates, link setting range candidates, and link destination candidates First determination means for calculating a first evaluation value indicating appropriateness, totaling the first evaluation value for each link purpose candidate, and determining a link purpose from the link purpose candidate based on the first evaluation value after the totalization And, for the link purpose determined by the first determining means, a second evaluation value indicating the appropriateness as the link destination is calculated for each set of the link setting range candidate and the link destination candidate, and the second evaluation value is calculated based on the second evaluation value. And second determining means for determining the link setting range from the link setting range candidates.

上記問題を解決するために、本発明の一態様であるプログラムは、リンク作成を支援するリンク作成支援装置のコンピュータに、作成中のコンテンツ内から、アンカーテキストとしてリンク先を設定するべきリンク設定範囲の候補となるリンク設定範囲候補を抽出するときに基準となる基準単語を抽出する基準単語抽出ステップと、作成中のコンテンツ内から、基準単語を基準にして、リンク作成の目的であるリンク目的の候補となるリンク目的候補毎に、1以上のリンク設定範囲候補を抽出するリンク設定範囲候補抽出ステップと、リンク目的候補とリンク設定範囲候補とに応じた検索方法を用いて、リンク目的候補とリンク設定範囲候補の組毎にリンク先の候補となるリンク先候補を検索するリンク先候補検索ステップと、リンク目的候補とリンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第1の評価値を算出し、第1の評価値をリンク目的候補別に集計し、集計後の第1の評価値に基づいてリンク目的候補からリンク目的を決定する第1決定ステップと、第1決定ステップによって決定されたリンク目的において、リンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第2の評価値を算出し、第2の評価値に基づいてリンク設定範囲候補からリンク設定範囲を決定する第2決定ステップとを実行させることを特徴とする。   In order to solve the above problem, a program according to an aspect of the present invention provides a link setting range in which a link destination should be set as anchor text from the content being created on a computer of a link creation support apparatus that supports link creation. A reference word extraction step for extracting a reference word as a reference when extracting a link setting range candidate that is a candidate for the link, and a link purpose that is the purpose of creating a link based on the reference word from the content being created Link target candidates and links using a link setting range candidate extraction step for extracting one or more link setting range candidates for each candidate link purpose candidate, and a search method according to the link purpose candidate and the link setting range candidate Link destination candidate search step for searching for link destination candidates as link destination candidates for each set of setting range candidates, The first evaluation value indicating the appropriateness as the link destination is calculated for each set of the link setting range candidate and the link destination candidate, the first evaluation value is aggregated for each link purpose candidate, and the first evaluation after the aggregation is performed. In the first determination step of determining the link purpose from the link purpose candidates based on the value, and the link purpose determined in the first determination step, the appropriateness as the link destination is determined for each set of the link setting range candidate and the link destination candidate. A second evaluation value is calculated, and a second determination step of determining a link setting range from a link setting range candidate based on the second evaluation value is executed.

本発明によれば、リンク作成時の作成者の負担を大幅に軽減させることができるようになる。   According to the present invention, the burden on the creator when creating a link can be greatly reduced.

本発明の第1の実施形態によるリンク作成支援10の機能ブロック図である。It is a functional block diagram of link creation support 10 by a 1st embodiment of the present invention. 単語スコアの算出について説明する説明図である。It is explanatory drawing explaining calculation of a word score. リンク設定範囲候補の抽出について説明する説明図である。It is explanatory drawing explaining extraction of a link setting range candidate. リンク設定範囲候補抽出部120の動作の一例を示すフローチャートである。5 is a flowchart illustrating an example of an operation of a link setting range candidate extraction unit 120. リンク先候補の検出、リンク目的の決定について説明する説明図である。It is explanatory drawing explaining the detection of a link destination candidate, and determination of the link objective. 予測モデル学習用データの一例である。It is an example of the data for prediction model learning. リンク作成支援10の動作の一例を示すフローチャートである。It is a flowchart which shows an example of operation | movement of the link creation assistance 10. 本発明の第2の実施形態によるリンク作成支援12の機能ブロック図である。It is a functional block diagram of the link creation assistance 12 by the 2nd Embodiment of this invention. リンク作成支援12の動作の一例を示すフローチャートである。It is a flowchart which shows an example of operation | movement of the link creation assistance 12.

(第1の実施形態)
以下、本発明の第1の実施形態によるリンク作成支援10について説明する。リンク作成支援10は、コンテンツ作成を支援する装置であって、コンテンツの作成者のリンク目的に沿うようなリンク(リンクの作成位置など)を作成者に提示する。なお、リンク目的とは、作成中のコンテンツ内にリンクを作成する際のリンク作成の目的、意図である。リンクを作成する際には、複数のリンク目的が存在し、リンク目的毎に適切なリンク先は異なる。従って、適切なリンク先を決定(推定)するためには、適切なリンク目的を決定(推定)する必要がある。
(First embodiment)
The link creation support 10 according to the first embodiment of the present invention will be described below. The link creation support 10 is an apparatus that supports content creation, and presents a link (such as a link creation position) that meets the link purpose of the content creator to the creator. The link purpose is the purpose and intent of creating a link when creating a link in the content being created. When creating a link, there are a plurality of link purposes, and an appropriate link destination is different for each link purpose. Therefore, in order to determine (estimate) an appropriate link destination, it is necessary to determine (estimate) an appropriate link purpose.

代表的なリンク目的は次の通りである。
・過去記事参照
作成者自身が過去に作成したコンテンツ(過去記事)であって作成中のコンテンツに関連するコンテンツを参照する目的である。換言すえば、「過去記事参照」をリンク目的とするリンクは、過去記事を参照するためのリンクである。
・キーワード解説
特定のキーワードの意味について解説している辞書サイトなどのコンテンツ(解説コンテンツ)を参照する目的である。換言すえば、「キーワード解説」をリンク目的とするリンクは、解説コンテンツを参照するためのリンクである。
・公式サイト参照
企業やサービスなどの公式サイトを参照する目的である。換言すえば、「公式サイト参照」をリンク目的とするリンクは、公式サイトを参照するためのリンクである。
・情報源ページ参照
作成中のコンテンツの記述内容に関連する情報を詳細に伝えているコンテンツや記述内容の根拠となるコンテンツ(情報源ページ)を参照する目的である。換言すえば、「情報源ページ参照」をリンク目的とするリンクは、情報源ページを参照するためのリンクである。
Typical link objectives are:
-Past article reference The purpose is to refer to content (past article) created by the creator himself in the past and related to the content being created. In other words, a link whose purpose is “reference past article” is a link for referring to a past article.
・ Keyword explanation The purpose is to refer to contents (explanatory contents) such as dictionary sites that explain the meaning of specific keywords. In other words, a link whose purpose is “keyword commentary” is a link for referring to commentary content.
・ Official website reference The purpose is to refer to official websites of companies and services. In other words, a link whose purpose is “reference official site” is a link for referring to the official site.
-Reference to information source page This is for the purpose of referring to the content (information source page) that provides detailed information related to the description content of the content being created and the basis of the description content. In other words, the link for the purpose of “information source page reference” is a link for referring to the information source page.

以下、リンク作成支援10について図面を参照して説明する。リンク作成支援10は、図1に示すように、入出力部100、基準単語抽出部110、リンク設定範囲候補抽出部120、リンク先候補検索部130、第1決定部140、第2決定部150、予測モデル生成部160、単語スコア算出部180、単語DB190、過去記事DB191、外部取得コンテンツDB192および予測モデルDB193を備える。   Hereinafter, the link creation support 10 will be described with reference to the drawings. As shown in FIG. 1, the link creation support 10 includes an input / output unit 100, a reference word extraction unit 110, a link setting range candidate extraction unit 120, a link destination candidate search unit 130, a first determination unit 140, and a second determination unit 150. , A prediction model generation unit 160, a word score calculation unit 180, a word DB 190, a past article DB 191, an externally acquired content DB 192, and a prediction model DB 193.

入出力部100は、作成中のコンテンツ(作成後に修正するコンテンツも含む)を取得する。入出力部100は、作成中のコンテンツを基準単語抽出部110に供給する。入出力部100は、作成後のコンテンツを過去記事DB191に供給する。また、作成者に対する種々のメッセージを出力する。   The input / output unit 100 acquires content that is being created (including content that is modified after creation). The input / output unit 100 supplies the content being created to the reference word extraction unit 110. The input / output unit 100 supplies the created content to the past article DB 191. It also outputs various messages to the creator.

基準単語抽出部110は、入出力部100から、作成中のコンテンツを取得する。基準単語抽出部110は、作成中のコンテンツを取得した場合、作成中のコンテンツ内から、アンカーテキストとしてリンク先を設定するべきリンク設定範囲の候補となるリンク設定範囲候補を抽出するときに基準となる基準単語(特徴的な単語)を抽出する。具体的には、基準単語抽出部110は、一の単語が当該単語を含むコンテンツ内においてリンク設定範囲となる頻度(アンカーテキストへの含まれやすさ)を示す単語スコアに基づいて、基準単語を抽出する。   The reference word extraction unit 110 acquires the content being created from the input / output unit 100. When the reference word extraction unit 110 acquires the content being created, the reference word extraction unit 110 extracts the link setting range candidate as a link setting range candidate for which a link destination should be set as anchor text from the content being created. A reference word (characteristic word) is extracted. Specifically, the reference word extraction unit 110 calculates a reference word based on a word score that indicates the frequency (easy to be included in an anchor text) of a single word that is within a link setting range in the content including the word. Extract.

以下、詳細に説明する。まず、基準単語抽出部110は、作成中のコンテンツ内から、形態素解析によって単語を抽出する。基準単語抽出部110が抽出する単語は、名詞、動詞であって、助詞、助動詞などの機能語は抽出しない。   This will be described in detail below. First, the reference word extraction unit 110 extracts words from the content being created by morphological analysis. The words extracted by the reference word extraction unit 110 are nouns and verbs, and function words such as particles and auxiliary verbs are not extracted.

続いて、基準単語抽出部110は、単語DB190を参照し、作成中のコンテンツ内から抽出した単語(名詞、動詞)に単語スコアを付与する。なお、単語DB190には、単語スコア算出部180によって算出された単語スコアが記憶されている。なお、単語スコア算出部180は、既存のコンテンツおよびアンカーテキストを解析し、各単語の単語スコアを算出するが、単語スコアの算出については後述する。   Subsequently, the reference word extraction unit 110 refers to the word DB 190 and assigns a word score to words (nouns and verbs) extracted from the content being created. Note that the word score calculated by the word score calculation unit 180 is stored in the word DB 190. Note that the word score calculation unit 180 analyzes existing content and anchor text and calculates a word score for each word, which will be described later.

続いて、基準単語抽出部110は、単語スコアが第1の閾値以上である単語または第2の閾値以下である単語を更に抽出(基準単語として抽出)する。なお、基準単語抽出部110は、単語スコアが第1の閾値以上である単語または第2の閾値以下である単語が0個の場合には、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を入出力部100に通知してもよい。なお、当該通知を取得した入出力部100は、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を示すメッセージを出力する。   Subsequently, the reference word extraction unit 110 further extracts (extracts as a reference word) a word whose word score is greater than or equal to the first threshold or a word that is less than or equal to the second threshold. Note that the reference word extraction unit 110, when the number of words whose word score is equal to or higher than the first threshold value or 0 words equal to or lower than the second threshold value is 0, there is a portion suitable for link creation in the content being created. You may notify the input / output part 100 of not doing. The input / output unit 100 that has acquired the notification outputs a message indicating that there is no appropriate location for creating a link in the content being created.

続いて、基準単語抽出部110は、単語スコアが第1の閾値以上である単語または第2の閾値以下である単語に対し、単語DB190に格納されている専門用語辞書や百科事典への登録状況およびアンカーテキストの直前や直後に出現する頻度に基づいて、「アンカー単語」「アンカー付属単語」または「アンカー隣接単語」の何れかを示すラベルを付与する。例えば、基準単語抽出部110は、単語スコアが第1の閾値以上であって専門用語辞書に登録されている一般的な単語に相当しない単語には「アンカー中心単語」を示すラベルを付与し、単語スコアが第1の閾値以上であって専門用語辞書に登録されていない一般的な単語に相当する単語には、「アンカー付属単語」を示すラベルを付与する。また、単語スコアが第2の閾値以下であって単語DB190に格納されているアンカーテキストの直前や直後に出現する割合が第3の閾値以上である単語には「アンカー隣接単語」を示すラベルを付与する。   Subsequently, the reference word extraction unit 110 registers the word score in the technical term dictionary or encyclopedia stored in the word DB 190 with respect to a word having a word score equal to or higher than the first threshold or a word equal to or lower than the second threshold. A label indicating any one of “anchor word”, “anchor attached word”, and “anchor adjacent word” is given based on the frequency of occurrence immediately before and after the anchor text. For example, the reference word extraction unit 110 assigns a label indicating “anchor center word” to a word whose word score is equal to or higher than a first threshold and does not correspond to a general word registered in the technical term dictionary, A word indicating an “anchor attached word” is assigned to a word corresponding to a general word whose word score is equal to or higher than the first threshold and is not registered in the technical term dictionary. Further, a label indicating “anchor adjacent word” is given to a word whose word score is equal to or less than the second threshold and the ratio of occurrence before or after the anchor text stored in the word DB 190 is equal to or more than the third threshold. Give.

なお、アンカー中心単語とは、アンカーテキストに含まれやすく、かつ、アンカーテキストが示す内容の中心事項となりやすい単語である。アンカー中心単語は、単独でアンカーテキストを構成することができる。アンカー中心単語の一例は、企業名、地名、人名などである。アンカー付属単語とは、アンカーテキストに含まれやすく、かつ、一般的な単語である。アンカー付属単語は、単独ではアンカーテキストを構成することができない。アンカー付属単語の一例は、「記事」「発表」などである。アンカー隣接単語とは、アンカーテキストには含まれにくく、かつ、アンカーテキストの直前や直後に出現しやすい単語である。アンカー隣接単語の一例は、「による」の「よる」や「を読んだ」の「読む」といった動詞であり、リンク先の内容をアンカーテキストに明示した後に続く単語である。   The anchor center word is a word that is easily included in the anchor text and is likely to be a central matter of the content indicated by the anchor text. An anchor center word can constitute anchor text by itself. An example of the anchor center word is a company name, a place name, a person name, or the like. The anchor attached word is a general word that is easily included in the anchor text. An anchor attached word cannot constitute anchor text by itself. Examples of anchor attached words are “article” and “announcement”. An anchor adjacent word is a word that is unlikely to be included in anchor text and is likely to appear immediately before or after the anchor text. An example of an anchor adjacent word is a verb such as “by” of “by” or “read” of “read”, and is a word following the contents of the link destination in the anchor text.

最後に、基準単語抽出部110は、入出力部100から取得した作成中のコンテンツとともに、基準単語(ラベル付)をリンク設定範囲候補抽出部120に供給する。なお、基準単語抽出部110は、作成中のコンテンツおよび基準単語(ラベル付)に加え、各基準単語の単語スコアをリンク設定範囲候補抽出部120に供給してもよい。   Finally, the reference word extraction unit 110 supplies the reference word (with label) to the link setting range candidate extraction unit 120 together with the content being created acquired from the input / output unit 100. The reference word extraction unit 110 may supply the word score of each reference word to the link setting range candidate extraction unit 120 in addition to the content being created and the reference word (with label).

単語スコアの算出について説明する。なお、過去記事DB191には、入出力部100から取得したコンテンツ(過去記事)が格納され、外部取得コンテンツDB192には、ウェブクローリング(web crawling)により収集(取得)された外部のコンテンツが格納されている。単語スコア算出部180は、過去記事DB191および外部取得コンテンツDB192を参照し、ある単語を含むウェブページ、アンカーテキストに出現する単語、ある単語がアンカーテキストに含まれる割合、ある単語のアンカーテキスト内およびアンカーテキスト外の出現位置などの統計情報を解析し、単語スコアを算出する。   The calculation of the word score will be described. The past article DB 191 stores content (past articles) acquired from the input / output unit 100, and the externally acquired content DB 192 stores external contents collected (acquired) by web crawling. ing. The word score calculation unit 180 refers to the past article DB 191 and the externally acquired content DB 192, and includes a web page including a certain word, a word appearing in the anchor text, a ratio of a certain word included in the anchor text, Statistical information such as the appearance position outside the anchor text is analyzed, and a word score is calculated.

具体的には、例えば、単語スコア算出部180は、図2に示すように、外部取得コンテンツDB192内の既存のコンテンツの集合および過去記事DB191内の過去記事の集合から、ある単語が出現するコンテンツ数をX、X中で当該単語をアンカーテキスト中に含むコンテンツ数をYとしたとき、Y/Xを当該単語の単語スコアとして算出する。   Specifically, for example, as shown in FIG. 2, the word score calculation unit 180 is a content in which a word appears from a set of existing contents in the externally acquired content DB 192 and a set of past articles in the past article DB 191. When the number is X and the number of contents including the word in the anchor text is X, Y / X is calculated as the word score of the word.

図2の例では、単語毎に、コンテンツ数X、コンテンツ数Y、単語スコアX/Yを算出しているが、精度向上のため、単語の属性(例えば、地名、人名)を考慮して、コンテンツ数X、コンテンツ数Y、単語スコアX/Yを算出してもよい。即ち、例えば、単語を構成する文字列と単語の属性の組毎に単語スコアを付与してもよい(例えば、「山口」−「地名」と「山口」−「人名」とで異なる単語スコアを付与する)。また、自分が作成したコンテンツ(過去記事)内におけるアンカーテキストである場合は、他人が作成したコンテンツ内におけるアンカーテキストである場合に比べ、高いスコアを付与してもよい。   In the example of FIG. 2, the number of contents X, the number of contents Y, and the word score X / Y are calculated for each word. However, in order to improve accuracy, the attribute of the word (for example, place name, person name) is considered, The number of contents X, the number of contents Y, and the word score X / Y may be calculated. That is, for example, a word score may be assigned to each set of character strings and word attributes constituting a word (for example, different word scores for “Yamaguchi”-“place name” and “Yamaguchi”-“person name”). Give). Further, when the anchor text is in the content (past article) created by the user, a higher score may be given compared to the anchor text in the content created by another person.

リンク設定範囲候補抽出部120は、基準単語抽出部110から、作成中のコンテンツとともに、基準単語(ラベル付)を取得する。作成中のコンテンツとともに基準単語を取得したリンク設定範囲候補抽出部120は、作成中のコンテンツ内から、基準単語を基準にして、リンク目的の候補となるリンク目的候補毎に、1以上のリンク設定範囲候補を抽出する。リンク設定範囲候補抽出部120は、リンク目的候補に応じて異なる単語数のリンク設定範囲候補を抽出してもよい。なお、リンク設定範囲候補抽出部120は、作成中のコンテンツおよび基準単語に加え、各基準単語の単語スコアを基準単語抽出部110から取得した場合には、単語スコアに応じて、または、リンク目的候補および単語スコアに応じて、異なる単語数のリンク設定範囲候補を抽出してもよい。   The link setting range candidate extraction unit 120 acquires a reference word (with a label) from the reference word extraction unit 110 together with the content being created. The link setting range candidate extraction unit 120 that has acquired the reference word together with the content being created, sets one or more link settings for each link purpose candidate that is a candidate for the link purpose based on the reference word from the content being created. Extract range candidates. The link setting range candidate extraction unit 120 may extract link setting range candidates having different numbers of words according to the link purpose candidates. Note that the link setting range candidate extraction unit 120, in addition to the content being created and the reference word, when acquiring the word score of each reference word from the reference word extraction unit 110, depending on the word score or the purpose of the link Depending on the candidates and the word score, link setting range candidates having different numbers of words may be extracted.

リンク設定範囲候補抽出部120は、リンク目的候補毎にリンク設定範囲候補を抽出した場合、リンク目的候補毎のリンク設定範囲候補をリンク先候補検索部130に供給する。換言すれば、リンク設定範囲候補抽出部120は、リンク目的候補−リンク設定範囲候補の組をリンク先候補検索部130に供給する。   When the link setting range candidate extraction unit 120 extracts the link setting range candidate for each link purpose candidate, the link setting range candidate extraction unit 120 supplies the link setting range candidate for each link purpose candidate to the link destination candidate search unit 130. In other words, the link setting range candidate extraction unit 120 supplies the link destination candidate-link setting range candidate pair to the link destination candidate search unit 130.

以下、リンク設定範囲候補の抽出について詳細に説明する。リンク設定範囲候補抽出部120は、基準単語抽出部110において抽出された各ラベルの基準単語に基づき、作成中のコンテンツ内の基準単語(アンカー中心単語、アンカー付属単語、アンカー隣接単語)を基準に、単語を漸次追加(追加制限数nを設定する)し、作成中のコンテンツ上での範囲を漸次拡張し、リンク目的候補毎に、当該作成中のコンテンツから、複数のリンク設定範囲候補(リンク設定範囲候補のパターン)を抽出する。換言すれば、リンク設定範囲候補抽出部120は、図3に示すように、例えば、基準単語W1について、リンク目的候補毎にリンク設定範囲候補のパターンを抽出し、リンク目的候補−リンク設定範囲候補の組を格納するリストLW1を生成する。リンク設定範囲候補抽出部120は、作成中のコンテンツ全体の全基準単語に対し同様の処理を行い、リンク目的候補−リンク設定範囲候補の組を格納したリストL=[LW1、LW2、…]を生成する。換言すれば、リンク設定範囲候補抽出部120は、基準単語Wkを基準とした場合、全リンク目的分のリンク設定範囲候補のパターンを抽出する。   Hereinafter, extraction of a link setting range candidate will be described in detail. The link setting range candidate extraction unit 120 is based on the reference word (anchor center word, anchor attached word, anchor adjacent word) in the content being created based on the reference word of each label extracted by the reference word extraction unit 110. , Gradually adding words (setting the additional limit number n), gradually expanding the range on the content being created, and for each link purpose candidate, a plurality of link setting range candidates (links) from the content being created The setting range candidate pattern) is extracted. In other words, as illustrated in FIG. 3, the link setting range candidate extraction unit 120 extracts, for example, a link setting range candidate pattern for each link purpose candidate for the reference word W1, and the link purpose candidate-link setting range candidate. A list LW1 that stores a set of The link setting range candidate extraction unit 120 performs the same process on all reference words of the entire content being created, and creates a list L = [LW1, LW2,... Generate. In other words, the link setting range candidate extraction unit 120 extracts link setting range candidate patterns for all link purposes when the reference word Wk is used as a reference.

なお、上記追加制限数nは、リンク目的に応じて異なる値を設定する。リンク目的「キーワード解説」、リンク目的「公式サイト参照」の場合のアンカーテキスト中の単語数は短く、リンク目的「情報源ページ参照」、リンク目的「過去記事参照」の場合のアンカーテキスト中の単語数は長いなどリンク目的とアンカーテキスト中の単語数には相関があるためである。図3に示す例においては、リンク目的「キーワード解説」の場合には、前後1語を追加制限数(追加制限数n=1)とし、リンク目的「情報源ページ参照」の場合には、前後3語を追加制限数(追加制限数n=3)としている。また、単語スコアに応じて異なる値を設定してもよい。但し、追加制限数nにかかわらず、拡張範囲は、当該基準単語の属する一文(句点区切り)の範囲内までとする(同一文内を限度として拡張するものとする)。   The additional limit number n is set to a different value depending on the link purpose. The number of words in the anchor text for the link purpose “keyword explanation” and the link purpose “refer to the official website” is short, and the word in the anchor text for the link purpose “reference source page” and the link purpose “reference past article” This is because there is a correlation between the purpose of the link and the number of words in the anchor text, such as a long number. In the example shown in FIG. 3, in the case of the link purpose “keyword explanation”, the one word before and after is set as an additional limit number (additional limit number n = 1), and in the case of the link purpose “reference information source page”, before and after. Three words are set as the additional limit number (additional limit number n = 3). Different values may be set according to the word score. However, regardless of the additional limit number n, the extended range is limited to the range of one sentence (punctuation break) to which the reference word belongs (the same sentence is extended as a limit).

なお、リンク設定範囲候補抽出部120は、基準単語がアンカー中心単語、アンカー付属単語、アンカー隣接単語であるかを考慮して、リンク設定範囲候補のパターンを抽出してもよい。例えば、リンク設定範囲候補抽出部120は、一の文がアンカー中心単語である基準単語を含む場合、当該文においてアンカー中心単語である基準単語を基準(当該アンカー中心単語を基点(軸))としてリンク設定範囲候補のパターンを抽出する。リンク設定範囲候補抽出部120は、一の文がアンカー中心単語である基準単語を含まずアンカー付属単語である基準単語を含む場合、当該文においてアンカー付属単語を基準(当該アンカー付属単語を基点)としてリンク設定範囲候補のパターンを抽出する。また、リンク設定範囲候補抽出部120は、一の文がアンカー中心単語である基準単語およびアンカー付属単語である基準単語を含まずアンカー隣接単語である基準単語を含む場合、当該文においてアンカー隣接単語を基準(当該アンカー隣接単語の直前または直後の単語を基点)としてリンク設定範囲候補のパターンを抽出する。なお、リンク設定範囲候補抽出部120は、基準単語を含まない場合、当該文からはリンク設定範囲候補のパターンを抽出しない。   The link setting range candidate extraction unit 120 may extract a link setting range candidate pattern in consideration of whether the reference word is an anchor center word, an anchor attached word, or an anchor adjacent word. For example, when one sentence includes a reference word that is an anchor center word, the link setting range candidate extraction unit 120 uses the reference word that is the anchor center word in the sentence as a reference (the anchor center word as a base point (axis)). Extract link setting range candidate patterns. The link setting range candidate extraction unit 120, when one sentence does not include a reference word that is an anchor central word but includes a reference word that is an anchor attached word, uses the anchor attached word in the sentence as a reference (based on the anchor attached word). As a result, a link setting range candidate pattern is extracted. The link setting range candidate extraction unit 120, when one sentence includes a reference word that is an anchor center word and a reference word that is an anchor attached word and does not include an anchor adjacent word, includes an anchor adjacent word in the sentence. Is used as a reference (the word immediately before or immediately after the anchor adjacent word as a base point) to extract a link setting range candidate pattern. Note that the link setting range candidate extraction unit 120 does not extract a link setting range candidate pattern from the sentence when it does not include a reference word.

以下、図4のフローチャートを用いて、リンク設定範囲候補抽出部120による上記動作を説明する。図4において、リンク設定範囲候補抽出部120は、作成中のコンテンツを構成する文のインデックスiを初期化する(ステップS201)。リンク設定範囲候補抽出部120は、作成中のコンテンツからi番目の文を抽出する(ステップS202)。リンク設定範囲候補抽出部120は、i番目の文にアンカー中心単語である基準単語が含まれているか否かを判断する(ステップS203)。リンク設定範囲候補抽出部120は、i番目の文にアンカー中心単語である基準単語が含まれていると判断した場合(ステップS203:Yes)、アンカー中心単語である基準単語を基準にして、上述の如く、リンク設定範囲候補のパターンを抽出する(ステップS210)。   Hereinafter, the operation by the link setting range candidate extraction unit 120 will be described with reference to the flowchart of FIG. In FIG. 4, the link setting range candidate extraction unit 120 initializes an index i of a sentence that constitutes the content being created (step S201). The link setting range candidate extraction unit 120 extracts the i-th sentence from the content being created (step S202). The link setting range candidate extraction unit 120 determines whether or not a reference word that is an anchor center word is included in the i-th sentence (step S203). If the link setting range candidate extraction unit 120 determines that the reference word that is the anchor center word is included in the i-th sentence (step S203: Yes), the link setting range candidate extraction unit 120 uses the reference word that is the anchor center word as a reference. As described above, a link setting range candidate pattern is extracted (step S210).

即ち、リンク設定範囲候補抽出部120は、i番目の文がアンカー中心単語である基準単語Waを含む場合には、基準単語Waを基点としたリンク目的−リンク設定範囲候補を格納するリストLWaを生成する。より詳細には、まず、リンク設定範囲候補抽出部120は、あるリンク目的−基準単語Waを格納するLWaを生成する。次に、リンク設定範囲候補抽出部120は、単語追加数sを1とし、s+1個の単語から構成されるリンク設定範囲候補のうち、t番目の単語が基準単語Waであるリンク設定範囲候補をLWaに追加(処理1)する。リンク設定範囲候補抽出部120は、上記処理1を1以上(s+1)以下のtについて繰り返し実行(処理2)する。更に、リンク設定範囲候補抽出部120は、上記処理2を1以上n(追加制限数)以下のsについて繰り返し実行する(ステップS210)。   That is, when the i-th sentence includes the reference word Wa that is the anchor center word, the link setting range candidate extraction unit 120 generates a list LWa that stores link purpose-link setting range candidates based on the reference word Wa. Generate. More specifically, first, the link setting range candidate extraction unit 120 generates an LWa that stores a certain link purpose-reference word Wa. Next, the link setting range candidate extraction unit 120 sets the word addition count s to 1, and among the link setting range candidates composed of s + 1 words, selects the link setting range candidate whose t-th word is the reference word Wa. Add to LWa (Process 1). The link setting range candidate extraction unit 120 repeatedly executes the process 1 for t of 1 or more (s + 1) or less (process 2). Further, the link setting range candidate extraction unit 120 repeatedly executes the process 2 for s that is 1 or more and n (additional limit number) or less (step S210).

一方、リンク設定範囲候補抽出部120は、i番目の文にアンカー中心単語である基準単語が含まれていないと判断した場合(ステップS203:No)、i番目の文にアンカー付属単語である基準単語が含まれているか否かを判断する(ステップS204)。リンク設定範囲候補抽出部120は、i番目の文にアンカー付属単語である基準単語が含まれていると判断した場合(ステップS204:Yes)、アンカー付属単語である基準単語を基準にして、上述の如く、リンク設定範囲候補のパターンを抽出する(ステップS220)。   On the other hand, when the link setting range candidate extraction unit 120 determines that the reference word that is the anchor central word is not included in the i-th sentence (step S203: No), the reference that is the anchor-attached word in the i-th sentence. It is determined whether or not a word is included (step S204). When the link setting range candidate extraction unit 120 determines that the reference word that is an anchor attached word is included in the i-th sentence (step S204: Yes), the link setting range candidate extraction unit 120 uses the reference word that is an anchor attached word as a reference. As described above, a link setting range candidate pattern is extracted (step S220).

即ち、リンク設定範囲候補抽出部120は、i番目の文がアンカー中心単語である基準単語を含まずアンカー付属単語である基準単語Wbを含む場合には、基準単語Wbを基点としたリンク目的−リンク設定範囲候補を格納するリストLWbを生成する。より詳細には、まず、リンク設定範囲候補抽出部120は、単語追加数sを1とし、s+1個の単語から構成されるリンク設定範囲候補のうち、t番目の単語が基準単語Wbであるリンク設定範囲候補をLWbに追加(処理1)する。リンク設定範囲候補抽出部120は、上記処理1を1以上(s+1)以下のtについて繰り返し実行(処理2)する。なお、LWbは、例えば、上記処理1の1回目の実行時に生成する。更に、リンク設定範囲候補抽出部120は、上記処理2を1以上n(追加制限数)以下のsについて繰り返し実行する(ステップS220)。   That is, the link setting range candidate extraction unit 120, when the i-th sentence does not include the reference word that is the anchor center word but includes the reference word Wb that is the anchor attached word, the link purpose based on the reference word Wb − A list LWb that stores link setting range candidates is generated. More specifically, first, the link setting range candidate extraction unit 120 sets the word addition number s to 1, and among the link setting range candidates composed of s + 1 words, the link whose t-th word is the reference word Wb. A setting range candidate is added to LWb (processing 1). The link setting range candidate extraction unit 120 repeatedly executes the process 1 for t of 1 or more (s + 1) or less (process 2). Note that LWb is generated, for example, when the process 1 is executed for the first time. Furthermore, the link setting range candidate extraction unit 120 repeatedly executes the process 2 for s that is 1 or more and n (additional limit number) or less (step S220).

一方、リンク設定範囲候補抽出部120は、i番目の文にアンカー付属単語である基準単語が含まれていないと判断した場合(ステップS204:No)、i番目の文にアンカー隣接単語である基準単語が含まれているか否かを判断する(ステップS205)。リンク設定範囲候補抽出部120は、i番目の文にアンカー隣接単語である基準単語が含まれていると判断した場合(ステップS205:Yes)、アンカー隣接単語である基準単語を基準にして、上述の如く、リンク設定範囲候補のパターンを抽出する(ステップS230)。   On the other hand, when the link setting range candidate extraction unit 120 determines that the reference word that is an anchor-attached word is not included in the i-th sentence (step S204: No), the reference that is the anchor adjacent word in the i-th sentence. It is determined whether or not a word is included (step S205). When the link setting range candidate extraction unit 120 determines that the reference word that is the anchor adjacent word is included in the i-th sentence (step S205: Yes), the link setting range candidate extraction unit 120 described above based on the reference word that is the anchor adjacent word. As described above, a link setting range candidate pattern is extracted (step S230).

即ち、リンク設定範囲候補抽出部120は、i番目の文がアンカー中心単語である基準単語およびアンカー付属単語である基準単語を含まずアンカー隣接単語である基準単語Wcを含む場合には、基準単語Wcの直前または直後の単語を基点としたリンク目的−リンク設定範囲候補を格納するリストLWcを生成する。より詳細には、まず、リンク設定範囲候補抽出部120は、単語追加数sを0とし、s+1個の単語から構成されるリンク設定範囲候補のうち、s+1番目の単語が基準単語Wcの1個前またはs+1個後の単語であるリンク設定範囲候補をLWcに追加(処理1)する。リンク設定範囲候補抽出部120は、上記処理1を0以上n(追加制限数)以下のsについて繰り返し実行する(ステップS230)。なお、LWcは、例えば、上記処理1の1回目の実行時に生成する。   That is, the link setting range candidate extraction unit 120, when the i-th sentence does not include the reference word that is the anchor central word and the reference word that is the anchor attached word but includes the reference word Wc that is the anchor adjacent word, the reference word A list LWc that stores link purpose-link setting range candidates based on the word immediately before or immediately after Wc is generated. More specifically, first, the link setting range candidate extraction unit 120 sets the word addition number s to 0, and among the link setting range candidates composed of s + 1 words, the s + 1st word is one of the reference words Wc. The link setting range candidate that is the previous or s + 1 subsequent word is added to the LWc (processing 1). The link setting range candidate extraction unit 120 repeatedly executes the process 1 for s not less than 0 and not more than n (additional limit number) (step S230). Note that the LWc is generated, for example, when the process 1 is executed for the first time.

リンク設定範囲候補抽出部120は、アンカー中心単語である基準単語を基準にしてリンク設定範囲候補のパターンを抽出した場合(ステップS210)、アンカー付属単語である基準単語を基準にしてリンク設定範囲候補のパターンを抽出した場合(ステップS220)、アンカー隣接単語である基準単語を基準にしてリンク設定範囲候補のパターンを抽出した場合(ステップS230)、または、i番目の文にアンカー隣接単語である基準単語が含まれていないと判断した場合(ステップS205:No)、インデックスiをカウントアップする(ステップS206)。続いて、リンク設定範囲候補抽出部120は、作成中のコンテンツにインデックスiの文が存在するか否かを判断する(ステップS207)。リンク設定範囲候補抽出部120は、インデックスiの文が存在すると判断した場合(ステップS207:Yes)、ステップS202に戻って次の一文を抽出する。一方、リンク設定範囲候補抽出部120は、インデックスiの文が存在しないと判断した場合(ステップS207:No)、少なくとも1つのリンク設定範囲候補を抽出したか否かを判断する(ステップS208)。   When the link setting range candidate extraction unit 120 extracts the link setting range candidate pattern based on the reference word that is the anchor center word (step S210), the link setting range candidate extraction unit 120 uses the reference word that is the anchor attached word as a reference. When the pattern is extracted (step S220), when the link setting range candidate pattern is extracted based on the reference word that is the anchor adjacent word (step S230), or the reference that is the anchor adjacent word in the i-th sentence When it is determined that the word is not included (step S205: No), the index i is counted up (step S206). Subsequently, the link setting range candidate extraction unit 120 determines whether there is a sentence with index i in the content being created (step S207). If the link setting range candidate extraction unit 120 determines that a sentence with index i exists (step S207: Yes), the link setting range candidate extraction unit 120 returns to step S202 and extracts the next sentence. On the other hand, if the link setting range candidate extraction unit 120 determines that the sentence with the index i does not exist (step S207: No), the link setting range candidate extraction unit 120 determines whether at least one link setting range candidate has been extracted (step S208).

リンク設定範囲候補抽出部120は、少なくとも1つのリンク設定範囲候補を抽出したと判断した場合(ステップS208:Yes)、本フローチャートは終了する。一方、リンク設定範囲候補抽出部120は、リンク設定範囲候補を1つも抽出していないと判断した場合(ステップS208:No)、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を入出力部100に通知し、当該通知を取得した入出力部100は、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を示すメッセージ(例えば、「抽出数0」)出力する(ステップS209)。そして本フローチャートは終了する。   When the link setting range candidate extraction unit 120 determines that at least one link setting range candidate has been extracted (step S208: Yes), this flowchart ends. On the other hand, if the link setting range candidate extraction unit 120 determines that no link setting range candidates have been extracted (step S208: No), the link setting range candidate extraction unit 120 enters that the content being created does not have an appropriate location for link creation. The input / output unit 100 that has notified the output unit 100 and acquired the notification outputs a message (for example, “extraction number 0”) indicating that there is no appropriate location for link creation in the content being created (step S209). ). And this flowchart is complete | finished.

リンク先候補検索部130は、リンク設定範囲候補抽出部120から、リンク目的候補毎のリンク設定範囲候補を取得する。リンク目的候補毎のリンク設定範囲候補を取得したリンク先候補検索部130は、リンク目的候補とリンク設定範囲候補とに応じた検索方法を用いて、図5に示すように、リンク目的候補とリンク設定範囲候補の組毎に、リンク先の候補となるリンク先候補を検索する。例えば、図5に示す例において、リンク先候補検索部130は、リンク目的候補「キーワード解説」とリンク設定範囲候補「A」の組について、リンク先候補「K1」「K2」…「K5」を検索している。   The link candidate search unit 130 acquires a link setting range candidate for each link purpose candidate from the link setting range candidate extraction unit 120. The link destination candidate search unit 130 that has acquired the link setting range candidate for each link purpose candidate uses a search method according to the link purpose candidate and the link setting range candidate, as shown in FIG. For each set of setting range candidates, a link destination candidate that is a link destination candidate is searched. For example, in the example illustrated in FIG. 5, the link destination candidate search unit 130 sets link destination candidates “K1”, “K2”,..., “K5” for the set of the link purpose candidate “keyword commentary” and the link setting range candidate “A”. Searching.

リンク目的候補とリンク設定範囲候補とに応じた検索方法とは、リンク先候補の検索に際し、リンク目的候補とリンク設定範囲候補とに応じて異なる検索条件(検索文字列)を用いることである。即ち、リンク先候補検索部130は、リンク目的候補とリンク設定範囲候補の組毎に異なる検索条件を生成し、外部のインターネットの汎用検索APIを利用してリンク先候補(リンク先候補であるコンテンツ)を検索する。   The search method according to the link purpose candidate and the link setting range candidate is to use different search conditions (search character strings) according to the link purpose candidate and the link setting range candidate when searching for the link destination candidate. That is, the link destination candidate search unit 130 generates different search conditions for each set of link purpose candidates and link setting range candidates, and uses link search candidates (contents that are link destination candidates) using a general-purpose search API of the external Internet. )

例えば、リンク先候補検索部130は、リンク目的候補が「キーワード解説」、リンク設定範囲候補が「タイヤ交換」である場合には、「タイヤ交換とは」というような検索文字列を生成し、当該検索文字列の集合(検索文字列全体)を含むコンテンツを検索する。   For example, when the link destination candidate is “keyword commentary” and the link setting range candidate is “tire replacement”, the link destination candidate search unit 130 generates a search character string such as “What is tire replacement”, The contents including the set of search character strings (entire search character string) are searched.

例えば、リンク先候補検索部130は、リンク目的候補が「公式サイト参照」である場合には、リンク設定範囲候補を検索文字列とし、当該検索文字列を含むコンテンツを検索する。   For example, when the link destination candidate is “reference to official site”, the link destination candidate search unit 130 searches the content including the search character string using the link setting range candidate as the search character string.

例えば、リンク先候補検索部130は、リンク目的候補が「情報源ページ参照」である場合には、例えば、文章中の特徴的な単語や重要とみなされる単語を抽出するアルゴリズムであるTF−IDF(Term Frequency −Inverse Document Frequency)を使用して各単語の重要度を算出し、各単語が含まれる例えば、リンク設定範囲候補の範囲内であるか、リンク設定範囲候補の前後の所定長の文字列の範囲内であるか、その他の作成中のコンテンツ全体内であるかの場所に対応して予め定められた優先順位に基づいて検索に用いる単語(検索文字列)を選択し、当該単語を少なくとも1つ含むコンテンツを検索する。   For example, when the link destination candidate is “reference to the information source page”, the link candidate search unit 130 TF-IDF, which is an algorithm that extracts, for example, characteristic words or important words in sentences. (Term Frequency-Inverse Document Frequency) is used to calculate the importance of each word, and each word is included, for example, within the range of a link setting range candidate or a predetermined length character before and after the link setting range candidate Select a word (search string) to be used for the search based on a predetermined priority order corresponding to the location within the range of the column or the entire content being created. Search for content that includes at least one.

例えば、リンク先候補検索部130は、リンク目的候補が「過去記事参照」である場合には、例えば、過去記事DB191を指定して、リンク目的候補が「情報源ページ参照」である場合と同様にコンテンツを検索する。なお、リンク設定範囲候補または作成中のコンテンツに時間や時期を示す単語(例えば、「昨夜」「昨日」「前回」)が含まれる場合には、上記時間を用いて対象を絞り込んでもよい。   For example, when the link destination candidate is “reference past article”, for example, the link destination candidate search unit 130 designates the past article DB 191 and is similar to the case where the link purpose candidate is “reference information source page”. Search for content. If the link setting range candidate or the content being created includes a word indicating time or time (for example, “last night”, “yesterday”, “last time”), the target may be narrowed down using the above time.

リンク先候補検索部130は、リンク目的候補とリンク設定範囲候補の組毎にリンク先候補を検索した場合、リンク目的候補とリンク設定範囲候補とに対応付けて、リンク先候補を特定する情報(例えば、URL)を第1決定部140に供給する。換言すれば、リンク先候補検索部130は、リンク目的候補とリンク設定範囲候補とリンク先候補の組を第1決定部140に供給する。   When the link destination candidate searching unit 130 searches for a link destination candidate for each set of link purpose candidates and link setting range candidates, the link destination candidate searching unit 130 associates the link destination candidates with the link setting range candidates and specifies link destination candidates ( For example, URL) is supplied to the first determination unit 140. In other words, the link destination candidate search unit 130 supplies a set of link purpose candidates, link setting range candidates, and link destination candidates to the first determination unit 140.

なお、リンク先候補検索部130は、予め定められた件数以上のリンク先候補を検索できなかった場合には、検索条件を変更して予め定められた件数以上のリンク先候補を検索するようにしてもよい。   If the link destination candidate search unit 130 cannot search for more than a predetermined number of link destination candidates, the link destination candidate search unit 130 changes the search condition to search for a predetermined number of link destination candidates. May be.

第1決定部140は、リンク先候補検索部130から、リンク目的候補とリンク設定範囲候補とに対応付けて、リンク先候補を特定する情報(例えば、URL)を取得する。換言すれば、第1決定部140は、リンク目的候補とリンク設定範囲候補とリンク先候補の組を取得する。リンク目的候補とリンク設定範囲候補とリンク先候補の組を取得した第1決定部140は、リンク目的候補とリンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第1の評価値を算出し、第1の評価値をリンク目的候補別に集計し、集計後の第1の評価値に基づいてリンク目的候補からリンク目的を決定(採用)する。具体的には、第1決定部140は、一のリンク先を設定するべき一のリンク設定範囲の候補となるリンク設定範囲候補の群毎に、リンク目的候補からリンク目的を決定する。換言すれば、第1決定部140は、リンク設定範囲候補抽出時に基準となった基準単語毎にリンク目的を決定する(1つのリンク先に対し1つのリンク目的を決定する)。なお、第1の評価値に係る具体例は後述する。   The first determination unit 140 acquires information (for example, URL) for specifying the link destination candidate in association with the link purpose candidate and the link setting range candidate from the link destination candidate search unit 130. In other words, the first determination unit 140 acquires a set of link purpose candidates, link setting range candidates, and link destination candidates. The 1st determination part 140 which acquired the group of a link purpose candidate, a link setting range candidate, and a link destination candidate is the 1st which shows the suitability as a link destination for every group of a link purpose candidate, a link setting range candidate, and a link destination candidate. The evaluation value is calculated, the first evaluation value is totaled for each link purpose candidate, and the link purpose is determined (adopted) from the link purpose candidates based on the first evaluation value after aggregation. Specifically, the first determination unit 140 determines the link purpose from the link purpose candidates for each group of link setting range candidates that are candidates for one link setting range for which one link destination is to be set. In other words, the first determination unit 140 determines a link purpose for each reference word that is used as a reference when extracting link setting range candidates (determines one link purpose for one link destination). A specific example relating to the first evaluation value will be described later.

第1決定部140は、例えば、集計後の第1の評価値の高い順に上位N個(Nは2以上)のリンク目的候補をリンク目的として決定してもよい。また、第1決定部140は、集計後の第1の評価値が最高のリンク目的候補をリンク目的として決定してもよい。   The first determination unit 140 may determine, for example, the top N link purpose candidates (N is 2 or more) in descending order of the first evaluation value after aggregation as the link purpose. Moreover, the 1st determination part 140 may determine a link objective candidate with the highest 1st evaluation value after totaling as a link objective.

第1決定部140は、リンク目的候補からリンク目的を決定した場合、当該リンク目的と当該リンク目的に対応するリンク設定範囲候補とリンク先候補を特定する情報(例えば、URL)とを第2決定部150に供給する。換言すれば、第1決定部140は、リンク目的とリンク設定範囲候補とリンク先候補の組を第2決定部150に供給する。   When the link purpose is determined from the link purpose candidates, the first determination unit 140 second determines the link purpose, the link setting range candidate corresponding to the link purpose, and information (for example, URL) for specifying the link destination candidate. To the unit 150. In other words, the first determination unit 140 supplies the second determination unit 150 with a set of the link purpose, the link setting range candidate, and the link destination candidate.

つまり、第1決定部140は、作成中のコンテンツ全体の全基準単語を対象とし、リンク目的候補−リンク設定範囲候補の組を格納したリストL=[LW1、LW2、…]について、各基準単語[W1、W2、…]毎にリンク目的を決定し、当該リンク目的−リンク設定範囲候補の組と、当該リンク目的−リンク設定範囲候補の組に対応するリンク先候補を第2決定部150に供給する。例えば、第1決定部140は、基準単語W1に係るリンク目的候補−リンク設定範囲候補の組を格納するリストLW1からリンク目的を決定し、当該リンク目的−リンク設定範囲候補の組と、当該リンク目的−リンク設定範囲候補の組に対応するリンク先候補を第2決定部150に供給する。   That is, the first determination unit 140 targets all reference words of the entire content being created, and uses each reference word for the list L = [LW1, LW2,. The link purpose is determined for each [W1, W2,...], And the link destination-link setting range candidate pair and the link destination candidate corresponding to the link purpose-link setting range candidate pair are given to the second determining unit 150. Supply. For example, the first determination unit 140 determines a link purpose from a list LW1 that stores a link purpose candidate-link setting range candidate set related to the reference word W1, and the link purpose-link setting range candidate set and the link A link destination candidate corresponding to the set of purpose-link setting range candidates is supplied to the second determination unit 150.

以下、第1の評価値について更に説明する。第1決定部140は、多変量解析によって生成された第1の予測モデルを用いて第1の評価値を算出する。第1の予測モデルは、リンク目的(リンク目的候補)に特化(依存)しない予測モデルである。なお、第1の予測モデルについての詳細は後述する。   Hereinafter, the first evaluation value will be further described. The first determination unit 140 calculates a first evaluation value using the first prediction model generated by multivariate analysis. The first prediction model is a prediction model that does not specialize (depend on) the link purpose (link purpose candidate). Details of the first prediction model will be described later.

例えば、基準単語Waを基準として抽出されたリストLWaについて処理を行う場合、まず、第1決定部140は、予測モデルDB193に格納されている第1の予測モデルに、リストLWaの一の組(リンク目的候補−リンク設定範囲候補)と当該組に対応するリンク先候補を入力し、第1の評価値を取得する。例えば、図5に示す例において、第1決定部140は、リンク目的候補「キーワード解説」、リンク設定範囲候補「A」、リンク先候補「K1」のURL「http://www.k1/…」を入力し、第1の評価値「0.65」を取得する。第1決定部140は、リストLWa内の他の全ての組について上記処理を同様に行う。   For example, when processing is performed on the list LW extracted using the reference word Wa as a reference, first, the first determination unit 140 adds a set of lists LW (to the first prediction model stored in the prediction model DB 193 ( (Link target candidate-link setting range candidate) and a link destination candidate corresponding to the set are input, and a first evaluation value is acquired. For example, in the example illustrated in FIG. 5, the first determination unit 140 includes the URL “http: //www.k1/...” Of the link purpose candidate “keyword commentary”, the link setting range candidate “A”, and the link destination candidate “K1”. ”To obtain the first evaluation value“ 0.65 ”. The 1st determination part 140 performs the said process similarly about all the other groups in list | wrist LWa.

次に、第1決定部140は、リンク目的候補毎に第1の評価値の平均値を算出する。例えば、図5に示す例において、第1決定部140は、リンク目的候補「キーワード解説」に係る第1の評価値の平均値「0.43」を算出している。次に、第1決定部140は、例えば、最も高い第1の評価値の平均値であるリンク目的候補をリンク目的として決定する。例えば、図5に示す例において、第1決定部140は、最も高い第1の評価値の平均値「0.62」であるリンク目的候補「公式サイト参照」をリンク目的として決定する。以上のようにして、第1決定部140は、基準単語Wa(リストLWa)に係るリンク目的「公式サイト参照」を決定する。第1決定部140は、他の全てのリストについて上記処理を同様に行う。   Next, the first determination unit 140 calculates an average value of the first evaluation values for each link purpose candidate. For example, in the example illustrated in FIG. 5, the first determination unit 140 calculates the average value “0.43” of the first evaluation values related to the link purpose candidate “keyword commentary”. Next, the first determination unit 140 determines, for example, a link purpose candidate that is an average value of the highest first evaluation values as a link purpose. For example, in the example illustrated in FIG. 5, the first determination unit 140 determines the link purpose candidate “official site reference” having the average value “0.62” of the highest first evaluation value as the link purpose. As described above, the first determination unit 140 determines the link purpose “official site reference” related to the reference word Wa (list LWa). The 1st determination part 140 performs the said process similarly about all the other lists.

なお、第1決定部140は、精度向上のため、第1の評価値の平均値が所定の閾値以上である場合に、リンク目的として決定するようにしてもよい。所定の閾値以上であるリンク目的候補が存在しない場合、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を入出力部100に通知してもよい。なお、当該通知を取得した入出力部100は、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を示すメッセージを出力する。   Note that the first determination unit 140 may determine the link purpose when the average value of the first evaluation values is equal to or greater than a predetermined threshold value in order to improve accuracy. When there is no link purpose candidate that is equal to or greater than a predetermined threshold, the input / output unit 100 may be notified that there is no appropriate location for link creation in the content being created. The input / output unit 100 that has acquired the notification outputs a message indicating that there is no appropriate location for creating a link in the content being created.

なお、第1決定部140は、リンク先候補以外に、予め構築したリンク目的別のリンク設定範囲の構成パターン(単語ラベルおよび品詞(例えば、名詞、助詞))とのマッチ度を用いて、リンク目的決定時の精度向上および計算量削減を図ってもよい。当該マッチ度は、上記構成パターンに対する、リンク目的候補−リンク設定範囲候補の類似度を示すスコアである。   In addition, the 1st determination part 140 uses a matching degree with the structure pattern (a word label and a part of speech (for example, a noun, a particle)) of the link setting range classified by the link objective constructed | assembled previously in addition to a link candidate. It may be possible to improve accuracy and reduce the amount of calculation when determining the purpose. The degree of matching is a score indicating the degree of similarity between the link purpose candidate and the link setting range candidate with respect to the configuration pattern.

なお、リンク目的(リンク目的候補)とリンク設定範囲候補とリンク先候補の組毎の第1の評価値、または、リンク目的(リンク目的候補)別に集計(平均)した第1の評価値を、第2決定部150によるリンク設定範囲の決定時(後述)に利用してもよい。   The first evaluation value for each set of link purpose (link purpose candidate), link setting range candidate and link destination candidate, or the first evaluation value calculated (averaged) for each link purpose (link purpose candidate), It may be used when the second setting unit 150 determines the link setting range (described later).

第2決定部150は、第1決定部140から、リンク目的とリンク設定範囲候補とリンク先候補(リンク先候補を特定する情報(例えば、URL))の組を取得する。リンク目的とリンク設定範囲候補とリンク先候補の組を取得した第2決定部150は、当該リンク目的において、リンク設定範囲候補とリンク先候補の組毎にリンク先としての適切さを示す第2の評価値を算出し、第2の評価値に基づいてリンク設定範囲候補からリンク設定範囲を決定(採用)する。具体的には、第2決定部140は、一のリンク先を設定するべき一のリンク設定範囲の候補となるリンク設定範囲候補の群毎に、リンク設定範囲候補からリンク設定範囲を決定する。換言すれば、第2決定部150は、リンク設定範囲候補抽出時に基準となった基準単語毎にリンク設定範囲を決定する(1つのリンク先に対し1つのリンク設定範囲を決定する)。なお、第2の評価値に係る具体例は後述する。   The second determination unit 150 acquires a set of a link purpose, a link setting range candidate, and a link destination candidate (information (for example, URL) specifying the link destination candidate) from the first determination unit 140. The second determination unit 150 that has acquired the set of the link purpose, the link setting range candidate, and the link destination candidate indicates the appropriateness as the link destination for each set of the link setting range candidate and the link destination candidate for the link purpose. The link setting range is determined (adopted) from the link setting range candidates based on the second evaluation value. Specifically, the second determination unit 140 determines a link setting range from the link setting range candidates for each group of link setting range candidates that are candidates for one link setting range for which one link destination is to be set. In other words, the second determination unit 150 determines a link setting range for each reference word that is used as a reference when extracting link setting range candidates (determines one link setting range for one link destination). A specific example relating to the second evaluation value will be described later.

第2決定部150は、例えば、第2の評価値の高い順に上位M個(Mは2以上)のリンク設定範囲候補をリンク設定範囲として決定してもよい。また、第2決定部150は、第2の評価値が最高のリンク設定範囲候補をリンク設定範囲として決定してもよい。   For example, the second determination unit 150 may determine the upper M link setting range candidates (M is 2 or more) in descending order of the second evaluation value as the link setting range. The second determination unit 150 may determine the link setting range candidate having the highest second evaluation value as the link setting range.

第2決定部150は、リンク設定範囲候補からリンク設定範囲を決定した場合、リンク設定範囲と、当該リンク設定範囲に対応するリンク目的とを入出力部110に供給する。換言すれば、第2決定部150は、リンク設定範囲に対応付けてリンク目的を入出力部110に供給する。なお、第2決定部150からリンク設定範囲に対応付けてリンク目的を取得した入出力部110は、非図示の表示部を介して、リンク設定範囲に対応付けてリンク目的を作成者に提示(表示)する。   When determining the link setting range from the link setting range candidates, the second determining unit 150 supplies the link setting range and the link purpose corresponding to the link setting range to the input / output unit 110. In other words, the second determination unit 150 supplies the link purpose to the input / output unit 110 in association with the link setting range. The input / output unit 110 that has acquired the link purpose in association with the link setting range from the second determination unit 150 presents the link purpose in association with the link setting range to the creator via a display unit (not shown) ( indicate.

また、第2決定部150は、リンク設定範囲候補からリンク設定範囲を決定した場合、リンク設定範囲と、当該リンク設定範囲に対応するリンク目的と、リンク先(当該リンク設定範囲に対応するリンク先候補)とを、入出力部110に供給するようにしてもよい。換言すれば、第2決定部150は、リンク設定範囲に対応付けてリンク目的およびリンク先を入出力部110に供給する。なお、第2決定部150からリンク設定範囲に対応付けてリンク目的およびリンク先を取得した入出力部110は、非図示の表示部を介して、リンク設定範囲に対応付けてリンク目的およびリンク先を作成者に提示(表示)する。   Further, when the second determination unit 150 determines the link setting range from the link setting range candidates, the link setting range, the link purpose corresponding to the link setting range, and the link destination (the link destination corresponding to the link setting range) Candidates) may be supplied to the input / output unit 110. In other words, the second determination unit 150 supplies the link purpose and the link destination to the input / output unit 110 in association with the link setting range. The input / output unit 110 that has acquired the link purpose and the link destination in association with the link setting range from the second determination unit 150 associates the link purpose and the link destination with the link setting range via a display unit (not shown). Is presented (displayed) to the creator.

以下、第2の評価値について更に説明する。第2決定部150は、多変量解析によって生成された第2の予測モデルを用いて、第2の評価値を算出する。第2の予測モデルは、リンク目的に特化(依存)する予測モデルである。なお、第2の予測モデルについての詳細は後述する。   Hereinafter, the second evaluation value will be further described. The second determination unit 150 calculates a second evaluation value using the second prediction model generated by multivariate analysis. The second prediction model is a prediction model specialized (dependent) for the link purpose. Details of the second prediction model will be described later.

例えば、第1決定部140により決定されたリンク目的に係る組のみを含む、リストLWaについて処理を行う場合、まず、第2決定部150は、予測モデルDB193に格納されている、当該リンク目的に特化した第2の予測モデルに、リストLWaの一の組(リンク目的−リンク設定範囲候補)のリンク設定範囲候補と、当該リンク設定範囲に対応するリンク先候補を入力し、第2の評価値を取得する。   For example, when processing the list LWa that includes only the set related to the link purpose determined by the first determination unit 140, first, the second determination unit 150 first stores the link purpose stored in the prediction model DB 193. A link setting range candidate of one set of the list LW (link purpose-link setting range candidate) and a link destination candidate corresponding to the link setting range are input to the second prediction model specialized for the second evaluation model. Get the value.

但し、第2決定部150は、リンク目的を決定する際に利用した第1の評価値を第2の評価値として利用する場合には、図5に示す例において、リンク目的「公式サイト参照」において、リンク設定範囲候補「A」、リンク先候補「K21」のURL「http://www.k21/…」を入力し、第1(第2)の評価値「0.65」を取得する。第2決定部150は、他の全ての組について上記処理を同様に行う。なお、第2決定部150は、第1の評価値を第2の評価値として利用する場合には、該当する第1の評価値を第1決定部140から取得してもよい。   However, when the second evaluation unit 150 uses the first evaluation value used in determining the link purpose as the second evaluation value, in the example illustrated in FIG. , The URL “http: //www.k21/...” Of the link setting range candidate “A” and the link destination candidate “K21” is input, and the first (second) evaluation value “0.65” is acquired. . The 2nd determination part 150 performs the said process similarly about all the other groups. In addition, the 2nd determination part 150 may acquire the applicable 1st evaluation value from the 1st determination part 140, when utilizing a 1st evaluation value as a 2nd evaluation value.

次に、第2決定部150は、例えば、最も高い第2の評価値であるリンク設定範囲候補およびリンク先候補の組をリンク設定範囲およびリンク先として決定する。第2決定部150は、他の全てのリストについて上記処理を同様に行う。   Next, the second determination unit 150 determines, for example, a set of the link setting range candidate and the link destination candidate that is the highest second evaluation value as the link setting range and the link destination. The second determination unit 150 performs the above process in the same manner for all other lists.

なお、第2決定部150は、精度向上のため、第2の評価値の平均値が所定の閾値以上である場合に、リンク設定範囲(およびリンク先)として決定するようにしてもよい。所定の閾値以上であるリンク設定範囲(およびリンク先)が存在しない場合、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を入出力部100に通知してもよい。なお、当該通知を取得した入出力部100は、作成中のコンテンツにリンク作成に適切な箇所が存在しない旨を示すメッセージを出力する。   Note that the second determination unit 150 may determine the link setting range (and the link destination) when the average value of the second evaluation values is equal to or greater than a predetermined threshold value in order to improve accuracy. When there is no link setting range (and a link destination) that is equal to or greater than a predetermined threshold, the input / output unit 100 may be notified that there is no location suitable for link creation in the content being created. The input / output unit 100 that has acquired the notification outputs a message indicating that there is no appropriate location for creating a link in the content being created.

続いて、第1の予測モデルおよび第2の予測モデルについて説明する。第1の予測モデルおよび第2の予測モデルは、予測モデル生成部160によって生成される。予測モデル生成部160は、予測モデル学習用データを用いて、第1の予測モデルおよび第2の予測モデルを生成する。予測モデル学習用データは、例えば、外部取得コンテンツDB192内に記憶される。   Next, the first prediction model and the second prediction model will be described. The first prediction model and the second prediction model are generated by the prediction model generation unit 160. The prediction model generation unit 160 generates a first prediction model and a second prediction model using the prediction model learning data. The prediction model learning data is stored, for example, in the externally acquired content DB 192.

図6は、予測モデル学習用データの一例である。図6に示す予測モデル学習用データは、既存のコンテンツ中に存在するリンク(とアンカーテキストに対して)に対するリンク先候補1件が1エントリに相当する。また、各カラムは下記の通りである。
(各カラムの内容)
「リンク先候補URL」:検索により取得したリンク先候補のURL
「リンク目的」:各リンク先候補に係るリンク目的(人手にて付与)
「評価値」:各リンク先候補の適切さ(人手にて付与)
「尺度」:リンク元とリンク先候補コンテンツから算出される、リンク先候補のコンテンツ特徴量
FIG. 6 is an example of prediction model learning data. In the prediction model learning data shown in FIG. 6, one link destination candidate for a link (and an anchor text) existing in existing content corresponds to one entry. Each column is as follows.
(Content of each column)
“Link destination candidate URL”: URL of the link destination candidate acquired by the search
"Link purpose": Link purpose related to each link destination candidate (given manually)
"Evaluation value": Appropriateness of each link destination candidate (given manually)
"Scale": Content feature amount of link destination candidate calculated from link source and link destination candidate content

図6に示す鮮度は、コンテンツの新しさを表す尺度である。鮮度の値は、最終更新日が新しいリンク先候補ほど高い。最終更新日については、例えばリンク先候補のHTTPヘッダに含まれるLast-Modifiedフィールド値を参照する。信頼度は、リンク先候補のコンテンツの信頼性を表す尺度である。信頼度の値は、情報源として信頼できると考えられるWebサイトに属するリンク先候補ほど高い。例えば、信頼できるドメイン(“go.jp”といった政府系ドメイン等)に属するリンク先候補は高い。類似度は、リンク元のコンテンツ本文とリンク先候補のコンテンツ本文とにおける内容の類似度を表す尺度である。類似度の値は、本文の内容がリンク元のコンテンツと類似するリンク先候補ほど高い。URL/タイトル一致度は、リンク元のアンカーテキストに含まれる単語と、リンク先候補のURLまたはタイトルとの一致度を表す尺度である。URL/タイトル一致度の値は、リンク元のアンカーテキストに含まれる単語が、リンク先候補のURLまたはタイトル中に多く含まれるほど高い。   The freshness shown in FIG. 6 is a measure representing the novelty of the content. The freshness value is higher for a link destination candidate with a new last update date. For the last update date, for example, refer to the Last-Modified field value included in the HTTP header of the link destination candidate. The reliability is a measure representing the reliability of the content of the link destination candidate. The reliability value is higher for link destination candidates belonging to Web sites that are considered to be reliable as information sources. For example, link destination candidates belonging to a trusted domain (such as a government domain such as “go.jp”) are high. The similarity is a scale representing the similarity between the content text of the link source and the content text of the link destination candidate. The similarity value is higher for link destination candidates whose contents are similar to the link source content. The URL / title matching degree is a scale representing the degree of matching between the word included in the link source anchor text and the link destination candidate URL or title. The URL / title matching value is higher as the number of words included in the link source anchor text is included in the URL or title of the link destination candidate.

予測モデル生成部160は、評価値を目的変数、尺度の値を説明変数とし、多変量解析を行うことで、第1の予測モデルおよび第2の予測モデルを構築する。多変量解析としては、重回帰分析、SVM(Support Vector Machine)、NN(Neural Network)等、種々の方法が利用可能であるが、重回帰分析の例を説明する。なお、説明変数の値(尺度の値)をそれぞれf,r,s,uとし、それぞれの係数(重視する度合い)をa,b,c,dとしたとき、目的変数であるリンク先候補の評価値yは、下記式(1)によって表されるものとする。   The prediction model generation unit 160 constructs the first prediction model and the second prediction model by performing multivariate analysis using the evaluation value as an objective variable and the scale value as an explanatory variable. Various methods such as multiple regression analysis, SVM (Support Vector Machine), and NN (Neural Network) can be used as multivariate analysis. An example of multiple regression analysis will be described. When the values of the explanatory variables (scale values) are f, r, s, and u, and the respective coefficients (degrees of importance) are a, b, c, and d, the link destination candidate that is the objective variable. The evaluation value y shall be represented by the following formula (1).

y=a×f+b×r+c×s+d×u+i…(1)
但し、iは切片である。
y = a * f + b * r + c * s + d * u + i (1)
However, i is an intercept.

予測モデル生成部160は、学習用データに重回帰分析を施すことにより、各尺度の重み(a,b,c,d)を算出する。予測モデルは、この算出した重みを用いた数式である。具体的には、予測モデル生成部160は、学習用データ全体を用いて重みを算出して第1の予測モデルを構築する。例えば、予測モデル生成部160は、図6のNo.1〜8のデータを用いて第1の予測モデルを構築する。また、予測モデル生成部160は、リンク目的固有の学習用データを用いて重みを算出して第2の予測モデルを構築する。例えば、予測モデル生成部160は、図6のNo.1〜4のデータを用いてリンク目的「キーワード解説」用の第2の予測モデルを構築し、予測モデル生成部160は、図6のNo.5〜8のデータを用いてリンク目的「公式サイト参照」用の第2の予測モデルを構築する。   The prediction model generation unit 160 calculates the weight (a, b, c, d) of each scale by performing multiple regression analysis on the learning data. The prediction model is a mathematical formula using the calculated weight. Specifically, the prediction model generation unit 160 constructs a first prediction model by calculating weights using the entire learning data. For example, the prediction model generation unit 160 performs the process of No. A 1st prediction model is constructed | assembled using the data of 1-8. Further, the prediction model generation unit 160 constructs a second prediction model by calculating a weight using the learning data specific to the link purpose. For example, the prediction model generation unit 160 performs the process of No. The second prediction model for the link purpose “keyword commentary” is constructed using the data of 1 to 4, and the prediction model generation unit 160 displays the No. 1 in FIG. The second prediction model for the link purpose “official site reference” is constructed using the data of 5-8.

続いて、図7を用いて、リンク作成支援10の動作を説明する。なお、図7に示すフローチャートは、基準単語抽出部110が、入出力部100から作成中のコンテンツを取得することにより開始する。基準単語抽出部110は、作成中のコンテンツ内からリンク設定範囲候補を抽出するときに基準となる基準単語を抽出する(ステップS100)。基準単語を抽出した基準単語抽出部110は、作成中のコンテンツとともに基準単語(ラベル付)をリンク設定範囲候補抽出部120に供給する。   Subsequently, the operation of the link creation support 10 will be described with reference to FIG. Note that the flowchart shown in FIG. 7 starts when the reference word extraction unit 110 acquires content being created from the input / output unit 100. The reference word extraction unit 110 extracts a reference word that serves as a reference when extracting link setting range candidates from the content being created (step S100). The reference word extraction unit 110 that has extracted the reference words supplies the reference word (with label) to the link setting range candidate extraction unit 120 together with the content being created.

作成中のコンテンツとともに基準単語(ラベル付)を取得したリンク設定範囲候補抽出部120は、作成中のコンテンツ内からリンク設定範囲候補を抽出する(ステップS200)。なお、当該処理は、図4に示すとおりである。リンク設定範囲候補を抽出したリンク設定範囲候補抽出部120は、リンク目的候補−リンク設定範囲候補の組をリンク先候補検索部130に供給する。   The link setting range candidate extraction unit 120 that has acquired the reference word (with label) together with the content being created extracts the link setting range candidate from the content being created (step S200). This process is as shown in FIG. The link setting range candidate extraction unit 120 that has extracted the link setting range candidates supplies the link destination candidate-link setting range candidate pair to the link destination candidate search unit 130.

リンク目的候補−リンク設定範囲候補の組を取得したリンク先候補検索部130は、リンク目的候補とリンク設定範囲候補の組毎に、リンク先候補を検索する(ステップS300)。リンク目的候補とリンク設定範囲候補の組毎にリンク先候補を検索したリンク先候補検索部130は、リンク先候補検索部130は、リンク目的候補とリンク設定範囲候補とリンク先候補の組を第1決定部140に供給する。   The link destination candidate search unit 130 that has acquired the link target candidate-link setting range candidate pair searches for the link destination candidate for each set of the link purpose candidate and the link setting range candidate (step S300). The link destination candidate search unit 130 that has searched for the link destination candidate for each set of the link purpose candidate and the link setting range candidate, the link destination candidate search unit 130 determines the set of the link purpose candidate, the link setting range candidate, and the link destination candidate. 1 is supplied to the determination unit 140.

リンク目的候補とリンク設定範囲候補とリンク先候補の組を取得した第1決定部140は、リンク設定範囲候補抽出時に基準となった基準単語毎にリンク目的を決定する(ステップS400)。基準単語毎にリンク目的を決定した第1決定部140は、リンク目的とリンク設定範囲候補とリンク先候補の組を第2決定部150に供給する。   The 1st determination part 140 which acquired the group of a link purpose candidate, a link setting range candidate, and a link destination candidate determines a link purpose for every reference | standard word used as the reference at the time of link setting range candidate extraction (step S400). The first determination unit 140 that has determined the link purpose for each reference word supplies the second determination unit 150 with a set of the link purpose, the link setting range candidate, and the link destination candidate.

リンク目的とリンク設定範囲候補とリンク先候補の組を取得した第2決定部150は、リンク設定範囲候補抽出時に基準となった基準単語毎にリンク設定範囲を決定する(ステップS500)。基準単語毎にリンク設定範囲を決定した第2決定部150は、リンク設定範囲に対応付けてリンク目的およびリンク先を入出力部110に供給する。   The 2nd determination part 150 which acquired the group of a link purpose, a link setting range candidate, and a link destination candidate determines a link setting range for every reference | standard word used as the reference | standard at the time of link setting range candidate extraction (step S500). The second determination unit 150 that has determined the link setting range for each reference word supplies the link purpose and the link destination to the input / output unit 110 in association with the link setting range.

リンク設定範囲に対応付けてリンク目的およびリンク先を取得した入出力部110は、非図示の表示部を介して、リンク設定範囲に対応付けてリンク目的およびリンク先を作成者に出力(表示)する(ステップS600)。   The input / output unit 110 that has acquired the link purpose and link destination in association with the link setting range outputs (displays) the link purpose and link destination in association with the link setting range to the creator via a display unit (not shown). (Step S600).

以上、リンク作成支援装置10は、ブログ等のテキストベースのコンテンツ制作過程において、当該コンテンツ中にリンクを作成する範囲、および、当該範囲でリンクを作成する目的を推定し、リンクを作成する範囲などを自動的に提示する、リンク自動作成装置である。リンク作成支援装置10によれば、コンテンツの作成者のリンク目的に沿うようなリンク(リンク設定範囲、リンク目的/リンク設定範囲、リンク目的、リンク先)を作成者に提示するため、リンク作成時の作成者の負担を大幅に軽減させることができるようになる。なお、作成者の作成スタイルに応じて、ある基準単語について、1つのリンク目的と、1つのリンク設定範囲と、1つのリンク先を作成者に提示する態様としてもよいし、1つのリンク目的と、複数のリンク設定範囲と、各リンク設定範囲に対応するリンク先を作成者に提示する態様としてもよい。   As described above, in the text-based content production process such as a blog, the link creation support apparatus 10 estimates a range for creating a link in the content, a purpose for creating the link within the range, and a range for creating the link. Is an automatic link creation device that automatically presents According to the link creation support apparatus 10, a link (link setting range, link purpose / link setting range, link purpose, link destination) that follows the link purpose of the content creator is presented to the creator. The burden on the creator of can be greatly reduced. Depending on the creation style of the creator, one link purpose, one link setting range, and one link destination may be presented to the creator for a certain reference word. A plurality of link setting ranges and a link destination corresponding to each link setting range may be presented to the creator.

(第2の実施形態)
以下、本発明の第2の実施形態によるリンク作成支援12について説明する。リンク作成支援12は、コンテンツ作成を支援する装置であって、コンテンツの作成者のリンク目的に沿うようなリンクを作成中のコンテンツ内に自動的に作成する。
(Second Embodiment)
The link creation support 12 according to the second embodiment of the present invention will be described below. The link creation support 12 is a device that supports content creation, and automatically creates a link in the content being created that meets the link purpose of the content creator.

以下、リンク作成支援12について図面を参照して説明する。リンク作成支援12は、図8に示すように、入出力部100、基準単語抽出部110、リンク設定範囲候補抽出部120、リンク先候補検索部130、第1決定部140、第2決定部151、予測モデル生成部160、アンカーテキスト設定部170、単語スコア算出部180、単語DB190、過去記事DB191、外部取得コンテンツDB192および予測モデルDB193を備える。第2決定部151およびアンカーテキスト設定部170以外は、図1に示すリンク作成支援10と同様であるため、説明を省略する。   Hereinafter, the link creation support 12 will be described with reference to the drawings. As shown in FIG. 8, the link creation support 12 includes an input / output unit 100, a reference word extraction unit 110, a link setting range candidate extraction unit 120, a link destination candidate search unit 130, a first determination unit 140, and a second determination unit 151. A prediction model generation unit 160, an anchor text setting unit 170, a word score calculation unit 180, a word DB 190, a past article DB 191, an externally acquired content DB 192, and a prediction model DB 193. Other than the second determination unit 151 and the anchor text setting unit 170 are the same as the link creation support 10 shown in FIG.

第2決定部151は、第2決定部150と同様、リンク設定範囲候補からリンク設定範囲を決定する。但し、第2決定部151は、第2の評価値に基づいてリンク設定範囲候補から一のリンク設定範囲を決定する。即ち、第2決定部151は、第2の評価値が最高のリンク設定範囲候補をリンク設定範囲として決定する。   Similar to the second determination unit 150, the second determination unit 151 determines the link setting range from the link setting range candidates. However, the second determination unit 151 determines one link setting range from the link setting range candidates based on the second evaluation value. That is, the second determination unit 151 determines the link setting range candidate having the highest second evaluation value as the link setting range.

第2決定部151は、リンク設定範囲候補からリンク設定範囲を決定した場合、当該リンク設定範囲と、当該リンク設定範囲に対応するリンク先(当該リンク設定範囲に対応するリンク先候補)とをアンカーテキスト設定部170に供給する。換言すれば、第2決定部151は、リンク設定範囲に対応付けてリンク先をアンカーテキスト設定部170に供給する。   When determining the link setting range from the link setting range candidates, the second determining unit 151 anchors the link setting range and the link destination corresponding to the link setting range (link destination candidate corresponding to the link setting range). This is supplied to the text setting unit 170. In other words, the second determination unit 151 supplies the link destination to the anchor text setting unit 170 in association with the link setting range.

また、第2決定部151は、リンク設定範囲候補からリンク設定範囲を決定した場合、当該リンク設定範囲と、当該リンク設定範囲に対応するリンク先と、当該リンク設定範囲に対応するリンク目的とをアンカーテキスト設定部170に供給してもよい。換言すれば、第2決定部151は、リンク設定範囲に対応付けてリンク先およびリンク目的をアンカーテキスト設定部170に供給してもよい。   Further, when the second setting unit 151 determines the link setting range from the link setting range candidates, the second determining unit 151 determines the link setting range, the link destination corresponding to the link setting range, and the link purpose corresponding to the link setting range. You may supply to the anchor text setting part 170. FIG. In other words, the second determination unit 151 may supply the link destination and the link purpose to the anchor text setting unit 170 in association with the link setting range.

アンカーテキスト設定部170は、例えば、入出力部100または基準単語抽出部110から、作成中のコンテンツを取得する。また、アンカーテキスト設定部170は、第2決定部151からリンク設定範囲に対応付けてリンク先を取得する。また、アンカーテキスト設定部170は、第2決定部151からリンク設定範囲に対応付けてリンク先およびリンク目的を取得してもよい。   For example, the anchor text setting unit 170 acquires the content being created from the input / output unit 100 or the reference word extraction unit 110. In addition, the anchor text setting unit 170 acquires a link destination from the second determination unit 151 in association with the link setting range. The anchor text setting unit 170 may acquire the link destination and the link purpose from the second determination unit 151 in association with the link setting range.

リンク設定範囲に対応付けてリンク先を取得したアンカーテキスト設定部170は、作成中のコンテンツにおいて、当該リンク設定範囲に当該リンク先を設定する。また、リンク設定範囲に対応付けてリンク先およびリンク目的を取得したアンカーテキスト設定部170は、作成中のコンテンツにおいて、当該リンク設定範囲に当該リンク先を設定するとともに、当該リンク設定範囲の近傍にリンク目的を表示する(例えば、カーソルを当てた場合に表示するような表示態様であってもよい)。   The anchor text setting unit 170 that has acquired the link destination in association with the link setting range sets the link destination in the link setting range in the content being created. In addition, the anchor text setting unit 170 that has acquired the link destination and the link purpose in association with the link setting range sets the link destination in the link setting range and in the vicinity of the link setting range in the content being created. The link purpose is displayed (for example, it may be displayed when the cursor is placed).

図9は、リンク作成支援12の動作の一例を示すフローチャートである。図9のステップS100、ステップS200、ステップS300、ステップS400、ステップS500は、図7に示すリンク作成支援10の動作と同様である。図9に示すように、リンク作成支援12の場合、アンカーテキスト設定部170が、作成中のコンテンツにおいて、リンク設定範囲にリンク先を設定する(ステップS610)。また、上述の如く、アンカーテキスト設定部170は、リンク設定範囲の近傍にリンク目的を表示する。   FIG. 9 is a flowchart illustrating an example of the operation of the link creation support 12. Steps S100, S200, S300, S400, and S500 in FIG. 9 are the same as the operations of the link creation support 10 shown in FIG. As shown in FIG. 9, in the case of the link creation support 12, the anchor text setting unit 170 sets a link destination in the link setting range in the content being created (step S610). Further, as described above, the anchor text setting unit 170 displays the link purpose in the vicinity of the link setting range.

以上のように、リンク作成支援装置12は、ブログ等のテキストベースのコンテンツ制作過程において、当該コンテンツ中にリンクを作成する範囲、および、当該範囲でリンクを作成する目的を推定し、自動的にリンクを作成(リンクを作成する範囲、および、当該範囲によるリンク先を設定)する、リンク自動作成装置である。リンク作成支援装置12によれば、コンテンツの作成者のリンク目的に沿うようなリンク(リンク設定範囲、リンク先)を作成中のコンテンツ内に自動的に作成するため、リンク作成時の作成者の負担を更に大幅に軽減させることができるようになる。   As described above, in the text-based content production process such as a blog, the link creation support apparatus 12 estimates the range for creating a link in the content and the purpose for creating the link within the range, and automatically This is an automatic link creation apparatus that creates a link (sets a range for creating a link and a link destination based on the range). According to the link creation support device 12, a link (link setting range, link destination) that matches the link purpose of the content creator is automatically created in the content being created. The burden can be further greatly reduced.

以上のように、リンク作成支援装置10またはリンク作成支援装置12によれば、作成者はリンク作成時に、アンカーテキストの選択、リンク先コンテンツの検索と選択、URLの転記といった煩雑な作業を必要とせず、リンク作成の負担を無くし(あるいは軽減し)、コンテンツ作成に注力できる。コンテンツ作成開始時に、内容に関して漠としたイメージであっても、本発明が提示する、アンカーテキスト−リンク目的−リンク先コンテンツを参照することにより、具体的な記述を支援することができる。自動的に内容が関連したコンテンツが提示されるため、これを参照することにより、作成者は自身が作成しているコンテンツ中の誤り等を発見可能である。これにより、Web上に誤った情報が公開されることを防ぐことが可能となる。本発明は、リンク目的別に適したコンテンツを推薦するため、これらへのリンクを作成することにより内容の充実を図れる。本発明を利用したコンテンツが多数作成されることにより、Web上に存在するコンテンツのうち、内容が充実しているコンテンツの割合を増加させることができる。これは、通常のWebの検索に対する満足度向上にも貢献する。   As described above, according to the link creation support apparatus 10 or the link creation support apparatus 12, the creator needs complicated operations such as selection of anchor text, search and selection of link destination content, and URL transcription when creating a link. Therefore, the burden of creating links can be eliminated (or reduced) and content creation can be focused. Even if the content is vague at the start of content creation, a specific description can be supported by referring to the anchor text-link purpose-link destination content presented by the present invention. Since content related to the content is automatically presented, the creator can find an error in the content created by the creator by referring to the content. This makes it possible to prevent incorrect information from being disclosed on the Web. Since the present invention recommends contents suitable for each link purpose, the contents can be enhanced by creating links to these contents. By creating a large number of contents using the present invention, it is possible to increase the proportion of contents that are enriched among contents existing on the Web. This also contributes to an improvement in satisfaction with a normal Web search.

なお、特許文献1、非特許文献1に記載の技術では、主に、リンク目的という概念しないため、作成者の意図に沿うような最適なリンク位置およびリンク先の提示、または、最適なリンク生成は非常に困難である。   The techniques described in Patent Document 1 and Non-Patent Document 1 do not mainly have the concept of a link purpose. Therefore, an optimal link position and link destination that are in accordance with the intention of the creator, or optimal link generation Is very difficult.

なお、本発明の一実施形態によるリンク作成支援装置10、12の各処理を実行するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、当該記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより、本発明の一実施形態によるリンク作成支援装置10、12の各処理に係る上述した種々の処理を行ってもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものであってもよい。また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、フラッシュメモリ等の書き込み可能な不揮発性メモリ、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。   Note that a program for executing each process of the link creation support apparatuses 10 and 12 according to an embodiment of the present invention is recorded on a computer-readable recording medium, and the program recorded on the recording medium is read into a computer system. The above-described various processes related to the processes of the link creation support apparatuses 10 and 12 according to the embodiment of the present invention may be performed. Here, the “computer system” may include an OS and hardware such as peripheral devices. Further, the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used. The “computer-readable recording medium” means a flexible disk, a magneto-optical disk, a ROM, a writable nonvolatile memory such as a flash memory, a portable medium such as a CD-ROM, a hard disk built in a computer system, etc. This is a storage device.

さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムが送信された場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリ(例えばDRAM(Dynamic Random Access Memory))のように、一定時間プログラムを保持しているものも含むものとする。また、上記プログラムは、このプログラムを記憶装置等に格納したコンピュータシステムから、伝送媒体を介して、あるいは、伝送媒体中の伝送波により他のコンピュータシステムに伝送されてもよい。ここで、プログラムを伝送する「伝送媒体」は、インターネット等のネットワーク(通信網)や電話回線等の通信回線(通信線)のように情報を伝送する機能を有する媒体のことをいう。また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。   Further, the “computer-readable recording medium” means a volatile memory (for example, DRAM (Dynamic DRAM) in a computer system that becomes a server or a client when a program is transmitted through a network such as the Internet or a communication line such as a telephone line. Random Access Memory)), etc., which hold programs for a certain period of time. The program may be transmitted from a computer system storing the program in a storage device or the like to another computer system via a transmission medium or by a transmission wave in the transmission medium. Here, the “transmission medium” for transmitting the program refers to a medium having a function of transmitting information, such as a network (communication network) such as the Internet or a communication line (communication line) such as a telephone line. The program may be for realizing a part of the functions described above. Furthermore, what can implement | achieve the function mentioned above in combination with the program already recorded on the computer system, and what is called a difference file (difference program) may be sufficient.

以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。   The embodiment of the present invention has been described in detail with reference to the drawings. However, the specific configuration is not limited to this embodiment, and includes designs and the like that do not depart from the gist of the present invention.

10、12 リンク作成支援装置 100 入出力部 110 基準単語抽出部 120 リンク設定範囲候補抽出部 130 リンク先候補検索部 140 第1決定部 150、151 第2決定部 160 予測モデル生成部 170 アンカーテスト設定部 180 単語スコア算出部 190 単語DB 191 過去記事DB 192 外部取得コンテンツDB 193 予測モデルDB 10, 12 Link creation support device 100 Input / output unit 110 Reference word extraction unit 120 Link setting range candidate extraction unit 130 Link destination candidate search unit 140 First determination unit 150, 151 Second determination unit 160 Prediction model generation unit 170 Anchor test setting Unit 180 Word score calculation unit 190 Word DB 191 Past article DB 192 Externally acquired content DB 193 Prediction model DB

Claims (12)

作成中のコンテンツ内から、アンカーテキストとしてリンク先を設定するべきリンク設定範囲の候補となるリンク設定範囲候補を抽出するときに基準となる基準単語を抽出する基準単語抽出部と、
作成中のコンテンツ内から、前記基準単語を基準にして、リンク作成の目的であるリンク目的の候補となるリンク目的候補毎に、1以上の前記リンク設定範囲候補を抽出するリンク設定範囲候補抽出部と、
前記リンク目的候補と前記リンク設定範囲候補とに応じた検索方法を用いて、前記リンク目的候補と前記リンク設定範囲候補の組毎にリンク先の候補となるリンク先候補を検索するリンク先候補検索部と、
前記リンク目的候補と前記リンク設定範囲候補と前記リンク先候補の組毎にリンク先としての適切さを示す第1の評価値を算出し、前記第1の評価値を前記リンク目的候補別に集計し、前記集計後の第1の評価値に基づいて前記リンク目的候補から前記リンク目的を決定する第1決定部と、
前記第1決定部によって決定された前記リンク目的において、前記リンク設定範囲候補と前記リンク先候補の組毎にリンク先としての適切さを示す第2の評価値を算出し、前記第2の評価値に基づいて前記リンク設定範囲候補から前記リンク設定範囲を決定する第2決定部と
を備えることを特徴とするリンク作成支援装置。
A reference word extraction unit that extracts a reference word that serves as a reference when extracting a link setting range candidate that is a candidate of a link setting range for which a link destination is to be set as an anchor text from the content being created;
A link setting range candidate extraction unit that extracts one or more link setting range candidates for each link purpose candidate that is a link purpose candidate that is the purpose of link creation from the content being created, based on the reference word When,
Link destination candidate search for searching for a link destination candidate as a link destination candidate for each set of the link purpose candidate and the link setting range candidate using a search method according to the link purpose candidate and the link setting range candidate And
A first evaluation value indicating appropriateness as a link destination is calculated for each set of the link purpose candidate, the link setting range candidate, and the link destination candidate, and the first evaluation value is aggregated for each link purpose candidate. A first determination unit that determines the link purpose from the link purpose candidates based on the first evaluation value after the aggregation;
In the link purpose determined by the first determination unit, a second evaluation value indicating suitability as a link destination is calculated for each set of the link setting range candidate and the link destination candidate, and the second evaluation is performed. A link creation support apparatus comprising: a second determination unit that determines the link setting range from the link setting range candidates based on a value.
前記第1決定部は、
一のリンク先に設定するべき一の前記リンク設定範囲の候補となる前記リンク設定範囲候補の群毎に、前記リンク目的候補から前記リンク目的を決定し、
前記第2決定部は、
一のリンク先に設定するべき一の前記リンク設定範囲の候補となる前記リンク設定範囲候補の群毎に、前記リンク設定範囲候補から前記リンク設定範囲を決定することを特徴とする請求項1に記載のリンク作成支援装置。
The first determination unit includes:
For each group of link setting range candidates that are candidates for one link setting range to be set to one link destination, the link purpose is determined from the link purpose candidates,
The second determination unit includes
The link setting range is determined from the link setting range candidates for each group of the link setting range candidates that are candidates for the one link setting range to be set as one link destination. The link creation support device described.
前記第1決定部は、
前記集計後の第1の評価値が最高の前記リンク目的候補を前記リンク目的として決定し、
前記第2決定部は、
前記第2の評価値が最高の前記組の前記リンク設定範囲候補を前記リンク設定範囲として決定することを特徴とする請求項1または請求項2に記載のリンク作成支援装置。
The first determination unit includes:
The link purpose candidate having the highest first evaluation value after the aggregation is determined as the link purpose,
The second determination unit includes
The link creation support apparatus according to claim 1 or 2, wherein the link setting range candidate of the set having the highest second evaluation value is determined as the link setting range.
前記第1決定部は、
多変量解析によって生成された第1の予測モデルを用いて、前記第1の評価値を算出し、
前記第2決定部は、
多変量解析によって生成された第2の予測モデルを用いて、前記第2の評価値を算出することを特徴とする請求項1から請求項3の何れかに記載のリンク作成支援装置。
The first determination unit includes:
Using the first prediction model generated by multivariate analysis, calculating the first evaluation value,
The second determination unit includes
The link creation support apparatus according to any one of claims 1 to 3, wherein the second evaluation value is calculated using a second prediction model generated by multivariate analysis.
前記リンク設定範囲候補抽出部は、
前記リンク目的候補に応じて異なる単語数の前記リンク設定範囲候補を抽出することを特徴とする請求項1から請求項4の何れかに記載のリンク作成支援装置。
The link setting range candidate extraction unit
5. The link creation support apparatus according to claim 1, wherein the link setting range candidates having a different number of words are extracted according to the link purpose candidates.
前記基準単語抽出部は、
一の単語が当該単語を含むコンテンツ内において前記リンク設定範囲となる頻度を示す単語スコアに基づいて、前記基準単語を抽出することを特徴とする請求項1から請求項5の何れかの請求項に記載のリンク作成支援装置。
The reference word extraction unit
6. The reference word according to claim 1, wherein the reference word is extracted based on a word score indicating a frequency at which one word is included in the link setting range in content including the word. The link creation support device described in 1.
前記リンク設定範囲候補抽出部は、
前記単語スコアに応じて異なる単語数の前記リンク設定範囲候補を抽出することを特徴とする請求項6に記載のリンク作成支援装置。
The link setting range candidate extraction unit
The link creation support apparatus according to claim 6, wherein the link setting range candidates having a different number of words are extracted according to the word score.
前記単語スコアは、
単語を構成する文字列と単語の属性の組毎に付されていることを特徴とする請求項6または請求項7に記載のリンク作成支援装置。
The word score is
8. The link creation support apparatus according to claim 6, wherein the link creation support apparatus is attached to each set of a character string and a word attribute constituting the word.
前記単語スコアは、
自分が作成したコンテンツ内において前記リンク設定範囲である場合は、他人が作成したコンテンツ内において前記リンク設定範囲である場合に比べ、高いスコアが付されていることを特徴とする請求項6から請求項8の何れかの請求項に記載のリンク作成支援装置。
The word score is
7. The link setting range in the content created by the user is given a higher score than the case of the link setting range in the content created by another person. The link creation support apparatus according to claim 8.
作成中のコンテンツ内において、前記リンク設定範囲にリンク先を設定するアンカーテキスト設定部
を更に備え、
前記第2決定部は、
前記第2の評価値に基づいて前記リンク設定範囲候補から一の前記リンク設定範囲を決定するとともに、当該リンク設定範囲に対応する一のリンク先候補を前記アンカーテキスト設定部に供給し、
前記アンカーテキスト設定部は、
前記第2決定部から取得した前記リンク設定範囲に、前記第2決定部から取得した前記リンク先候補を設定することを特徴とする請求項1から請求項9に記載のリンク作成支援装置。
An anchor text setting unit that sets a link destination in the link setting range in the content being created,
The second determination unit includes
Determining one link setting range from the link setting range candidates based on the second evaluation value, and supplying one link destination candidate corresponding to the link setting range to the anchor text setting unit;
The anchor text setting unit
The link creation support apparatus according to claim 1, wherein the link destination candidate acquired from the second determination unit is set in the link setting range acquired from the second determination unit.
作成中のコンテンツ内から、アンカーテキストとしてリンク先を設定するべきリンク設定範囲の候補となるリンク設定範囲候補を抽出するときに基準となる基準単語を抽出する基準単語抽出手段と、
作成中のコンテンツ内から、前記基準単語を基準にして、リンク作成の目的であるリンク目的の候補となるリンク目的候補毎に、1以上の前記リンク設定範囲候補を抽出するリンク設定範囲候補抽出手段と、
前記リンク目的候補と前記リンク設定範囲候補とに応じた検索方法を用いて、前記リンク目的候補と前記リンク設定範囲候補の組毎にリンク先の候補となるリンク先候補を検索するリンク先候補検索手段と、
前記リンク目的候補と前記リンク設定範囲候補と前記リンク先候補の組毎にリンク先としての適切さを示す第1の評価値を算出し、前記第1の評価値を前記リンク目的候補別に集計し、前記集計後の第1の評価値に基づいて前記リンク目的候補から前記リンク目的を決定する第1決定手段と、
前記第1決定手段によって決定された前記リンク目的において、前記リンク設定範囲候補と前記リンク先候補の組毎にリンク先としての適切さを示す第2の評価値を算出し、前記第2の評価値に基づいて前記リンク設定範囲候補から前記リンク設定範囲を決定する第2決定手段と
を備えることを特徴とするリンク作成支援方法。
A reference word extraction unit that extracts a reference word that serves as a reference when extracting a link setting range candidate that is a candidate of a link setting range for which a link destination is to be set as an anchor text from the content being created;
Link setting range candidate extraction means for extracting one or more link setting range candidates for each link purpose candidate that is a link purpose candidate that is the purpose of link creation from the content being created with reference to the reference word When,
Link destination candidate search for searching for a link destination candidate as a link destination candidate for each set of the link purpose candidate and the link setting range candidate using a search method according to the link purpose candidate and the link setting range candidate Means,
A first evaluation value indicating appropriateness as a link destination is calculated for each set of the link purpose candidate, the link setting range candidate, and the link destination candidate, and the first evaluation value is aggregated for each link purpose candidate. First determining means for determining the link purpose from the link purpose candidates based on the first evaluation value after the aggregation;
For the link purpose determined by the first determining means, a second evaluation value indicating suitability as a link destination is calculated for each set of the link setting range candidate and the link destination candidate, and the second evaluation A link creation support method comprising: a second determination unit that determines the link setting range from the link setting range candidates based on a value.
リンク作成を支援するリンク作成支援装置のコンピュータに、
作成中のコンテンツ内から、アンカーテキストとしてリンク先を設定するべきリンク設定範囲の候補となるリンク設定範囲候補を抽出するときに基準となる基準単語を抽出する基準単語抽出ステップと、
作成中のコンテンツ内から、前記基準単語を基準にして、リンク作成の目的であるリンク目的の候補となるリンク目的候補毎に、1以上の前記リンク設定範囲候補を抽出するリンク設定範囲候補抽出ステップと、
前記リンク目的候補と前記リンク設定範囲候補とに応じた検索方法を用いて、前記リンク目的候補と前記リンク設定範囲候補の組毎にリンク先の候補となるリンク先候補を検索するリンク先候補検索ステップと、
前記リンク目的候補と前記リンク設定範囲候補と前記リンク先候補の組毎にリンク先としての適切さを示す第1の評価値を算出し、前記第1の評価値を前記リンク目的候補別に集計し、前記集計後の第1の評価値に基づいて前記リンク目的候補から前記リンク目的を決定する第1決定ステップと、
前記第1決定ステップによって決定された前記リンク目的において、前記リンク設定範囲候補と前記リンク先候補の組毎にリンク先としての適切さを示す第2の評価値を算出し、前記第2の評価値に基づいて前記リンク設定範囲候補から前記リンク設定範囲を決定する第2決定ステップと
を実行させることを特徴とするプログラム。
In the computer of the link creation support device that supports link creation,
A reference word extraction step for extracting a reference word that serves as a reference when extracting a link setting range candidate to be a link setting range candidate for which a link destination should be set as an anchor text from within the content being created;
A link setting range candidate extraction step for extracting one or more link setting range candidates for each link purpose candidate that is a link purpose candidate that is a purpose of link creation from the content being created with reference to the reference word When,
Link destination candidate search for searching for a link destination candidate as a link destination candidate for each set of the link purpose candidate and the link setting range candidate using a search method according to the link purpose candidate and the link setting range candidate Steps,
A first evaluation value indicating appropriateness as a link destination is calculated for each set of the link purpose candidate, the link setting range candidate, and the link destination candidate, and the first evaluation value is aggregated for each link purpose candidate. A first determination step of determining the link purpose from the link purpose candidates based on the first evaluation value after the aggregation;
In the link purpose determined by the first determination step, a second evaluation value indicating suitability as a link destination is calculated for each set of the link setting range candidate and the link destination candidate, and the second evaluation And a second determination step of determining the link setting range from the link setting range candidates based on a value.
JP2009158003A 2009-07-02 2009-07-02 Link creation support device, link creation support method, and program Expired - Fee Related JP5277090B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009158003A JP5277090B2 (en) 2009-07-02 2009-07-02 Link creation support device, link creation support method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009158003A JP5277090B2 (en) 2009-07-02 2009-07-02 Link creation support device, link creation support method, and program

Publications (2)

Publication Number Publication Date
JP2011013969A true JP2011013969A (en) 2011-01-20
JP5277090B2 JP5277090B2 (en) 2013-08-28

Family

ID=43592776

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009158003A Expired - Fee Related JP5277090B2 (en) 2009-07-02 2009-07-02 Link creation support device, link creation support method, and program

Country Status (1)

Country Link
JP (1) JP5277090B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015062117A (en) * 2013-09-22 2015-04-02 富士通株式会社 Entity linkage method and entity linkage device
JP2017167959A (en) * 2016-03-17 2017-09-21 ヤフー株式会社 Evaluation device, evaluation method, and evaluation program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000122774A (en) * 1998-10-19 2000-04-28 Toshihiko Okabe Data transfer device and method, and recording medium
JP2003208442A (en) * 2002-01-15 2003-07-25 Ricoh Co Ltd Device and method for providing information, and program
JP2005202895A (en) * 2004-01-19 2005-07-28 Hatena:Kk Information display method, central processing unit, and computer program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000122774A (en) * 1998-10-19 2000-04-28 Toshihiko Okabe Data transfer device and method, and recording medium
JP2003208442A (en) * 2002-01-15 2003-07-25 Ricoh Co Ltd Device and method for providing information, and program
JP2005202895A (en) * 2004-01-19 2005-07-28 Hatena:Kk Information display method, central processing unit, and computer program

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200910045021; 武吉 朋也: 'Webコンテンツ作成支援のためのリンク目的を意識したリンク先推薦手法' FIT2008 第7回情報科学技術フォーラム , 20080820, p.63〜64, 社団法人電子情報通信学会 *
JPN6013019540; 武吉 朋也: 'Webコンテンツ作成支援のためのリンク目的を意識したリンク先推薦手法' FIT2008 第7回情報科学技術フォーラム , 20080820, p.63〜64, 社団法人電子情報通信学会 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015062117A (en) * 2013-09-22 2015-04-02 富士通株式会社 Entity linkage method and entity linkage device
JP2017167959A (en) * 2016-03-17 2017-09-21 ヤフー株式会社 Evaluation device, evaluation method, and evaluation program

Also Published As

Publication number Publication date
JP5277090B2 (en) 2013-08-28

Similar Documents

Publication Publication Date Title
US9836511B2 (en) Computer-generated sentiment-based knowledge base
EP2798540B1 (en) Extracting search-focused key n-grams and/or phrases for relevance rankings in searches
US20150269163A1 (en) Providing search recommendation
JP5710581B2 (en) Question answering apparatus, method, and program
JP2019504413A (en) System and method for proposing emoji
US10152478B2 (en) Apparatus, system and method for string disambiguation and entity ranking
US20130060769A1 (en) System and method for identifying social media interactions
US10810374B2 (en) Matching a query to a set of sentences using a multidimensional relevancy determination
JP2009093649A (en) Recommendation for term specifying ontology space
JP5391632B2 (en) Determining word and document depth
US20170011092A1 (en) Systems and methods for the creation, update and use of models in finding and analyzing content
US20110219299A1 (en) Method and system of providing completion suggestion to a partial linguistic element
JP5768492B2 (en) Information processing apparatus, information processing method, and program
JPWO2012096388A1 (en) Unexpectedness determination system, unexpectedness determination method, and program
JP2014197300A (en) Text information processor, text information processing method, and text information processing program
JP2018504686A (en) Method and apparatus for processing search data
JP6664599B2 (en) Ambiguity evaluation device, ambiguity evaluation method, and ambiguity evaluation program
US20190019094A1 (en) Determining suitability for presentation as a testimonial about an entity
JP2013003663A (en) Information processing apparatus, information processing method, and program
JP5427694B2 (en) Related content presentation apparatus and program
Arguello et al. Using query performance predictors to reduce spoken queries
JP5277090B2 (en) Link creation support device, link creation support method, and program
JP6163143B2 (en) Information providing apparatus, information providing method, and information providing program
CN111460177A (en) Method and device for searching film and television expression, storage medium and computer equipment
JP5364529B2 (en) Dictionary registration device, document label determination system, and dictionary registration program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20120229

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130423

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130425

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130520

R150 Certificate of patent or registration of utility model

Ref document number: 5277090

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees