JP2011048558A - Device and method for generating task model - Google Patents
Device and method for generating task model Download PDFInfo
- Publication number
- JP2011048558A JP2011048558A JP2009195567A JP2009195567A JP2011048558A JP 2011048558 A JP2011048558 A JP 2011048558A JP 2009195567 A JP2009195567 A JP 2009195567A JP 2009195567 A JP2009195567 A JP 2009195567A JP 2011048558 A JP2011048558 A JP 2011048558A
- Authority
- JP
- Japan
- Prior art keywords
- task
- domain
- search pattern
- character string
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、ネットワーク上のコンテンツなどのサービスにアクセスするためのタスクモデルを生成するタスクモデル生成装置およびタスクモデル生成方法に関する。 The present invention relates to a task model generation apparatus and a task model generation method for generating a task model for accessing a service such as content on a network.
従来、携帯端末のユーザが、ネットワーク上で提供される各種サービスを利用して問題解決を行うための手法として、ディレクトリ検索やキーワード検索などの検索手法が存在する。このような検索手法では、問題の解決に適用可能なサービスを利用者自身が検索する必要がある。この検索のためには、利用者は、一般的なカテゴリにより分類されたディレクトリ階層やキーワード検索により得られた情報の一覧から、候補を抽出してその内容を判定する作業を、所望の機能を有するサービスが見つけるまで繰り返す必要があった。 2. Description of the Related Art Conventionally, there are search methods such as directory search and keyword search as a method for a mobile terminal user to solve problems using various services provided on a network. In such a search method, the user needs to search for a service applicable to solving the problem. For this search, the user selects a candidate from a directory hierarchy classified by a general category or a list of information obtained by keyword search, and determines the content of the candidate. Had to repeat until a service to have was found.
しかしながら、携帯端末には、通常のPCと比較して、表示、通信などの処理能力が低く、またテンキーによる文字入力のためその入力操作が容易でない、といった制限がある。かかる制限は、各種サービスが提供する機能を利用者が検証する上で、大きな負担となる。このため、ネットワーク上にどのようなサービスが存在するのかを事前に把握していない利用者が、問題解決に適用可能なサービスを自ら発見することは困難であった。このような難点を解決するため、特許文献1では、利用者に必要になると予想される問題と、その問題を解決する過程で生じるサブ問題とをサーバ側に予め用意しておき、これらの問題を解決可能なサービスにナビゲートしている。 However, the mobile terminal has limitations such as low processing capability for display, communication, and the like compared to a normal PC, and that the input operation is not easy due to character input using the numeric keypad. Such a restriction is a heavy burden for the user to verify the functions provided by various services. For this reason, it is difficult for a user who does not know in advance what kind of service exists on the network to find a service applicable to problem solving. In order to solve such difficulties, in Patent Document 1, a problem that is expected to be required by the user and a sub-problem generated in the process of solving the problem are prepared in advance on the server side. Navigate to a service that can solve the problem.
ところで、特許文献1では、ユーザが手動で問題の構造を分析し、問題のモデル(以下、タスクモデル)を構築しているが、未知の新しい場所やテーマ(ドメイン)においてタスクモデルを構築するためには専門家による長時間の構築・精査が必要である。なお、タスクモデルとは、ユーザが実世界で抱える問題の構造を分析し、ユーザの問題の解決行動(タスク)を構造化したデータベースである。タスクモデルでは、実世界の場所(ドメイン)ごとに、その場所に関連して発生するタスクがツリー状に構造化されている。映画館ドメインにおける実世界行動モデルの一部を図15に示す。タスク間の関係は達成関係is-achieved-byで表現されている。上位のタスクではユーザの抽象的な要求や問題を表現しており、下位のタスクではより具体的な解決策を表現している。 By the way, in Patent Document 1, a user manually analyzes a problem structure and constructs a problem model (hereinafter referred to as a task model). However, in order to construct a task model in an unknown new place or theme (domain). Requires a long period of construction and scrutiny by experts. The task model is a database in which the problem structure of the user in the real world is analyzed and the problem solving action (task) of the user is structured. In the task model, for each place (domain) in the real world, tasks that occur in relation to the place are structured in a tree shape. A part of the real world behavior model in the movie theater domain is shown in FIG. The relationship between tasks is expressed as an achievement relationship is-achieved-by. The upper task expresses abstract requests and problems of the user, and the lower task expresses more specific solutions.
例えば、図15では、デパートをドメインとして、そのドメイン(デパート)に対する抽象的な要求として、デパートを選ぶ、商品を買う、デパートに行くなどが上位のタスクとしてあげられる。また、下位のタスクとして、セール情報を調べる、営業日時を調べるなどがあり、さらに下位のタスクでは、イベント情報を調べる、休業日を調べるなどがあげられる。 For example, in FIG. 15, a department store is a domain, and an abstract request for the domain (department store) includes selecting a department store, buying a product, going to a department store, and the like as higher-level tasks. In addition, the subordinate tasks include checking sale information and checking the business date and time, and in the subordinate tasks, checking event information and checking closed days.
そこで、上述の課題を解決するために、本発明は、自動的にタスクモデルを構築することができるタスクモデル生成装置およびタスクモデル生成方法を提供することを目的とする。 Therefore, in order to solve the above-described problems, an object of the present invention is to provide a task model generation device and a task model generation method that can automatically construct a task model.
上述課題を解決するために、本発明のタスクモデル生成装置は、ユーザから文字列の入力を受け付ける入力手段と、前記入力手段により受け付けられた入力文字列を含んだ検索パターンを生成するドメインタスク検索パターン生成手段と、前記ドメインタスク検索パターン生成手段により生成された検索パターンを含んだWebページを検索するドメインタスク検索手段と、前記ドメインタスク検索手段により検索されたWebページから、前記検索パターンで示される検索パターン文字列、および当該検索パターン文字列に結びついて動作を表す動作文字列を含んだ一連の文字列をドメインタスクとして抽出するドメインタスク抽出手段と、前記ドメインタスク抽出手段により抽出されたドメインタスクおよび当該ドメインタスクを含んだWebページのアクセス先情報を対応付けてタスクモデルとして記憶する記憶手段とを備えている。 In order to solve the above-described problems, a task model generation device according to the present invention includes an input unit that receives an input of a character string from a user and a domain task search that generates a search pattern including the input character string received by the input unit. A pattern generation unit, a domain task search unit that searches for a Web page including the search pattern generated by the domain task search pattern generation unit, and a Web page searched by the domain task search unit. Search pattern character string, a domain task extraction unit that extracts a series of character strings including an operation character string that represents an operation in association with the search pattern character string, and a domain extracted by the domain task extraction unit Task and domain task included And a storage means for storing as a task model in association with the access destination information eb page.
また、本発明のタスクモデル生成方法は、ユーザから文字列の入力を受け付ける入力ステップと、前記入力ステップにより受け付けられた入力文字列を含んだ検索パターンを生成するドメインタスク検索パターン生成ステップと、前記ドメインタスク検索パターン生成ステップにより生成された検索パターンを含んだWebページを検索する検索ステップと、前記検索ステップにより検索されたWebページから、前記検索パターンで示される検索パターン文字列、および当該検索パターン文字列に結びついて動作を表す動作文字列を含んだ一連の文字列をドメインタスクとして抽出するドメインタスク抽出ステップと、前記ドメインタスク抽出ステップにより抽出されたドメインタスクおよび当該ドメインタスクを含んだWebページのアクセス先情報を対応付けてタスクモデルとして記憶手段に記憶する記憶ステップとを備えている。 Further, the task model generation method of the present invention includes an input step for receiving an input of a character string from a user, a domain task search pattern generation step for generating a search pattern including the input character string received by the input step, A search step for searching for a Web page including the search pattern generated by the domain task search pattern generation step, a search pattern character string indicated by the search pattern from the Web page searched by the search step, and the search pattern A domain task extraction step for extracting a series of character strings including an operation character string connected to a character string and representing an operation as a domain task, a domain task extracted by the domain task extraction step, and a web page including the domain task No And a storage step of storing in the storage means as a task model in association with Seth destination information.
この構成により、ユーザから受け付けられた入力文字列を含んだ検索パターンを生成し、生成された検索パターンを含んだWebページを検索し、検索されたWebページから、検索パターンで示される検索パターン文字列、および当該検索パターン文字列に結びついて動作を表す動作文字列を含んだ一連の文字列をドメインタスクとして抽出する。抽出されたドメインタスクおよび当該ドメインタスクを含んだWebページのアクセス先情報を対応付けてタスクモデルとして記憶する。これにより、ユーザの行動支援のためのタスクモデル(データベース)を生成することができる。例えば、従来手作業等により1ヶ月程度かかっていたのに対して、本発明においては数時間でタスクモデルを構築することが期待できる。 With this configuration, a search pattern including an input character string received from a user is generated, a Web page including the generated search pattern is searched, and a search pattern character indicated by the search pattern is searched from the searched Web page. A sequence and a series of character strings including an operation character string representing an operation in association with the search pattern character string are extracted as a domain task. The extracted domain task and the access destination information of the Web page including the domain task are associated with each other and stored as a task model. Thereby, the task model (database) for user's action support can be generated. For example, it can be expected that a task model is constructed in a few hours in the present invention, whereas it takes about one month due to manual work or the like.
また、本発明のタスクモデル生成装置において、前記ドメインタスク検索パターン生成手段は、前記入力手段により受け付けられた入力文字列に連結することで動作を表す語句に結びつけるための助詞を、前記入力文字列の後ろに連結して検索パターンを生成することが好ましい。 Further, in the task model generation device of the present invention, the domain task search pattern generation unit includes a particle for linking to an input character string received by the input unit to be connected to a word representing an action, and the input character string It is preferable to generate a search pattern by concatenating the back of the search pattern.
この構成により、受け付けられた入力文字列に連結することで動作を表す語句に結びつけるための助詞を、入力文字列の後ろに連結して検索パターンを生成することができる。これにより、ユーザの行動を支援するための文字列を的確に表すことができ、そのためのタスクモデルを生成することができる。 With this configuration, it is possible to generate a search pattern by concatenating a particle, which is linked to a word representing an action by connecting to an accepted input character string, behind the input character string. Thereby, the character string for supporting a user's action can be represented exactly, and the task model for it can be produced | generated.
また、本発明のタスクモデル生成装置において、前記ドメインタスク検索パターン生成手段は、助詞“を”を前記入力文字列の後ろに連結して、検索パターンを生成することが好ましい。 In the task model generation device of the present invention, it is preferable that the domain task search pattern generation unit generates a search pattern by connecting the particle “” to the end of the input character string.
この構成により、助詞“を”を入力文字列の後ろに連結して、検索パターンを生成することができ、ユーザの行動を支援するための文字列を的確に表すことができ、そのためのタスクモデルを生成することができる。 With this configuration, it is possible to generate a search pattern by connecting the particle "" to the back of the input character string, and to accurately represent the character string for supporting the user's action, and a task model for that purpose. Can be generated.
また、本発明のタスクモデル生成装置において、前記ドメインタスク抽出手段は、係り受け解析を行うことで、前記入力文字列に対応する動作文字列を判断し、前記検索パターンおよび前記動作文字列を含んだ一連の文字列を抽出することが好ましい。 In the task model generation device of the present invention, the domain task extraction unit performs dependency analysis to determine an operation character string corresponding to the input character string, and includes the search pattern and the operation character string. It is preferable to extract a series of character strings.
この構成により、係り受け解析を行うことで、入力文字列に対応する動作文字列を判断し、検索パターンおよび動作文字列を含んだ一連の文字列を抽出することができる。これにより、ユーザの行動を支援するための文字列を的確に表すことができ、そのためのタスクモデルを生成することができる。すなわち、文字のパターンマッチングによらず、文章としても意味を考慮した文字列の抽出を行うことで、より的確なタスクモデルを構築することができる。 With this configuration, by performing dependency analysis, it is possible to determine an operation character string corresponding to an input character string and extract a series of character strings including a search pattern and an operation character string. Thereby, the character string for supporting a user's action can be represented exactly, and the task model for it can be produced | generated. In other words, a more accurate task model can be constructed by extracting a character string considering the meaning of a sentence, regardless of character pattern matching.
また、本発明のタスクモデル生成装置において、前記ドメインタスク抽出手段は、前記検索パターンの直後に連結され、動作を表す漢字のみからなる文字列を、前記検索パターンとともにドメインタスクとして抽出することが好ましい。 In the task model generation device of the present invention, it is preferable that the domain task extraction unit extracts a character string composed of only kanji characters representing an operation as a domain task together with the search pattern. .
この構成により、検索パターンの直後に連結され、動作を表す漢字のみからなる文字列を、検索パターンとともにドメインタスクとして抽出することにより、助詞を用いることなく、ユーザの行動を支援するための文字列を的確に表すことができ、そのためのタスクモデルを生成することができる。 With this configuration, a character string that is connected immediately after the search pattern and consists of only kanji characters representing an action is extracted as a domain task together with the search pattern, thereby supporting a user's action without using a particle. Can be accurately represented, and a task model for that can be generated.
また、本発明のタスクモデル生成装置は、前記ドメインタスク抽出手段により抽出されたドメインタスクであるドメインタスク文字列に対して、当該ドメインタスク文字列で示される動作を修飾するための修飾語に連結させるための連結文字列を付加した包含タスク検索パターンを生成する包含タスク検索パターン生成手段、をさらに備え、前記ドメインタスク検索手段は、前記包含タスク検索パターン生成手段により生成された包含タスク検索パターンを含んだWebページを検索し、前記ドメインタスク抽出手段は、前記包含タスク検索パターンに修飾語を示す修飾文字列が連結された包含タスク文字列を抽出することが好ましい。 In addition, the task model generation device of the present invention connects a domain task character string, which is a domain task extracted by the domain task extraction unit, to a modifier for modifying an operation indicated by the domain task character string. An included task search pattern generating means for generating an included task search pattern to which a concatenated character string to be added is added, wherein the domain task search means uses the included task search pattern generated by the included task search pattern generating means. It is preferable that the contained Web page is searched, and the domain task extraction unit extracts an included task character string in which a modifier character string indicating a modifier is connected to the included task search pattern.
この構成により、ドメインタスクであるドメインタスク文字列に対して、当該ドメインタスク文字列で示される動作を修飾するための修飾語に連結させるための連結文字列を付加した包含タスク検索パターンを生成し、生成された包含タスク検索パターンを含んだWebページを検索し、包含タスク検索パターンに修飾語を示す修飾文字列が連結された包含タスク文字列を抽出することができる。これにより、ドメインタスクを包含するタスクを取得することができ、ユーザ支援のための行動をさらに細分化して支援することができる。 With this configuration, an inclusive task search pattern is generated by adding a concatenated character string for concatenating a domain task character string that is a domain task to a modifier for modifying the operation indicated by the domain task character string. Then, the generated Web page including the included task search pattern is searched, and the included task character string in which the modifier character string indicating the modifier is connected to the included task search pattern can be extracted. As a result, tasks including domain tasks can be acquired, and actions for user support can be further subdivided and supported.
また、本発明のタスクモデル生成装置は、前記入力文字列と前記動作文字列との関連度合いを示す共起度を計算するドメイン共起度計算手段をさらに備え、前記ドメインタスク抽出手段は、前記ドメイン共起度計算手段による計算結果に基づいて、所定値以上の共起度を有するドメインタスクを抽出することが好ましい。 The task model generation device of the present invention further includes a domain co-occurrence degree calculating unit that calculates a co-occurrence degree indicating a degree of association between the input character string and the action character string, and the domain task extracting unit includes the domain task extracting unit, It is preferable to extract a domain task having a co-occurrence degree equal to or greater than a predetermined value based on the calculation result by the domain co-occurrence degree calculating means.
この構成により、入力文字列と動作文字列との関連度合いを示す共起度を計算し、この計算結果に基づいて、所定値以上の共起度を有するドメインタスクを抽出することができる。これにより、関連度合いの大きい文字列を結びつけることができ、ユーザに対してより的確な行動支援をすることができ、また関係のあまり無いWebページを除去することができる。 With this configuration, it is possible to calculate the co-occurrence degree indicating the degree of association between the input character string and the action character string, and to extract a domain task having a co-occurrence degree equal to or greater than a predetermined value based on the calculation result. As a result, character strings having a high degree of association can be linked, more accurate action support can be provided to the user, and unrelated web pages can be removed.
また、本発明のタスクモデル生成装置は、前記ドメインタスクと前記修飾文字列との関連度合いを示す共起度を計算する包含タスク共起度計算手段をさらに備え、前記ドメインタスク抽出手段は、前記包含タスク共起度計算手段による計算結果に基づいて、所定値以上の共起度を有する包含タスクを抽出することが好ましい。 The task model generation device of the present invention further includes an inclusion task co-occurrence degree calculating means for calculating a co-occurrence degree indicating a degree of association between the domain task and the modifier character string, and the domain task extracting means includes the It is preferable to extract an inclusion task having a co-occurrence degree equal to or greater than a predetermined value based on the calculation result by the inclusion task co-occurrence degree calculation means.
この構成により、ドメインタスクと修飾文字列との関連度合いを示す共起度を計算し、計算結果に基づいて、所定値以上の共起度を有する包含タスクを抽出することができる。これにより、関連度合いの大きい文字列を結びつけることができ、ユーザに対してより的確な行動支援をすることができ、また関係のあまり無いWebページを除去することができる。 With this configuration, it is possible to calculate the co-occurrence degree indicating the degree of association between the domain task and the modification character string, and to extract an inclusion task having a co-occurrence degree equal to or greater than a predetermined value based on the calculation result. As a result, character strings having a high degree of association can be linked, more accurate action support can be provided to the user, and unrelated web pages can be removed.
また、本発明のタスクモデル生成装置は、ユーザから文字列の入力を受け付ける入力手段と、前記入力手段により受け付けられた入力文字列を含んだ検索パターンを生成するサブドメイン検索パターン生成手段と、前記サブドメイン検索パターン生成手段により生成された検索パターンを含んだWebページを検索するサブドメイン検索手段と、前記ドメインタスク検索手段により検索されたWebページから、前記検索パターンに結びついている名詞文字列からなる一連の文字列をサブドメインとして抽出するサブドメイン抽出手段と、前記サブドメイン抽出手段により抽出されたサブドメインを示すサブドメイン文字列から関連タスクの検索パターンとして生成する関連タスク検索パターン生成手段と、前記関連タスク検索パターン生成手段により生成された検索パターンを含んだWebページを検索する関連タスク検索手段と、前記関連タスク検索手段により検索されたWebページから、前記検索パターン文字列および当該検索パターン文字列に結びついている動作を表す動作文字列からなる一連の文字列を関連タスクとして抽出する関連タスク抽出手段と、前記関連タスク抽出手段により抽出された関連タスクおよび当該関連タスクを含んだWebページのアクセス先情報を対応付けて記憶する記憶手段とを備えている。 In addition, the task model generation device of the present invention includes an input unit that receives an input of a character string from a user, a subdomain search pattern generation unit that generates a search pattern including an input character string received by the input unit, From a sub-domain search means for searching a Web page including a search pattern generated by the sub-domain search pattern generation means, and from a noun character string linked to the search pattern from the Web page searched by the domain task search means Subdomain extraction means for extracting a series of character strings as subdomains, and related task search pattern generation means for generating as a related task search pattern from a subdomain character string indicating a subdomain extracted by the subdomain extraction means; , Related task search pattern generation Related task search means for searching for a Web page including the search pattern generated by the stage, and operations associated with the search pattern character string and the search pattern character string from the Web page searched by the related task search means The related task extracting means for extracting a series of character strings consisting of action character strings representing the related task, the related task extracted by the related task extracting means, and the access destination information of the Web page including the related task are associated with each other. Storage means for storing the information.
また、本発明のタスクモデル生成方法は、ユーザから文字列の入力を受け付ける入力ステップと、前記入力ステップにより受け付けられた入力文字列を含んだ検索パターンを生成するサブドメイン検索パターン生成ステップと、前記サブドメイン検索パターン生成ステップにより生成された検索パターンを含んだWebページを検索するサブドメイン検索ステップと、前記サブドメイン検索ステップにより検索されたWebページから、前記検索パターンに結びついている名詞文字列からなる一連の文字列をサブドメインとして抽出するサブドメイン抽出ステップと、前記サブドメイン抽出ステップにより抽出されたサブドメインを示すサブドメイン文字列を関連タスクの検索パターンとして生成する関連タスク検索パターン生成ステップと、前記関連タスク検索パターン生成ステップにより生成された検索パターンを含んだWebページを検索する関連タスク検索ステップと、前記関連タスク検索ステップにより検索されたWebページから、前記検索パターン文字列および当該検索パターン文字列に結びついている動作を表す動作文字列からなる一連の文字列を関連タスクとして抽出する関連タスク抽出ステップと、前記関連タスク抽出ステップにより抽出された関連タスクおよび当該関連タスクを含んだWebページのアクセス先情報を対応付けて記憶手段に記憶する記憶ステップとを備えている。 In addition, the task model generation method of the present invention includes an input step of receiving a character string input from a user, a subdomain search pattern generation step of generating a search pattern including the input character string received by the input step, From a sub-domain search step for searching a Web page including a search pattern generated by the sub-domain search pattern generation step, and from a noun character string linked to the search pattern from the Web page searched by the sub-domain search step A subdomain extraction step for extracting a series of character strings as subdomains, and a related task search pattern generation step for generating a subdomain character string indicating the subdomain extracted by the subdomain extraction step as a search pattern for the related tasks; A related task search step for searching a Web page including the search pattern generated by the related task search pattern generation step, and the search pattern character string and the search pattern character from the Web page searched by the related task search step A related task extraction step for extracting a series of character strings composed of operation character strings representing operations connected to the column as related tasks, a related task extracted by the related task extraction step, and a Web page including the related tasks A storage step of associating the access destination information with the storage means.
この構成により、ユーザから文字列の入力を受け付けられた入力文字列を含んだ検索パターンを生成し、生成された検索パターンを含んだWebページを検索する。そして、検索されたWebページから、前記検索パターンに結びついている名詞文字列からなる一連の文字列をサブドメインとして抽出し、抽出されたサブドメインを示すサブドメイン文字列を検索パターンとして生成する。生成された検索パターンを含んだWebページを検索し、検索されたWebページから、検索パターン文字列および当該検索パターン文字列に結びついている動作を表す動作文字列からなる一連の文字列を関連タスクとして抽出する。抽出された関連タスクおよび当該関連タスクを含んだWebページのアクセス先情報を対応付けて記憶する。これにより、ユーザの行動支援のためのタスクモデル(データベース)を生成することができる。例えば、従来手作業等により1ヶ月程度かかっていたのに対して、本発明においては数時間でタスクモデルを構築することが期待できる。 With this configuration, a search pattern including an input character string that is accepted by the user as a character string is generated, and a Web page including the generated search pattern is searched. Then, a series of character strings composed of noun character strings linked to the search pattern is extracted as subdomains from the searched Web page, and a subdomain character string indicating the extracted subdomain is generated as a search pattern. A search is made for a Web page including the generated search pattern, and a series of character strings consisting of a search pattern character string and an operation character string representing an operation linked to the search pattern character string are searched from the searched Web page. Extract as The extracted related task and the access destination information of the Web page including the related task are stored in association with each other. Thereby, the task model (database) for user's action support can be generated. For example, it can be expected that a task model is constructed in a few hours in the present invention, whereas it takes about one month due to manual work or the like.
また、本発明のタスクモデル生成装置は、前記入力手段により受け付けられた入力文字列を含んだ検索パターンを生成するドメインタスク検索パターン生成手段と、前記ドメインタスク検索パターン生成手段により生成された検索パターンを含んだWebページを検索するドメインタスク検索手段と、前記ドメインタスク検索手段により検索されたWebページから、前記検索パターンで示される検索パターン文字列、および当該検索パターン文字列に結びついて動作を表す動作文字列を含んだ一連の文字列をドメインタスクとして抽出するドメインタスク抽出手段と、備え、前記記憶手段は、前記ドメインタスク抽出手段により抽出されたドメインタスクおよび当該ドメインタスクを含んだWebページのアクセス先情報を対応付けてタスクモデルとして記憶するタスクモデル生成装置であって、さらに、予め定められた文字列からなるドメインタスクと関連タスクとの関連度合いを示す共起度を計算する関連タスク共起度計算手段と、前記関連タスク共起度計算手段により計算された共起度に基づいて、関連タスクとドメインタスクとの関連付けを行う関連付け処理手段とを備えることが好ましい。 The task model generation device of the present invention includes a domain task search pattern generation unit that generates a search pattern including an input character string received by the input unit, and a search pattern generated by the domain task search pattern generation unit. A domain task search means for searching for a Web page including the search pattern character string, a search pattern character string indicated by the search pattern from the Web page searched by the domain task search means, and an operation associated with the search pattern character string A domain task extraction unit that extracts a series of character strings including an operation character string as a domain task, and the storage unit includes a domain task extracted by the domain task extraction unit and a Web page including the domain task. Matching access destination information A task model generation device for storing as a model, the related task co-occurrence degree calculating means for calculating a co-occurrence degree indicating a degree of association between a domain task consisting of a predetermined character string and the related task; It is preferable to include association processing means for associating the related task with the domain task based on the co-occurrence degree calculated by the task co-occurrence degree calculating means.
この構成により、予め定められた文字列からなるドメインタスクと関連タスクとの関連度合いを示す共起度を計算し、計算された共起度に基づいて、関連タスクとドメインタスクとの対応付けを行う。これにより、関連タスクを、より関連どの高いドメインタスクに対応付けることができ、ユーザの行動支援をより的確に行うことができる。 With this configuration, the co-occurrence degree indicating the degree of association between the domain task consisting of a predetermined character string and the related task is calculated, and the association between the related task and the domain task is performed based on the calculated co-occurrence degree. Do. As a result, the related task can be associated with a higher related domain task, and the user's action support can be performed more accurately.
本発明によれば、ユーザの行動支援のためのタスクモデル(データベース)を生成することができる。例えば、従来手作業等により1ヶ月程度かかっていたのに対して、本発明においては数時間でタスクモデルを構築することが期待できる。 ADVANTAGE OF THE INVENTION According to this invention, the task model (database) for a user's action assistance can be produced | generated. For example, it can be expected that a task model is constructed in a few hours in the present invention, whereas it takes about one month due to manual work or the like.
添付図面を参照しながら本発明の実施形態を説明する。可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。 Embodiments of the present invention will be described with reference to the accompanying drawings. Where possible, the same parts are denoted by the same reference numerals, and redundant description is omitted.
図1は、本実施形態のタスクモデル生成装置100を含んだ通信システム10のシステム構成を示すシステム構成図である。この通信システム10は、タスクモデル生成装置100および検索エンジン200を含んで構成されている。この通信システム10においては、タスクモデル生成装置100は、検索エンジン200を利用して、所定の文字列を含んだWebページを検索し、検索したWebページを所定の文字列であるドメインタスクと対応付けたタスクモデルとして記憶するものである。
FIG. 1 is a system configuration diagram showing a system configuration of a communication system 10 including a task
つぎに、このタスクモデル生成装置100について説明する。図2は、タスクモデル生成装置100の機能を示すブロック図である。図2に示されるとおり、タスクモデル生成装置100は、ドメイン指定部101(入力手段)、ドメインタスク検索パターン生成部102(ドメインタスク検索パターン生成手段)、包含タスク検索パターン生成部103(包含タスク検索パターン生成手段)、Web検索部106(ドメインタスク検索手段)、検索パターンマッチング部107(ドメインタスク抽出手段)、共起度計算部108(ドメイン共起度計算手段、包含タスク共起度計算手段)、タスクモデル生成部109および記憶部110(記憶手段)を含んで構成されている。
Next, the task
このタスクモデル生成装置100は、図3に示すとおり、CPU、RAM等からのハードウェアにより実現される。図3は、タスクモデル生成装置100のハードウェア構成図である。図2に示されるタスクモデル生成装置100は、物理的には、図3に示すように、CPU11、主記憶装置であるRAM12及びROM13、入力デバイスであるキーボード及びマウス等の入力装置14、ディスプレイ等の出力装置15、ネットワークカード等のデータ送受信デバイスである通信モジュール16、ハードディスク等の補助記憶装置17などを含むコンピュータシステムとして構成されている。図2において説明した各機能は、図3に示すCPU11、RAM12等のハードウェア上に所定のコンピュータソフトウェアを読み込ませることにより、CPU11の制御のもとで入力装置14、出力装置15、通信モジュール16を動作させるとともに、RAM12や補助記憶装置17におけるデータの読み出し及び書き込みを行うことで実現される。以下、図2に示す機能ブロックに基づいて、各機能ブロックを説明する。
As shown in FIG. 3, the task
ドメイン指定部101は、タスクモデル生成装置100のオペレータからのドメインとなる文字列(入力文字列)の入力を受け付ける部分である。例えば、図14の例では、“デパート”がドメインに相当するものである。このドメインは、学習するタスクモデルの領域を定めるための文字列であり、ユーザの行動を支援するためのタスクモデルの中核を示す部分である。
The
ドメインタスク検索パターン生成部102は、ドメイン指定部101により入力されたドメインを示す入力文字列に基づいて検索パターンを生成する部分である。例えば、ドメインタスク検索パターン生成部102は、ドメイン直下のタスクであるドメインタスクを取得するための検索パターンを生成するものであり、「ドメイン+助詞」からなる検索パターンを生成する。助詞として代表的なものは、“の”“で”“を”“は”等があるが、ここでは“を”が、検索パターンを構成する助詞として選択される。ドメインタスク検索パターン生成部102は、例えば「映画を」を検索パターンとし、後述するWeb検索部106は、「映画を」を含んだWebページを検索することができる。これにより、例えば「映画を観る」「映画を作る」といったドメインタスクを取得することができる。ドメインタスクとは、ユーザの行動を示す文字列であり、ユーザの動作を示す動詞または動作を示す名詞を含んだものである。
The domain task search
Web検索部106は、検索エンジン200にアクセスして、ドメインタスク検索パターン生成部102により生成された検索パターンを用いて検索を行う部分である。例えば、Web検索部106は、ドメインタスク検索パターン生成部102により生成された“映画を”という文字列からなる検索パターンを検索エンジン200に検索させる部分である。
The
検索パターンマッチング部107は、Web検索部106により検索されたWebページのスニペット(検索結果)から、予め定められた語彙統語パターンに合致するドメインタスク(文字列)を抽出する部分である。例えば、検索パターンマッチング部107は、語彙統語パターンとして、「ドメイン“映画”+助詞“を”+動詞」が設定された場合、「“映画を”+動詞」を構成する文章(タスク(動詞を示す文字列))を、係り受け解析などを利用して、を抽出する。これにより検索パターンマッチング部107は、“映画を観る”、“映画を作る”などのドメインタスク(文字列)を含んだWebページをタスクモデルとして抽出することができる。なお、ここでは公知技術である係り受け解析を行うことにより、“映画を観る”などのように一連の文字列のみ抽出することなく、例えば“映画を映画館で観る”などの文字列をも抽出することができる。
The search
なお、語彙統語パターン(lexico - syntactic patterns)は、大規模なテキストコーパスから知識を抽出する代表的な手法であって、ある特定の表現から上位下位関係(Hyponymy Relation)や、概念具体物関係(concept-instance relation)を得る手法として幅広く利用されている(以下、参考文献を参照)。
[参考文献1]
[1]Philipp Cimiano: Ontology Learning And Population from Text: Algorithms,Evaluation And Applications, Springer-Verlag, 2006.
[参考文献2]
[2] DavidSanchez: Domain Ontology Learning from the Web, VDM Verlag, 2008.
Note that lexico-syntactic patterns (lexico-syntactic patterns) is a typical technique for extracting knowledge from a large-scale text corpus. From a specific expression, lexico-syntactic patterns (Hyponymy Relation) and conceptual concrete relationship ( It is widely used as a method for obtaining concept-instance relations (see references below).
[Reference 1]
[1] Philipp Cimiano: Ontology Learning And Population from Text: Algorithms, Evaluation And Applications, Springer-Verlag, 2006.
[Reference 2]
[2] David Sanchez: Domain Ontology Learning from the Web, VDM Verlag, 2008.
このドメインタスク検索パターン生成部102および検索パターンマッチング部107に関して、以下の通りの変形例もあり得る。すなわち、上述の例では、助詞を用いることを前提としていたが、必ずしも助詞は必要とはしない。例えば、ドメインを“映画”とした場合、検索パターンを“映画”として、語彙統語パターンを“ドメイン+動作を表す漢字のみからなる名詞(例えば、鑑賞や、製作)”とする場合、ドメインタスク検索パターン生成部102は、ドメインをそのまま検索パターンとし、また、検索パターンマッチング部107は、語彙統語パターンに従って、ドメイン(例えば、“映画”)に動作を表す名詞が付加されている一連の文字列を抽出するようにしてもよい。
Regarding the domain task search
共起度計算部108は、ドメイン指定部101により指定されたドメインを示す文字列と、検索パターンマッチング部107により抽出された語彙統語パターンにおけるタスク(動詞部分の文字列)との関連度合いを示す共起度を計算する部分である。検索パターンマッチング部107による処理のみでは、ノイズが含まれるため、共起度の計算を行うことにより、適切な概念のみをフィルタリングしようとするものである。ここで共起度の計算とは、以下の参考文献3により提案された概念間の上位下位関係をWebページの検索数から判定する手法である。下位概念Bの上位概念Aとの包含の度合いを示す評価値(Score)は次式で表される。
ここで、Hits(X)とは、検索エンジンに文字列Xを入力したときの検索数である。
[参考文献3]
[3]P.D.Turney: Mining the Web for Synonyms: PMI-IR versus LSA on TOEFL, ECML2001,pages 491-502, 2001.
The co-occurrence
Here, Hits (X) is the number of searches when the character string X is input to the search engine.
[Reference 3]
[3] PDTurney: Mining the Web for Synonyms: PMI-IR versus LSA on TOEFL, ECML2001, pages 491-502, 2001.
例えば、共起度計算部108は、“映画”と“作る”との共起度を計算したい場合には、“映画”を含んだWebページの検索数、“作る”を含んだWebページの検索数に基づいて、共起度を算出する。そして、タスクモデル生成部109がこれら閾値T以上であると判断する場合には、それら2つの文字列は関連度合いが大きいものとして扱われ、ドメインタスクとして用いる。
For example, when the co-occurrence
タスクモデル生成部109は、検索パターンマッチング部107により抽出されたドメインタスクのうち、共起度計算部108により計算された共起度が閾値T以上となるものをタスクモデルとして、記憶部110に記憶させる部分である。例えば、この閾値Tは、経験則上0.00001とすることが好ましい。
The task
さらに、タスクモデル生成部109は、生成したドメインタスクを示すドメインタスク文字列を包含タスク検索パターン生成部103に出力する。包含タスク検索パターン生成部103における処理については後述する。
Further, the task
記憶部110は、タスクモデル生成部109により生成されたタスクモデルを記憶する部分である。例えば、記憶部110は、図13に示される管理テーブルであって、タスクID、タスク名、親タスクIDを対応付けて記憶する部分である。図13では、タスクID:1001にはタスク名:“映画を観る”、その親タスクID:0が記述されており、これはドメインタスクであることを示している。また、タスクID:1002、タスク名:“映画館で映画を観る”、親タスクID:1001と記述されている部分については、親タスクID:1001である、タスク名“映画を観る”の下層に配置されるものであり、包含タスクを示す部分である。なお、図13においては、図示していないが、タスクごとにWebページにアクセスするためのURLが対応付けられている。
The
なお、これらタスクIDは、タスクモデル生成部109にて、ユニークとなるように付与されるものであり、また親タスクIDは、ドメインタスクと包含タスクとの関連付けを行う際に、対応するドメインタスクのタスクIDが包含タスクの親タスクID欄に付与されるものである。
These task IDs are assigned uniquely by the task
この記憶部110に記憶されている情報を用いて、ユーザ(携帯端末300)は、図14に示されるとおりの画面表示を行うことができる。すなわち、この記憶部110に記憶されている情報に対してアクセスしたユーザ(携帯端末300)は、この画面302を見ながら、ポインタ303を操作し、サービス取得ボタン301を押下することにより、ドメインタスク、包含タスクまたは関連タスク等に関連付けられているWebページにアクセスすることができる。よって、ユーザが映画館で映画を観たい場合には、“映画館で映画を観る”という項目を選択すると、映画を観ることに関するWebページの一覧表が表示され、さらにユーザはその中から一つを選択することにより、Webページの閲覧を可能にする。
Using the information stored in the
図4に、ドメインタスクを抽出する過程を示す。図4では、ドメインタスク取得のための検索用パターン、その検索エンジンに入力される入力例、その検索結果、および共起度計算結果の一例を示す。図4に示されるように、ここでは、検索パターンとして、“映画を”が生成され、この文字列が検索エンジン200に入力され、検索処理が行われる。そして、検索結果として、スニペットには、“映画を”の文字列が太字で強調されたスニペットが得られる。図4では、検索結果は1件しか記載していないが、通常何万もの検索結果が得られるものである。
FIG. 4 shows a process of extracting a domain task. FIG. 4 shows an example of a search pattern for domain task acquisition, an input example input to the search engine, a search result, and a co-occurrence degree calculation result. As shown in FIG. 4, here, “movie” is generated as a search pattern, and this character string is input to the
そして、この検索結果から、“映画を”につながる動詞の文字列が抽出される。ここでは“作る”が動詞の文字列として抽出される。なお、係り受け解析などを行うことにより、“作る”以外にもいくつかの動詞文字列が抽出される。そして、共起度計算が行われ、ここでは、“映画”と“作る”との共起度が計算される。ここでは、“映画”および“作る”のANDの検索が行われ、また“作る”のみの検索が行われ、それぞれ、1230000件、1430000件の検索数が検索され、これに基づいて共起度が0.86と算出される。この共起度0.86は、閾値Tより大きいため、ドメインタスクとして“映画を作る”が抽出され、また、これに関連するWebページ(またはURL)がタスクモデルとしてドメインタスクと対応付けて記憶部110に記憶される。
Then, from this search result, the character string of the verb that leads to “movie” is extracted. Here, “create” is extracted as a verb string. By performing dependency analysis, several verb character strings are extracted in addition to “create”. Then, the co-occurrence degree calculation is performed, and here, the co-occurrence degree of “movie” and “make” is calculated. Here, an AND search for “movie” and “create” is performed, and a search for only “create” is performed, and the number of searches for 12.3 million and 1.43 million is retrieved, respectively. Is calculated as 0.86. Since the co-occurrence degree 0.86 is larger than the threshold value T, “create movie” is extracted as a domain task, and the Web page (or URL) related thereto is associated with the domain task as a task model and is stored in the
包含タスク検索パターン生成部103は、上述の通り取得されたドメインタスクを含んだ包含タスクを抽出するための検索パターンを生成する部分である。包含タスクとは、ドメインタスクを含んだタスクであり、「修飾語+助詞+ドメインタスク」で構成された文字列である。すなわち、包含タスクとは、ドメインタスクの下位に属した行動を示したものである。ここでは、包含タスク検索パターン生成部103は、助詞として“で”を選択して、“で映画を観る”といった検索パターンを生成し、Web検索部106は、この検索パターンを検索することができる。なお、本実施形態では、この助詞“で”のようなドメインタスクに対してその動作を修飾するための修飾語に連結させるための文字列を接続文字列と称する。
The included task search
一方、語彙統語パターンは、この包含タスクに修飾語を付加した「修飾語+包含タスク」となり、検索パターンマッチング部107は、このような語彙統語パターンを有する文字列を抽出する。なお、係り受け解析を行うことにより、検索パターンマッチング部107は、「・・・で・・・映画を観る」というように助詞“で”が離れた場合も抽出することができる。
On the other hand, the lexical syntactic pattern becomes “modifier + inclusion task” obtained by adding a modifier to the inclusion task, and the search
Web検索部106は、包含タスク検索パターン生成部103により生成された包含タスク検索パターンを含んだWebページを検索し、検索パターンマッチング部107は、予め定められた語彙統語パターンを有する文字列(修飾語+助詞+ドメインタスク)を抽出する。
The
そして、共起度計算部108は、ドメインタスクと修飾語との共起度を計算し、タスクモデル生成部109は、閾値T以上の共起度を有する包含タスクをタスクモデルとして記憶部110に記憶させる。
Then, the co-occurrence
この包含タスクの抽出について、図5を用いて説明する。図5は、包含タスクを抽出するまでの処理過程を示す説明図である。図5では、包含タスク取得用検索パターンは、“で映画を観る”が設定されている。そして、これを検索エンジンに入力して、検索結果が得られる。図4と同様に、この包含タスク取得用検索パターンに該当する文字列は太字で表されている。なお、図4と同様に、検索結果は何万ものWebページが検索される。 This inclusion task extraction will be described with reference to FIG. FIG. 5 is an explanatory diagram showing a processing process until an inclusion task is extracted. In FIG. 5, the inclusive task acquisition search pattern is set to “watch movie with”. And this is input into a search engine, and a search result is obtained. As in FIG. 4, the character string corresponding to this inclusion task acquisition search pattern is shown in bold. Similar to FIG. 4, tens of thousands of Web pages are searched as search results.
そして、共起度が計算される。図5では、“映画を観る”と“DVD”との共起度、および“映画を観る”と“映画館”との共起度がそれぞれ計算されている。 Then, the co-occurrence degree is calculated. In FIG. 5, the degree of co-occurrence between “watch movie” and “DVD” and the degree of co-occurrence between “watch movie” and “movie theater” are calculated.
つぎに、このように構成されたタスクモデル生成装置100のドメインタスクを抽出するときの処理について説明する。図7は、タスクモデル生成装置100のドメインタスクを抽出する方法を示すフローチャートである。図7に示されるとおり、オペレータによりドメイン指定部101からドメイン(文字列)が入力されて指定される(S101)。そして、ドメインタスク検索パターン生成部102によりドメインタスクを抽出するための検索パターンが生成される(S102)。
Next, a process for extracting a domain task of the task
つぎに、Web検索部106により、ドメインタスク検索パターン生成部102により生成された検索パターンを用いた検索が行われる(S103)。ここで全ての検索パターンによる検索が実行された場合(S104:YES)、当該検索パターンにマッチする文字列が、検索パターンマッチング部107により抽出される(S105)。そして、共起度計算部108によりドメインと文字列との間の関連度合いを示す共起度が計算される(S106)。そして、タスクモデル生成部109により、閾値T以上の共起度の文字列が選択され、その文字列を含んだドメインタスクが生成される(S107)。生成されたドメインタスクは、そのURLとともに、記憶部110に記憶され、ユーザによりアクセス可能に保持される(S108)。
Next, the
このようにして、指定されたドメインに基づいたドメイン検索用の検索パターンに従って該当する文字列が抽出され、その文字列を含んだドメインタスクが生成される。 In this manner, a corresponding character string is extracted according to a search pattern for domain search based on the designated domain, and a domain task including the character string is generated.
つぎに、包含タスクを生成する処理について説明する。図8は、包含タスクを生成するタスクモデル生成装置100の処理を示すフローチャートである。まず、図7に示される方法により、ドメインタスクが生成される(S201)。そして、包含タスク検索パターン生成部103により包含タスクを抽出するための検索パターンが生成される(S202)。そして、Web検索部106により、包含タスク検索パターン生成部103により生成された検索パターンを用いた検索が行われる(S203)。ここで全ての検索パターンによる検索が実行された場合(S204:YES)、当該検索パターンにマッチする文字列が、検索パターンマッチング部107により抽出され、そして語彙統語パターンに合致する文字列が抽出される(S205)。そして、共起度計算部108によりドメインタスクと文字列のうちの修飾語を示す修飾文字列との間の包含程度を示す共起度が計算される(S206)。そして、タスクモデル生成部109により、閾値T以上の共起度の修飾文字列が選択され、その修飾文字列を含んだ包含タスクが生成される(S207)。生成された包含タスクは、そのURLとともに、記憶部110に記憶され、ユーザによりアクセス可能に保持される(S208)。
Next, processing for generating an inclusion task will be described. FIG. 8 is a flowchart showing the processing of the task
このようにして、ドメインが指定され、指定されたドメインに基づいたドメインタスクが抽出され、さらにこのドメインタスクを包含する包含タスクが抽出される。図6に、ドメイン、ドメインタスク、包含タスクの関連性を示す模式図を示す。図6に示されるとおり、ドメインとして“映画”が指定され、このドメインに基づいて、ドメインタスクとして“映画を観る”、“映画に出演する”、“映画を作る”が抽出される。さらに、“映画を観る”に包含される包含タスクとして、“映画館で映画を観る”、“家で映画を観る”、“字幕で映画を観る”、“TVで映画を観る”が抽出される。このようにして、ドメイン、ドメインタスク、包含タスクが関連付けられ、ユーザの行動を支援可能にするための、タスクモデルを生成することができる。 In this way, a domain is specified, a domain task based on the specified domain is extracted, and an inclusion task that includes this domain task is extracted. FIG. 6 is a schematic diagram showing the relationship between domains, domain tasks, and inclusion tasks. As shown in FIG. 6, “movie” is designated as a domain, and “watch movie”, “appear in movie”, and “create movie” are extracted as domain tasks based on this domain. In addition, “watch movie at cinema”, “watch movie at home”, “watch movie with subtitles”, “watch movie on TV” are extracted as inclusion tasks included in “watch movie” The In this way, a task model for associating a domain, a domain task, and an inclusion task and making it possible to support user behavior can be generated.
つぎに、ドメインタスクに関連する関連タスクについて説明する。この関連タスクは、ドメインを含んだ文字列のうち、ドメインタスクに関連の深いタスクである。例えば、ドメインが“映画”、ドメインタスクが“映画を観る”とした場合に、関連タスクは、ドメインタスク“映画を観る”に関連の深い“映画のチケットを買う”である。なお、関連の深いとは、ドメインタスクと関連タスクとの共起度が所定値以上であるものとする。以下、その詳細処理について説明する。 Next, related tasks related to the domain task will be described. This related task is a task closely related to the domain task among the character strings including the domain. For example, when the domain is “movie” and the domain task is “watch movie”, the related task is “buy a movie ticket” which is closely related to the domain task “watch movie”. Note that deeply related means that the co-occurrence degree between a domain task and a related task is a predetermined value or more. The detailed processing will be described below.
図9は、関連タスクを抽出するためのタスクモデル生成装置100aの機能を示すブロック図である。このタスクモデル生成装置100aは、ドメイン指定部101(入力手段)、ドメインタスク検索パターン生成部102(ドメインタスク検索パターン生成手段)、包含タスク検索パターン生成部103、Web検索部106(ドメインタスク検索手段)、検索パターンマッチング部107(ドメインタスク抽出手段)、共起度計算部108、タスクモデル生成部109、記憶部110、サブドメイン検索パターン生成部111(サブドメイン検索パターン生成手段)、Web検索部112(サブドメイン検索手段)、検索パターンマッチング部113(サブドメイン抽出手段)、関連タスク検索パターン生成部115(関連タスク検索パターン生成手段)、共起度計算部117(関連タスク共起度計算手段)、および関連付処理部118(関連付け処理手段)を含んで構成される。
FIG. 9 is a block diagram illustrating functions of the task
このタスクモデル生成装置100aは、CPU等を備えたハードウェアから構成されているものであり、例えば、図3に示されているハードウェアにより各種機能が実現される。以下、各機能ブロックの説明をする。なお、ドメイン指定部101、ドメインタスク検索パターン生成部102、包含タスク検索パターン生成部103、Web検索部106、検索パターンマッチング部107、共起度計算部108、タスクモデル生成部109、記憶部110は、タスクモデル生成装置100と同じ機能構成をとるものであり、その詳細説明は省略する。
The task
サブドメイン検索パターン生成部111は、サブドメインのための検索パターンを生成する部分である。サブドメインは、ドメイン指定部101から入力されたドメインを含んだ文字列であり、本実施形態では、「ドメイン+助詞“の”」と設定された文字列である。例えば、ドメインが“映画”である場合には、サブドメインは“映画の”となる。
The subdomain search
Web検索部112は、検索エンジン200にアクセスして、サブドメイン検索パターン生成部111により生成されたサブドメイン検索パターンに基づいて検索処理を行う部分である。例えば、Web検索部112は、サブドメイン検索パターン生成部111により生成された“映画の”という文字列からなる検索パターンを検索エンジン200に検索させる部分である。
The
検索パターンマッチング部113は、Web検索部112により検索されたWebページのスニペット(検索結果)から、予め定められた語彙統語パターンに合致するサブドメイン(文字列)を抽出する部分である。例えば、検索パターンマッチング部113は、語彙統語パターンとして、「ドメイン“映画”+助詞“の”+名詞」が設定された場合、「“映画の”+名詞」を構成する文章を、係り受け解析などを利用して抽出する。これにより検索パターンマッチング部113は、“映画のチケット”、“映画のスケジュール”などのサブドメイン(文字列)を含んだWebページをサブドメインとして抽出することができる。なお、ここでは公知技術である係り受け解析を行うことにより、「映画のチケット」などのように一連の文字列のみ抽出することなく、例えば「映画の試写会のチケット」などの文字列をも抽出することができる。また、検索パターンマッチング部113は、サブドメインとして、“ドメイン+名詞”とした語彙統語パターンに従った文字列を抽出するようにしてもよい。すなわち、助詞を用いない文字列としてもよく、上述の例では、“映画チケット”をサブドメインとしてもよい。
The search
さらに、検索パターンマッチング部113は、後述する関連タスク検索パターン生成部115により生成された関連タスクの検索パターンに基づいて検索処理された検索結果(スニペット)から、予め定められた語彙統語パターンに合致する関連タスク(文字列)を抽出する。ここでは、サブドメインを含んだ関連タスク(文字列)を抽出するものであり、「サブドメイン+助詞+動詞」を語彙統語パターンとする関連タスクを抽出する。例えば、サブドメイン“映画のチケット”、助詞“を”、動詞“購入する”で構成される関連タスクを抽出する。なお、助詞“を”にかえて、“の”、または“で”などとしてもよく、そのほかの助詞を適用してもよい。
Further, the search
関連タスク検索パターン生成部115は、検索パターンマッチング部113において抽出されたサブドメインに基づいて、関連タスクの検索パターンを生成する部分である。関連タスクは、サブドメインを含んだ文字列であり、本実施形態では、「サブドメイン+助詞“を”」と設定された文字列である。例えば、サブドメインが“映画のチケット”とした場合、検索パターンは、“映画のチケットを”となる。Web検索部112は、この検索パターンを含んだWebページを検索し、検索パターンマッチング部113は、「ドメイン+助詞“を”+動詞」を語彙統語パターンとする関連タスクを抽出する。例えば、検索パターンマッチング部113は、“映画のチケットを購入する”といった関連タスクを抽出することができる。なお、助詞を用いない場合もあり、その場合“映画チケット購入”とする関連タスクを抽出するようにしてもよい。
The related task search
共起度計算部117は、タスクモデル生成部109において生成されたドメインタスクと、検索パターンマッチング部113において、抽出された関連タスクとの関連度合いを示す共起度を計算する部分である。すなわち、共起度計算部117は、一の関連タスクがどのドメインタスクに対して関連付けをするかを決定するために、一の関連タスクと、タスクモデル生成部109において生成された複数のドメインタスクのそれぞれとの間の共起度を計算する。具体的な共起度の計算方法は、式1に示したものと同じである。
The co-occurrence
関連付処理部118は、共起度計算部117において計算された共起度に基づいて、一番共起度の値の大きいドメインタスクに対して、一の関連タスクを対応付ける処理を行う。すなわち、関連付処理部118は、記憶部110において、どのドメインタスクの下層部分に関連タスクを記憶させるかを決定し、そのドメインタスクに関連付けて関連タスクを記憶させる。具体的には、関連付処理部118は、図13に示すとおり、関連付けられるドメインタスクのタスクIDを、関連タスクの親タスクID欄に記述することで、関連付けの処理を行う。また、関連付け処理部118は、関連タスクのタスクIDをユニークとなるように付与するものである。
The
このように構成されたタスクモデル生成装置100aにおける関連タスクを抽出するまでの過程について図10を用いて説明する。図10は、関連タスクを抽出する過程を示す説明図である。
A process until the related task is extracted in the task
図10では、サブドメイン取得用検索パターンとして、検索パターン“映画の”が生成されていることを示している。そして、これを用いて、検索エンジン200に、“映画の”を検索させる。検索エンジン200では、例えば、図10の検索結果欄に示されるような検索結果が得られる。例えば、サブドメインとして“映画のチケット”や、“映画の英語”などが得られる。
FIG. 10 shows that the search pattern “movie” is generated as the subdomain acquisition search pattern. Then, using this, the
つぎに、達成タスク取得用検索パターンが生成され、これに基づいた検索が行われる。例えば、本実施形態では、1)“映画のチケットを”、2)“映画の映画を”が生成され、これに基づいた検索が行われる。 Next, an achievement task acquisition search pattern is generated, and a search based on this is performed. For example, in this embodiment, 1) “movie ticket” and 2) “movie movie” are generated, and a search based on this is performed.
共起度の計算では、ドメインタスクとして、“映画を観る”、“映画で学ぶ”が生成されていたとすると、それぞれのドメインタスクと、関連タスク“映画のチケットを購入する”との間の共起度が、共起度計算部117により計算される。本実施形態では、関連タスク“映画のチケットを購入する”と、ドメインタスク“映画を観る”との共起度は、0.052、関連タスク“映画のチケットを購入する”と、ドメインタスク“映画で学ぶ”との共起度は、0.0021であることから、関連タスク“映画のチケットを購入する”は、ドメインタスク“映画を観る”に関連付けられる。同様にして、関連タスク“映画の英語を聞き取る”についても度面タスクとの間で関連付けがなされる。
In the calculation of the co-occurrence, if “watch movie” and “learn with movie” are generated as domain tasks, the co-occurrence between each domain task and the related task “buy movie ticket” The degree of occurrence is calculated by the co-occurrence
つぎに、このように構成されたタスクモデル生成装置100aの処理について説明する。図11は、本実施形態のタスクモデル生成装置100aの処理を示すフローチャートである。まず、タスクモデル生成部109によりドメインタスクのタスクモデルが生成される(S301)。この詳細な処理は、図7および図8に示したとおりである。
Next, processing of the task
つぎに、サブドメイン検索パターン生成部111により、サブドメイン検索パターンが生成され(S302)、Web検索部112によりサブドメインの検索パターンを含んだWebページの検索が行われる(S303)。そして、Web検索部112において、全ての検索パターンを実行したと判断されると(S304)、検索パターンマッチング部113により検索パターンにマッチするサブドメインが抽出される(S305)。
Next, a subdomain search pattern is generated by the subdomain search pattern generation unit 111 (S302), and a Web page including the search pattern of the subdomain is searched by the Web search unit 112 (S303). When the
関連タスク検索パターン生成部115では、検索パターンマッチング部113により抽出されたサブドメインを用いて関連タスクの検索パターンが生成される(S306)。そして、この関連タスクの検索パターンによる検索が、Web検索部112により行われる(S307)。そして、Web検索部112において、全ての検索パターンを実行したと判断されると(S308)、検索パターンマッチング部113により検索パターンにマッチする関連タスクが抽出される(S309)。
The related task search
関連タスクが抽出されると、どのドメインタスクに関連付けたらよいか、その処理を行うために、抽出した一の関連タスクと、すでに抽出されている複数のドメインタスクとの間の共起度が計算される(S310)。そして、この共起度が高いドメインタスクに対して、関連タスクが関連付け処理が行われ(S311)、その関連付けが記憶部110に記憶される(S312)。 When related tasks are extracted, to determine which domain task should be associated, the co-occurrence degree between one extracted related task and multiple domain tasks that have already been extracted is calculated. (S310). Then, the related task is associated with the domain task having a high co-occurrence degree (S311), and the association is stored in the storage unit 110 (S312).
このように処理されたドメインタスクおよび関連タスクの関連付けを示す模式図を図12に示す。図12に示されるとおり、ドメインタスク“映画を観る”には、包含タスク“映画館で映画を観る”、“家で映画を観る”などが下層に関連付けられている。また、ドメインタスク“映画を観る”には、関連タスク“映画のチケットを買う”、“映画のスケジュールを確認する”などが関連付けられている。 FIG. 12 shows a schematic diagram showing the association between domain tasks and related tasks processed in this way. As shown in FIG. 12, the domain task “watch movie” has associated tasks “watch movie at cinema”, “watch movie at home”, and the like associated with lower layers. The domain task “watch movie” is associated with related tasks “buy movie ticket”, “check movie schedule”, and the like.
つぎに、本実施形態のタスクモデル生成装置100およびタスクモデル生成装置100aの作用効果について説明する。本実施形態のタスクモデル生成装置100において、ドメイン指定部101がユーザからドメインとなる文字列の入力を受け付け、ドメインタスク検索パターン生成部102は、このドメイン(入力文字列)を含んだドメインタスク取得用の検索パターンを生成する。Web検索部106は、生成された検索パターンを含んだWebページを検索し、検索パターンマッチング部107は、検索されたWebページから、検索パターンで示される検索パターン文字列(例えば、“映画を”)、および当該検索パターン文字列に結びついて動作を表す動作文字列(例えば、“観る”)含んだ一連の文字列(“映画を観る”)をドメインタスクとして抽出する。記憶部110は、抽出されたドメインタスクおよび当該ドメインタスクを含んだWebページのアクセス先情報(URL)を対応付けてタスクモデルとして記憶する。これにより、ユーザの行動支援のためのタスクモデル(データベース)を生成することができる。例えば、従来手作業等により1ヶ月程度かかっていたのに対して、本発明においては数時間でタスクモデルを構築することが期待できる。
Next, operational effects of the task
また、本実施形態のタスクモデル生成装置100において、ドメイン指定部101において受け付けられたドメインとなる入力文字列(例えば、“映画”)に連結することで動作を表す語句に結びつけるための助詞(本実施形態では、“を”であるが、これに限定はしない)を、入力文字列の後ろに連結して検索パターン(例えば、“映画を”)を生成することができる。これにより、ユーザの行動を支援するための文字列を的確に表すことができ、そのためのタスクモデルを生成することができる。
Further, in the task
また、本実施形態のタスクモデル生成装置100において、助詞“を”をドメインとなる入力文字列の後ろに連結して、検索パターンを生成することができ、ユーザの行動を支援するための文字列を的確に表すことができ、そのためのタスクモデルを生成することができる。
Further, in the task
また、本実施形態のタスクモデル生成装置100において、検索部106、若しくは検索エンジン200が係り受け解析を行うことで、検索パターンマッチング部107は、ドメインとなる入力文字列(例えば、“映画”)に対応する動作文字列(例えば、“観る”)を判断し、検索パターンおよび動作文字列を含んだ一連の文字列を抽出することができる。これにより、ユーザの行動を支援するための文字列を的確に表すことができ、そのためのタスクモデルを生成することができる。すなわち、文字のパターンマッチングによらず、文章としても意味を考慮した文字列の抽出を行うことで、より的確なタスクモデルを構築することができる。
In the task
また、本実施形態のタスクモデル生成装置100において、検索パターンマッチング部107は、ドメインとなる入力文字列をそのまま検索パターンとする場合においては、その検索パターンの直後に連結され、動作を表す漢字のみからなる文字列(例えば、“鑑賞”)を、検索パターンとともにドメインタスク(この場合、“映画鑑賞”となる)として抽出することにより、助詞を用いることなく、ユーザの行動を支援するための文字列を的確に表すことができ、そのためのタスクモデルを生成することができる。
Further, in the task
また、本実施形態のタスクモデル生成装置100において、包含タスク検索パターン生成部103は、ドメインタスクであるドメインタスク文字列(例えば、“映画を観る”)に対して、当該ドメインタスク文字列で示される動作を修飾するための修飾語に連結させるための連結文字列(例えば、“で”)を付加した包含タスク検索パターン(例えば、“で映画を観る”)を生成する。Web検索部106は、生成された包含タスク検索パターンを含んだWebページを検索し、検索パターンマッチング部107は、包含タスク検索パターンに修飾語を示す修飾文字列(例えば、“映画館で”)が連結された包含タスク文字列(例えば、“映画館で映画を観る”)を抽出することができる。これにより、ドメインタスクを包含するタスクを取得することができ、ユーザ支援のための行動をさらに細分化して支援することができる。
Further, in the task
また、本実施形態のタスクモデル生成装置100において、共起度計算部108は、ドメインとなる入力文字列と動作文字列との関連度合いを示す共起度を計算する。そして、この計算結果に基づいて、タスクモデル生成部109は、所定値以上の共起度を有するドメインタスクを抽出することができる。これにより、関連度合いの大きい文字列を結びつけることができ、ユーザに対してより的確な行動支援をすることができ、また関係のあまり無いWebページを除去することができる。
In the task
また、本実施形態のタスクモデル生成装置100において、タスクモデル生成部109において生成されたドメインタスクと修飾文字列との関連度合いを示す共起度を計算し、タスクモデル生成部109は、この計算結果に基づいて、所定値以上の共起度を有する包含タスクを抽出することができる。これにより、関連度合いの大きい文字列を結びつけることができ、ユーザに対してより的確な行動支援をすることができ、また関係のあまり無いWebページを序供することができる。
Further, in the task
また、本実施形態のタスクモデル生成装置100aにおいて、サブドメイン検索パターン生成部111は、ドメイン指定部101においてユーザから受け付けられた入力文字列を含んだ検索パターン(例えば、“映画の”)を生成し、Web検索部112は、生成された検索パターンを含んだWebページを検索する。そして、検索パターンマッチング部113は、検索されたWebページから、検索パターンに結びついている名詞文字列(例えば、“チケット”)からなる一連の文字列(例えば、“映画のチケット”)をサブドメインとして抽出し、関連タスク検索パターン生成部115は、抽出されたサブドメインを示すサブドメイン文字列を関連タスク取得用の検索パターン(例えば、“映画のチケットを”)として生成する。Web検索部112は、さらに、生成された検索パターンを含んだWebページを検索し、検索パターンマッチング部113は、検索されたWebページから、検索パターン文字列および当該検索パターン文字列に結びついている動作を表す動作文字列(例えば、“購入する”)からなる一連の文字列を関連タスク(例えば、“映画のチケットを購入する”)として抽出する。記憶部110は、抽出された関連タスクおよび当該関連タスクを含んだWebページのアクセス先情報を対応付けて記憶する。これにより、ユーザの行動支援のためのタスクモデル(データベース)を生成することができる。例えば、従来手作業等により1ヶ月程度かかっていたのに対して、本発明においては数時間でタスクモデルを構築することが期待できる。
In the task
また、本実施形態のタスクモデル生成装置100aにおいて、共起度計算部117は、予め定められた文字列からなるドメインタスク(例えば、“映画を観る”)と関連タスク(例えば、“映画のチケットを購入する”)との関連度合いを示す共起度を計算し、計算された共起度に基づいて、関連タスクとドメインタスクとの対応付けを行う。これにより、関連タスクを、より関連度合いの高いドメインタスクに対応付けることができ、ユーザの行動支援をより的確に行うことができる。
Further, in the task
10…通信システム、100…タスクモデル生成装置、100a…タスクモデル生成装置、101…ドメイン指定部、102…ドメインタスク検索パターン生成部、103…包含タスク検索パターン生成部、104…サブドメイン検索パターン生成部、105…関連タスク検索パターン生成部、106…Web検索部、107…検索パターンマッチング部、108…共起度計算部、109…タスクモデル生成部、110…記憶部、111…サブドメイン検索パターン生成部、112…Web検索部、113…検索パターンマッチング部、115…関連タスク検索パターン生成部、117…共起度計算部、118…関連付処理部、200…検索エンジン、300…携帯端末、300…検索エンジン。
DESCRIPTION OF SYMBOLS 10 ... Communication system, 100 ... Task model generation apparatus, 100a ... Task model generation apparatus, 101 ... Domain specification part, 102 ... Domain task search pattern generation part, 103 ... Inclusion task search pattern generation part, 104 ... Sub domain search pattern generation , 105 ... related task search pattern generation unit, 106 ... Web search unit, 107 ... search pattern matching unit, 108 ... co-occurrence degree calculation unit, 109 ... task model generation unit, 110 ... storage unit, 111 ... subdomain search
Claims (12)
前記入力手段により受け付けられた入力文字列を含んだ検索パターンを生成するドメインタスク検索パターン生成手段と、
前記ドメインタスク検索パターン生成手段により生成された検索パターンを含んだWebページを検索するドメインタスク検索手段と、
前記ドメインタスク検索手段により検索されたWebページから、前記検索パターンで示される検索パターン文字列、および当該検索パターン文字列に結びついて動作を表す動作文字列を含んだ一連の文字列をドメインタスクとして抽出するドメインタスク抽出手段と、
前記ドメインタスク抽出手段により抽出されたドメインタスクおよび当該ドメインタスクを含んだWebページのアクセス先情報を対応付けてタスクモデルとして記憶する記憶手段と
を備えるタスクモデル生成装置。 An input means for receiving input of a character string from the user;
A domain task search pattern generation means for generating a search pattern including an input character string received by the input means;
Domain task search means for searching for a web page including a search pattern generated by the domain task search pattern generation means;
From the Web page searched by the domain task search means, a search pattern character string indicated by the search pattern and a series of character strings including an operation character string representing an operation in connection with the search pattern character string are used as a domain task. A domain task extracting means for extracting;
A task model generation apparatus comprising: a storage unit that stores the domain task extracted by the domain task extraction unit and the access destination information of the Web page including the domain task in association with each other.
をさらに備え、
前記ドメインタスク検索手段は、前記包含タスク検索パターン生成手段により生成された包含タスク検索パターンを含んだWebページを検索し、
前記ドメインタスク抽出手段は、前記包含タスク検索パターンに修飾語を示す修飾文字列が連結された包含タスク文字列を抽出することを特徴とする請求項1から5のいずれか一項に記載のタスクモデル生成装置。 An inclusion task in which a concatenated character string for concatenating a domain task character string, which is a domain task extracted by the domain task extracting means, with a modifier for modifying the operation indicated by the domain task character string is added. Inclusion task search pattern generation means for generating a search pattern;
Further comprising
The domain task search means searches for a web page including the inclusion task search pattern generated by the inclusion task search pattern generation means,
The task according to any one of claims 1 to 5, wherein the domain task extraction unit extracts an inclusion task character string in which a modification character string indicating a modification word is connected to the inclusion task search pattern. Model generator.
前記ドメインタスク抽出手段は、前記ドメイン共起度計算手段による計算結果に基づいて、所定値以上の共起度を有するドメインタスクを抽出することを特徴とする請求項1から6のいずれか一項に記載のタスクモデル生成装置。 A domain co-occurrence degree calculating means for calculating a co-occurrence degree indicating a degree of association between the input character string and the action character string;
7. The domain task extraction unit extracts a domain task having a co-occurrence degree equal to or greater than a predetermined value based on a calculation result by the domain co-occurrence degree calculation unit. The task model generation device described in 1.
前記ドメインタスク抽出手段は、前記包含タスク共起度計算手段による計算結果に基づいて、所定値以上の共起度を有する包含タスクを抽出することを特徴とする請求項6または7のいずれか一項に記載のタスクモデル生成装置。 An inclusion task co-occurrence degree calculating means for calculating a co-occurrence degree indicating a degree of association between the domain task and the modifier character string;
8. The domain task extraction unit extracts an inclusion task having a co-occurrence degree equal to or greater than a predetermined value based on a calculation result by the inclusion task co-occurrence degree calculation unit. The task model generation device according to item.
前記入力手段により受け付けられた入力文字列を含んだ検索パターンを生成するサブドメイン検索パターン生成手段と、
前記サブドメイン検索パターン生成手段により生成された検索パターンを含んだWebページを検索するサブドメイン検索手段と、
前記ドメインタスク検索手段により検索されたWebページから、前記検索パターンに結びついている名詞文字列からなる一連の文字列をサブドメインとして抽出するサブドメイン抽出手段と、
前記サブドメイン抽出手段により抽出されたサブドメインを示すサブドメイン文字列から関連タスクの検索パターンとして生成する関連タスク検索パターン生成手段と、
前記関連タスク検索パターン生成手段により生成された検索パターンを含んだWebページを検索する関連タスク検索手段と、
前記関連タスク検索手段により検索されたWebページから、前記検索パターン文字列および当該検索パターン文字列に結びついている動作を表す動作文字列からなる一連の文字列を関連タスクとして抽出する関連タスク抽出手段と、
前記関連タスク抽出手段により抽出された関連タスクおよび当該関連タスクを含んだWebページのアクセス先情報を対応付けて記憶する記憶手段と
を備えるタスクモデル生成装置。 An input means for receiving input of a character string from the user;
Sub-domain search pattern generation means for generating a search pattern including an input character string received by the input means;
Subdomain search means for searching for a web page including a search pattern generated by the subdomain search pattern generation means;
Subdomain extraction means for extracting, as a subdomain, a series of character strings composed of noun character strings linked to the search pattern from the web page searched by the domain task search means;
Related task search pattern generation means for generating a search pattern of related tasks from a subdomain character string indicating a subdomain extracted by the subdomain extraction means;
Related task search means for searching for a Web page including a search pattern generated by the related task search pattern generation means;
Related task extraction means for extracting, as a related task, a series of character strings composed of the search pattern character string and an action character string representing an action linked to the search pattern character string from the Web page searched by the related task search means When,
A task model generation device comprising: a storage unit that stores the related task extracted by the related task extraction unit and the access destination information of the Web page including the related task in association with each other.
前記ドメインタスク検索パターン生成手段により生成された検索パターンを含んだWebページを検索するドメインタスク検索手段と、
前記ドメインタスク検索手段により検索されたWebページから、前記検索パターンで示される検索パターン文字列、および当該検索パターン文字列に結びついて動作を表す動作文字列を含んだ一連の文字列をドメインタスクとして抽出するドメインタスク抽出手段と、
を備え、前記記憶手段は、前記ドメインタスク抽出手段により抽出されたドメインタスクおよび当該ドメインタスクを含んだWebページのアクセス先情報を対応付けてタスクモデルとして記憶するタスクモデル生成装置であって、
さらに、
予め定められた文字列からなるドメインタスクと関連タスクとの関連度合いを示す共起度を計算する関連タスク共起度計算手段と、
前記関連タスク共起度計算手段により計算された共起度に基づいて、関連タスクとドメインタスクとの関連付けを行う関連付け処理手段とを備える請求項9に記載のタスクモデル生成装置。 A domain task search pattern generation means for generating a search pattern including an input character string received by the input means;
Domain task search means for searching for a web page including a search pattern generated by the domain task search pattern generation means;
From the Web page searched by the domain task search means, a search pattern character string indicated by the search pattern and a series of character strings including an operation character string representing an operation in connection with the search pattern character string are used as a domain task. A domain task extracting means for extracting;
The storage means is a task model generation device that stores the domain task extracted by the domain task extraction means and the access destination information of the Web page including the domain task as a task model in association with each other,
further,
A related task co-occurrence degree calculating means for calculating a co-occurrence degree indicating a degree of association between a domain task and a related task made of a predetermined character string;
The task model generation device according to claim 9, further comprising an association processing unit that associates a related task with a domain task based on the co-occurrence degree calculated by the related task co-occurrence degree calculating unit.
前記入力ステップにより受け付けられた入力文字列を含んだ検索パターンを生成するドメインタスク検索パターン生成ステップと、
前記ドメインタスク検索パターン生成ステップにより生成された検索パターンを含んだWebページを検索する検索ステップと、
前記検索ステップにより検索されたWebページから、前記検索パターンで示される検索パターン文字列、および当該検索パターン文字列に結びついて動作を表す動作文字列を含んだ一連の文字列をドメインタスクとして抽出するドメインタスク抽出ステップと、
前記ドメインタスク抽出ステップにより抽出されたドメインタスクおよび当該ドメインタスクを含んだWebページのアクセス先情報を対応付けてタスクモデルとして記憶手段に記憶する記憶ステップと
を備えるタスクモデル生成方法。 An input step for accepting input of a character string from the user;
A domain task search pattern generation step for generating a search pattern including the input character string received by the input step;
A search step of searching for a web page including the search pattern generated by the domain task search pattern generation step;
From the Web page searched by the search step, a search pattern character string indicated by the search pattern and a series of character strings including an action character string representing an action linked to the search pattern character string are extracted as a domain task. A domain task extraction step;
A storage step of storing the domain task extracted in the domain task extraction step and the access destination information of the Web page including the domain task in a storage unit in association with each other.
前記入力ステップにより受け付けられた入力文字列を含んだ検索パターンを生成するサブドメイン検索パターン生成ステップと、
前記サブドメイン検索パターン生成ステップにより生成された検索パターンを含んだWebページを検索するサブドメイン検索ステップと、
前記サブドメイン検索ステップにより検索されたWebページから、前記検索パターンに結びついている名詞文字列からなる一連の文字列をサブドメインとして抽出するサブドメイン抽出ステップと、
前記サブドメイン抽出ステップにより抽出されたサブドメインを示すサブドメイン文字列を関連タスクの検索パターンとして生成する関連タスク検索パターン生成ステップと、
前記関連タスク検索パターン生成ステップにより生成された検索パターンを含んだWebページを検索する関連タスク検索ステップと、
前記関連タスク検索ステップにより検索されたWebページから、前記検索パターン文字列および当該検索パターン文字列に結びついている動作を表す動作文字列からなる一連の文字列を関連タスクとして抽出する関連タスク抽出ステップと、
前記関連タスク抽出ステップにより抽出された関連タスクおよび当該関連タスクを含んだWebページのアクセス先情報を対応付けて記憶手段に記憶する記憶ステップと
を備えるタスクモデル生成方法。
An input step for accepting input of a character string from the user;
A subdomain search pattern generation step of generating a search pattern including the input character string received by the input step;
A subdomain search step of searching for a Web page including the search pattern generated by the subdomain search pattern generation step;
A subdomain extraction step of extracting a series of character strings consisting of noun character strings linked to the search pattern as subdomains from the web page searched by the subdomain search step;
A related task search pattern generation step of generating a subdomain character string indicating the subdomain extracted by the subdomain extraction step as a search pattern of the related task;
A related task search step of searching for a Web page including the search pattern generated by the related task search pattern generation step;
Related task extraction step for extracting a series of character strings consisting of the search pattern character string and an action character string representing an action linked to the search pattern character string as a related task from the Web page searched in the related task search step When,
And a storage step of storing the related task extracted in the related task extraction step and the access destination information of the Web page including the related task in a storage unit in association with each other.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009195567A JP5378109B2 (en) | 2009-08-26 | 2009-08-26 | Task model generation apparatus and task model generation method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009195567A JP5378109B2 (en) | 2009-08-26 | 2009-08-26 | Task model generation apparatus and task model generation method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011048558A true JP2011048558A (en) | 2011-03-10 |
JP5378109B2 JP5378109B2 (en) | 2013-12-25 |
Family
ID=43834820
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009195567A Active JP5378109B2 (en) | 2009-08-26 | 2009-08-26 | Task model generation apparatus and task model generation method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5378109B2 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08129554A (en) * | 1994-05-25 | 1996-05-21 | Fuji Xerox Co Ltd | Relation expression extracting device and retrieval device for relation expression |
JPH11259524A (en) * | 1998-03-06 | 1999-09-24 | Omron Corp | Information retrieval system, information processing method in information retrieval system and record medium |
JP2008140204A (en) * | 2006-12-04 | 2008-06-19 | Toshiba Corp | Data retrieval system and program |
-
2009
- 2009-08-26 JP JP2009195567A patent/JP5378109B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08129554A (en) * | 1994-05-25 | 1996-05-21 | Fuji Xerox Co Ltd | Relation expression extracting device and retrieval device for relation expression |
JPH11259524A (en) * | 1998-03-06 | 1999-09-24 | Omron Corp | Information retrieval system, information processing method in information retrieval system and record medium |
JP2008140204A (en) * | 2006-12-04 | 2008-06-19 | Toshiba Corp | Data retrieval system and program |
Also Published As
Publication number | Publication date |
---|---|
JP5378109B2 (en) | 2013-12-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5647508B2 (en) | System and method for identifying short text communication topics | |
CN102779114B (en) | It is supported using the unstructured data of automatically rule generation | |
JP5229226B2 (en) | Information sharing system, information sharing method, and information sharing program | |
US20100185600A1 (en) | Apparatus and method for integration search of web site | |
US20100138428A1 (en) | Keyword output apparatus and method | |
JP5090547B2 (en) | Transliteration processing device, transliteration processing program, computer-readable recording medium recording transliteration processing program, and transliteration processing method | |
GB2401972A (en) | Identifying special word usage in a document | |
WO2008151466A1 (en) | Dictionary word and phrase determination | |
US8099430B2 (en) | Computer method and apparatus of information management and navigation | |
WO2008022581A1 (en) | Method and device for obtaining the new words and input method system | |
JP2011108085A (en) | Knowledge construction device and program | |
WO2009026850A1 (en) | Domain dictionary creation | |
JP2022532451A (en) | How to disambiguate Chinese place name meanings based on encyclopedia knowledge base and word embedding | |
Strzelecki et al. | Direct answers in Google search results | |
CN111259262A (en) | Information retrieval method, device, equipment and medium | |
JPWO2003060764A1 (en) | Information retrieval system | |
JP5302614B2 (en) | Facility related information search database formation method and facility related information search system | |
JP2011175486A (en) | Apparatus, program and method for supporting check of name collecting | |
JP2006023968A (en) | Unique expression extracting method and device and program to be used for the same | |
JP5378109B2 (en) | Task model generation apparatus and task model generation method | |
JP2009265770A (en) | Significant sentence presentation system | |
JP5228529B2 (en) | Data search program, data search device, and data search method | |
KR101421819B1 (en) | Method for providing keyword search result using balloon in an online environment | |
JP5843235B2 (en) | WEB information processing apparatus, WEB information processing method, and program | |
Kuo et al. | MusicStand: Listening to song lyrics using a map query interface |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120224 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130527 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130604 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130719 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130903 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130925 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5378109 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |