JP2011048558A - Device and method for generating task model - Google Patents

Device and method for generating task model Download PDF

Info

Publication number
JP2011048558A
JP2011048558A JP2009195567A JP2009195567A JP2011048558A JP 2011048558 A JP2011048558 A JP 2011048558A JP 2009195567 A JP2009195567 A JP 2009195567A JP 2009195567 A JP2009195567 A JP 2009195567A JP 2011048558 A JP2011048558 A JP 2011048558A
Authority
JP
Japan
Prior art keywords
task
domain
search pattern
character string
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009195567A
Other languages
Japanese (ja)
Other versions
JP5378109B2 (en
Inventor
Yusuke Fukazawa
佑介 深澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2009195567A priority Critical patent/JP5378109B2/en
Publication of JP2011048558A publication Critical patent/JP2011048558A/en
Application granted granted Critical
Publication of JP5378109B2 publication Critical patent/JP5378109B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a task model generation device and a task model generation method for automatically constructing a task model. <P>SOLUTION: A domain designation part 101 accepts the input of a domain from a user, and a domain task retrieval pattern generation part 102 generates a retrieval pattern for domain task obtaining including the domain, and a Web retrieval part 106 retrieves a Web page including the generated retrieval pattern, and a retrieval pattern matching part 107 extracts a series of character string ("viewing a movie") including a retrieval pattern character string (for example, "movie") shown by a retrieval pattern and an operation character string (for example, "viewing") connected to the retrieval pattern character string for showing the operation as a domain task. A storage part 110 stores the extracted domain task and the access destination information of the Web page in association as a task model. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、ネットワーク上のコンテンツなどのサービスにアクセスするためのタスクモデルを生成するタスクモデル生成装置およびタスクモデル生成方法に関する。   The present invention relates to a task model generation apparatus and a task model generation method for generating a task model for accessing a service such as content on a network.

従来、携帯端末のユーザが、ネットワーク上で提供される各種サービスを利用して問題解決を行うための手法として、ディレクトリ検索やキーワード検索などの検索手法が存在する。このような検索手法では、問題の解決に適用可能なサービスを利用者自身が検索する必要がある。この検索のためには、利用者は、一般的なカテゴリにより分類されたディレクトリ階層やキーワード検索により得られた情報の一覧から、候補を抽出してその内容を判定する作業を、所望の機能を有するサービスが見つけるまで繰り返す必要があった。   2. Description of the Related Art Conventionally, there are search methods such as directory search and keyword search as a method for a mobile terminal user to solve problems using various services provided on a network. In such a search method, the user needs to search for a service applicable to solving the problem. For this search, the user selects a candidate from a directory hierarchy classified by a general category or a list of information obtained by keyword search, and determines the content of the candidate. Had to repeat until a service to have was found.

しかしながら、携帯端末には、通常のPCと比較して、表示、通信などの処理能力が低く、またテンキーによる文字入力のためその入力操作が容易でない、といった制限がある。かかる制限は、各種サービスが提供する機能を利用者が検証する上で、大きな負担となる。このため、ネットワーク上にどのようなサービスが存在するのかを事前に把握していない利用者が、問題解決に適用可能なサービスを自ら発見することは困難であった。このような難点を解決するため、特許文献1では、利用者に必要になると予想される問題と、その問題を解決する過程で生じるサブ問題とをサーバ側に予め用意しておき、これらの問題を解決可能なサービスにナビゲートしている。   However, the mobile terminal has limitations such as low processing capability for display, communication, and the like compared to a normal PC, and that the input operation is not easy due to character input using the numeric keypad. Such a restriction is a heavy burden for the user to verify the functions provided by various services. For this reason, it is difficult for a user who does not know in advance what kind of service exists on the network to find a service applicable to problem solving. In order to solve such difficulties, in Patent Document 1, a problem that is expected to be required by the user and a sub-problem generated in the process of solving the problem are prepared in advance on the server side. Navigate to a service that can solve the problem.

特開2003−333831号公報JP 2003-333831 A

ところで、特許文献1では、ユーザが手動で問題の構造を分析し、問題のモデル(以下、タスクモデル)を構築しているが、未知の新しい場所やテーマ(ドメイン)においてタスクモデルを構築するためには専門家による長時間の構築・精査が必要である。なお、タスクモデルとは、ユーザが実世界で抱える問題の構造を分析し、ユーザの問題の解決行動(タスク)を構造化したデータベースである。タスクモデルでは、実世界の場所(ドメイン)ごとに、その場所に関連して発生するタスクがツリー状に構造化されている。映画館ドメインにおける実世界行動モデルの一部を図15に示す。タスク間の関係は達成関係is-achieved-byで表現されている。上位のタスクではユーザの抽象的な要求や問題を表現しており、下位のタスクではより具体的な解決策を表現している。   By the way, in Patent Document 1, a user manually analyzes a problem structure and constructs a problem model (hereinafter referred to as a task model). However, in order to construct a task model in an unknown new place or theme (domain). Requires a long period of construction and scrutiny by experts. The task model is a database in which the problem structure of the user in the real world is analyzed and the problem solving action (task) of the user is structured. In the task model, for each place (domain) in the real world, tasks that occur in relation to the place are structured in a tree shape. A part of the real world behavior model in the movie theater domain is shown in FIG. The relationship between tasks is expressed as an achievement relationship is-achieved-by. The upper task expresses abstract requests and problems of the user, and the lower task expresses more specific solutions.

例えば、図15では、デパートをドメインとして、そのドメイン(デパート)に対する抽象的な要求として、デパートを選ぶ、商品を買う、デパートに行くなどが上位のタスクとしてあげられる。また、下位のタスクとして、セール情報を調べる、営業日時を調べるなどがあり、さらに下位のタスクでは、イベント情報を調べる、休業日を調べるなどがあげられる。   For example, in FIG. 15, a department store is a domain, and an abstract request for the domain (department store) includes selecting a department store, buying a product, going to a department store, and the like as higher-level tasks. In addition, the subordinate tasks include checking sale information and checking the business date and time, and in the subordinate tasks, checking event information and checking closed days.

そこで、上述の課題を解決するために、本発明は、自動的にタスクモデルを構築することができるタスクモデル生成装置およびタスクモデル生成方法を提供することを目的とする。   Therefore, in order to solve the above-described problems, an object of the present invention is to provide a task model generation device and a task model generation method that can automatically construct a task model.

上述課題を解決するために、本発明のタスクモデル生成装置は、ユーザから文字列の入力を受け付ける入力手段と、前記入力手段により受け付けられた入力文字列を含んだ検索パターンを生成するドメインタスク検索パターン生成手段と、前記ドメインタスク検索パターン生成手段により生成された検索パターンを含んだWebページを検索するドメインタスク検索手段と、前記ドメインタスク検索手段により検索されたWebページから、前記検索パターンで示される検索パターン文字列、および当該検索パターン文字列に結びついて動作を表す動作文字列を含んだ一連の文字列をドメインタスクとして抽出するドメインタスク抽出手段と、前記ドメインタスク抽出手段により抽出されたドメインタスクおよび当該ドメインタスクを含んだWebページのアクセス先情報を対応付けてタスクモデルとして記憶する記憶手段とを備えている。   In order to solve the above-described problems, a task model generation device according to the present invention includes an input unit that receives an input of a character string from a user and a domain task search that generates a search pattern including the input character string received by the input unit. A pattern generation unit, a domain task search unit that searches for a Web page including the search pattern generated by the domain task search pattern generation unit, and a Web page searched by the domain task search unit. Search pattern character string, a domain task extraction unit that extracts a series of character strings including an operation character string that represents an operation in association with the search pattern character string, and a domain extracted by the domain task extraction unit Task and domain task included And a storage means for storing as a task model in association with the access destination information eb page.

また、本発明のタスクモデル生成方法は、ユーザから文字列の入力を受け付ける入力ステップと、前記入力ステップにより受け付けられた入力文字列を含んだ検索パターンを生成するドメインタスク検索パターン生成ステップと、前記ドメインタスク検索パターン生成ステップにより生成された検索パターンを含んだWebページを検索する検索ステップと、前記検索ステップにより検索されたWebページから、前記検索パターンで示される検索パターン文字列、および当該検索パターン文字列に結びついて動作を表す動作文字列を含んだ一連の文字列をドメインタスクとして抽出するドメインタスク抽出ステップと、前記ドメインタスク抽出ステップにより抽出されたドメインタスクおよび当該ドメインタスクを含んだWebページのアクセス先情報を対応付けてタスクモデルとして記憶手段に記憶する記憶ステップとを備えている。   Further, the task model generation method of the present invention includes an input step for receiving an input of a character string from a user, a domain task search pattern generation step for generating a search pattern including the input character string received by the input step, A search step for searching for a Web page including the search pattern generated by the domain task search pattern generation step, a search pattern character string indicated by the search pattern from the Web page searched by the search step, and the search pattern A domain task extraction step for extracting a series of character strings including an operation character string connected to a character string and representing an operation as a domain task, a domain task extracted by the domain task extraction step, and a web page including the domain task No And a storage step of storing in the storage means as a task model in association with Seth destination information.

この構成により、ユーザから受け付けられた入力文字列を含んだ検索パターンを生成し、生成された検索パターンを含んだWebページを検索し、検索されたWebページから、検索パターンで示される検索パターン文字列、および当該検索パターン文字列に結びついて動作を表す動作文字列を含んだ一連の文字列をドメインタスクとして抽出する。抽出されたドメインタスクおよび当該ドメインタスクを含んだWebページのアクセス先情報を対応付けてタスクモデルとして記憶する。これにより、ユーザの行動支援のためのタスクモデル(データベース)を生成することができる。例えば、従来手作業等により1ヶ月程度かかっていたのに対して、本発明においては数時間でタスクモデルを構築することが期待できる。   With this configuration, a search pattern including an input character string received from a user is generated, a Web page including the generated search pattern is searched, and a search pattern character indicated by the search pattern is searched from the searched Web page. A sequence and a series of character strings including an operation character string representing an operation in association with the search pattern character string are extracted as a domain task. The extracted domain task and the access destination information of the Web page including the domain task are associated with each other and stored as a task model. Thereby, the task model (database) for user's action support can be generated. For example, it can be expected that a task model is constructed in a few hours in the present invention, whereas it takes about one month due to manual work or the like.

また、本発明のタスクモデル生成装置において、前記ドメインタスク検索パターン生成手段は、前記入力手段により受け付けられた入力文字列に連結することで動作を表す語句に結びつけるための助詞を、前記入力文字列の後ろに連結して検索パターンを生成することが好ましい。   Further, in the task model generation device of the present invention, the domain task search pattern generation unit includes a particle for linking to an input character string received by the input unit to be connected to a word representing an action, and the input character string It is preferable to generate a search pattern by concatenating the back of the search pattern.

この構成により、受け付けられた入力文字列に連結することで動作を表す語句に結びつけるための助詞を、入力文字列の後ろに連結して検索パターンを生成することができる。これにより、ユーザの行動を支援するための文字列を的確に表すことができ、そのためのタスクモデルを生成することができる。   With this configuration, it is possible to generate a search pattern by concatenating a particle, which is linked to a word representing an action by connecting to an accepted input character string, behind the input character string. Thereby, the character string for supporting a user's action can be represented exactly, and the task model for it can be produced | generated.

また、本発明のタスクモデル生成装置において、前記ドメインタスク検索パターン生成手段は、助詞“を”を前記入力文字列の後ろに連結して、検索パターンを生成することが好ましい。   In the task model generation device of the present invention, it is preferable that the domain task search pattern generation unit generates a search pattern by connecting the particle “” to the end of the input character string.

この構成により、助詞“を”を入力文字列の後ろに連結して、検索パターンを生成することができ、ユーザの行動を支援するための文字列を的確に表すことができ、そのためのタスクモデルを生成することができる。   With this configuration, it is possible to generate a search pattern by connecting the particle "" to the back of the input character string, and to accurately represent the character string for supporting the user's action, and a task model for that purpose. Can be generated.

また、本発明のタスクモデル生成装置において、前記ドメインタスク抽出手段は、係り受け解析を行うことで、前記入力文字列に対応する動作文字列を判断し、前記検索パターンおよび前記動作文字列を含んだ一連の文字列を抽出することが好ましい。   In the task model generation device of the present invention, the domain task extraction unit performs dependency analysis to determine an operation character string corresponding to the input character string, and includes the search pattern and the operation character string. It is preferable to extract a series of character strings.

この構成により、係り受け解析を行うことで、入力文字列に対応する動作文字列を判断し、検索パターンおよび動作文字列を含んだ一連の文字列を抽出することができる。これにより、ユーザの行動を支援するための文字列を的確に表すことができ、そのためのタスクモデルを生成することができる。すなわち、文字のパターンマッチングによらず、文章としても意味を考慮した文字列の抽出を行うことで、より的確なタスクモデルを構築することができる。   With this configuration, by performing dependency analysis, it is possible to determine an operation character string corresponding to an input character string and extract a series of character strings including a search pattern and an operation character string. Thereby, the character string for supporting a user's action can be represented exactly, and the task model for it can be produced | generated. In other words, a more accurate task model can be constructed by extracting a character string considering the meaning of a sentence, regardless of character pattern matching.

また、本発明のタスクモデル生成装置において、前記ドメインタスク抽出手段は、前記検索パターンの直後に連結され、動作を表す漢字のみからなる文字列を、前記検索パターンとともにドメインタスクとして抽出することが好ましい。   In the task model generation device of the present invention, it is preferable that the domain task extraction unit extracts a character string composed of only kanji characters representing an operation as a domain task together with the search pattern. .

この構成により、検索パターンの直後に連結され、動作を表す漢字のみからなる文字列を、検索パターンとともにドメインタスクとして抽出することにより、助詞を用いることなく、ユーザの行動を支援するための文字列を的確に表すことができ、そのためのタスクモデルを生成することができる。   With this configuration, a character string that is connected immediately after the search pattern and consists of only kanji characters representing an action is extracted as a domain task together with the search pattern, thereby supporting a user's action without using a particle. Can be accurately represented, and a task model for that can be generated.

また、本発明のタスクモデル生成装置は、前記ドメインタスク抽出手段により抽出されたドメインタスクであるドメインタスク文字列に対して、当該ドメインタスク文字列で示される動作を修飾するための修飾語に連結させるための連結文字列を付加した包含タスク検索パターンを生成する包含タスク検索パターン生成手段、をさらに備え、前記ドメインタスク検索手段は、前記包含タスク検索パターン生成手段により生成された包含タスク検索パターンを含んだWebページを検索し、前記ドメインタスク抽出手段は、前記包含タスク検索パターンに修飾語を示す修飾文字列が連結された包含タスク文字列を抽出することが好ましい。   In addition, the task model generation device of the present invention connects a domain task character string, which is a domain task extracted by the domain task extraction unit, to a modifier for modifying an operation indicated by the domain task character string. An included task search pattern generating means for generating an included task search pattern to which a concatenated character string to be added is added, wherein the domain task search means uses the included task search pattern generated by the included task search pattern generating means. It is preferable that the contained Web page is searched, and the domain task extraction unit extracts an included task character string in which a modifier character string indicating a modifier is connected to the included task search pattern.

この構成により、ドメインタスクであるドメインタスク文字列に対して、当該ドメインタスク文字列で示される動作を修飾するための修飾語に連結させるための連結文字列を付加した包含タスク検索パターンを生成し、生成された包含タスク検索パターンを含んだWebページを検索し、包含タスク検索パターンに修飾語を示す修飾文字列が連結された包含タスク文字列を抽出することができる。これにより、ドメインタスクを包含するタスクを取得することができ、ユーザ支援のための行動をさらに細分化して支援することができる。   With this configuration, an inclusive task search pattern is generated by adding a concatenated character string for concatenating a domain task character string that is a domain task to a modifier for modifying the operation indicated by the domain task character string. Then, the generated Web page including the included task search pattern is searched, and the included task character string in which the modifier character string indicating the modifier is connected to the included task search pattern can be extracted. As a result, tasks including domain tasks can be acquired, and actions for user support can be further subdivided and supported.

また、本発明のタスクモデル生成装置は、前記入力文字列と前記動作文字列との関連度合いを示す共起度を計算するドメイン共起度計算手段をさらに備え、前記ドメインタスク抽出手段は、前記ドメイン共起度計算手段による計算結果に基づいて、所定値以上の共起度を有するドメインタスクを抽出することが好ましい。   The task model generation device of the present invention further includes a domain co-occurrence degree calculating unit that calculates a co-occurrence degree indicating a degree of association between the input character string and the action character string, and the domain task extracting unit includes the domain task extracting unit, It is preferable to extract a domain task having a co-occurrence degree equal to or greater than a predetermined value based on the calculation result by the domain co-occurrence degree calculating means.

この構成により、入力文字列と動作文字列との関連度合いを示す共起度を計算し、この計算結果に基づいて、所定値以上の共起度を有するドメインタスクを抽出することができる。これにより、関連度合いの大きい文字列を結びつけることができ、ユーザに対してより的確な行動支援をすることができ、また関係のあまり無いWebページを除去することができる。   With this configuration, it is possible to calculate the co-occurrence degree indicating the degree of association between the input character string and the action character string, and to extract a domain task having a co-occurrence degree equal to or greater than a predetermined value based on the calculation result. As a result, character strings having a high degree of association can be linked, more accurate action support can be provided to the user, and unrelated web pages can be removed.

また、本発明のタスクモデル生成装置は、前記ドメインタスクと前記修飾文字列との関連度合いを示す共起度を計算する包含タスク共起度計算手段をさらに備え、前記ドメインタスク抽出手段は、前記包含タスク共起度計算手段による計算結果に基づいて、所定値以上の共起度を有する包含タスクを抽出することが好ましい。   The task model generation device of the present invention further includes an inclusion task co-occurrence degree calculating means for calculating a co-occurrence degree indicating a degree of association between the domain task and the modifier character string, and the domain task extracting means includes the It is preferable to extract an inclusion task having a co-occurrence degree equal to or greater than a predetermined value based on the calculation result by the inclusion task co-occurrence degree calculation means.

この構成により、ドメインタスクと修飾文字列との関連度合いを示す共起度を計算し、計算結果に基づいて、所定値以上の共起度を有する包含タスクを抽出することができる。これにより、関連度合いの大きい文字列を結びつけることができ、ユーザに対してより的確な行動支援をすることができ、また関係のあまり無いWebページを除去することができる。   With this configuration, it is possible to calculate the co-occurrence degree indicating the degree of association between the domain task and the modification character string, and to extract an inclusion task having a co-occurrence degree equal to or greater than a predetermined value based on the calculation result. As a result, character strings having a high degree of association can be linked, more accurate action support can be provided to the user, and unrelated web pages can be removed.

また、本発明のタスクモデル生成装置は、ユーザから文字列の入力を受け付ける入力手段と、前記入力手段により受け付けられた入力文字列を含んだ検索パターンを生成するサブドメイン検索パターン生成手段と、前記サブドメイン検索パターン生成手段により生成された検索パターンを含んだWebページを検索するサブドメイン検索手段と、前記ドメインタスク検索手段により検索されたWebページから、前記検索パターンに結びついている名詞文字列からなる一連の文字列をサブドメインとして抽出するサブドメイン抽出手段と、前記サブドメイン抽出手段により抽出されたサブドメインを示すサブドメイン文字列から関連タスクの検索パターンとして生成する関連タスク検索パターン生成手段と、前記関連タスク検索パターン生成手段により生成された検索パターンを含んだWebページを検索する関連タスク検索手段と、前記関連タスク検索手段により検索されたWebページから、前記検索パターン文字列および当該検索パターン文字列に結びついている動作を表す動作文字列からなる一連の文字列を関連タスクとして抽出する関連タスク抽出手段と、前記関連タスク抽出手段により抽出された関連タスクおよび当該関連タスクを含んだWebページのアクセス先情報を対応付けて記憶する記憶手段とを備えている。   In addition, the task model generation device of the present invention includes an input unit that receives an input of a character string from a user, a subdomain search pattern generation unit that generates a search pattern including an input character string received by the input unit, From a sub-domain search means for searching a Web page including a search pattern generated by the sub-domain search pattern generation means, and from a noun character string linked to the search pattern from the Web page searched by the domain task search means Subdomain extraction means for extracting a series of character strings as subdomains, and related task search pattern generation means for generating as a related task search pattern from a subdomain character string indicating a subdomain extracted by the subdomain extraction means; , Related task search pattern generation Related task search means for searching for a Web page including the search pattern generated by the stage, and operations associated with the search pattern character string and the search pattern character string from the Web page searched by the related task search means The related task extracting means for extracting a series of character strings consisting of action character strings representing the related task, the related task extracted by the related task extracting means, and the access destination information of the Web page including the related task are associated with each other. Storage means for storing the information.

また、本発明のタスクモデル生成方法は、ユーザから文字列の入力を受け付ける入力ステップと、前記入力ステップにより受け付けられた入力文字列を含んだ検索パターンを生成するサブドメイン検索パターン生成ステップと、前記サブドメイン検索パターン生成ステップにより生成された検索パターンを含んだWebページを検索するサブドメイン検索ステップと、前記サブドメイン検索ステップにより検索されたWebページから、前記検索パターンに結びついている名詞文字列からなる一連の文字列をサブドメインとして抽出するサブドメイン抽出ステップと、前記サブドメイン抽出ステップにより抽出されたサブドメインを示すサブドメイン文字列を関連タスクの検索パターンとして生成する関連タスク検索パターン生成ステップと、前記関連タスク検索パターン生成ステップにより生成された検索パターンを含んだWebページを検索する関連タスク検索ステップと、前記関連タスク検索ステップにより検索されたWebページから、前記検索パターン文字列および当該検索パターン文字列に結びついている動作を表す動作文字列からなる一連の文字列を関連タスクとして抽出する関連タスク抽出ステップと、前記関連タスク抽出ステップにより抽出された関連タスクおよび当該関連タスクを含んだWebページのアクセス先情報を対応付けて記憶手段に記憶する記憶ステップとを備えている。   In addition, the task model generation method of the present invention includes an input step of receiving a character string input from a user, a subdomain search pattern generation step of generating a search pattern including the input character string received by the input step, From a sub-domain search step for searching a Web page including a search pattern generated by the sub-domain search pattern generation step, and from a noun character string linked to the search pattern from the Web page searched by the sub-domain search step A subdomain extraction step for extracting a series of character strings as subdomains, and a related task search pattern generation step for generating a subdomain character string indicating the subdomain extracted by the subdomain extraction step as a search pattern for the related tasks; A related task search step for searching a Web page including the search pattern generated by the related task search pattern generation step, and the search pattern character string and the search pattern character from the Web page searched by the related task search step A related task extraction step for extracting a series of character strings composed of operation character strings representing operations connected to the column as related tasks, a related task extracted by the related task extraction step, and a Web page including the related tasks A storage step of associating the access destination information with the storage means.

この構成により、ユーザから文字列の入力を受け付けられた入力文字列を含んだ検索パターンを生成し、生成された検索パターンを含んだWebページを検索する。そして、検索されたWebページから、前記検索パターンに結びついている名詞文字列からなる一連の文字列をサブドメインとして抽出し、抽出されたサブドメインを示すサブドメイン文字列を検索パターンとして生成する。生成された検索パターンを含んだWebページを検索し、検索されたWebページから、検索パターン文字列および当該検索パターン文字列に結びついている動作を表す動作文字列からなる一連の文字列を関連タスクとして抽出する。抽出された関連タスクおよび当該関連タスクを含んだWebページのアクセス先情報を対応付けて記憶する。これにより、ユーザの行動支援のためのタスクモデル(データベース)を生成することができる。例えば、従来手作業等により1ヶ月程度かかっていたのに対して、本発明においては数時間でタスクモデルを構築することが期待できる。   With this configuration, a search pattern including an input character string that is accepted by the user as a character string is generated, and a Web page including the generated search pattern is searched. Then, a series of character strings composed of noun character strings linked to the search pattern is extracted as subdomains from the searched Web page, and a subdomain character string indicating the extracted subdomain is generated as a search pattern. A search is made for a Web page including the generated search pattern, and a series of character strings consisting of a search pattern character string and an operation character string representing an operation linked to the search pattern character string are searched from the searched Web page. Extract as The extracted related task and the access destination information of the Web page including the related task are stored in association with each other. Thereby, the task model (database) for user's action support can be generated. For example, it can be expected that a task model is constructed in a few hours in the present invention, whereas it takes about one month due to manual work or the like.

また、本発明のタスクモデル生成装置は、前記入力手段により受け付けられた入力文字列を含んだ検索パターンを生成するドメインタスク検索パターン生成手段と、前記ドメインタスク検索パターン生成手段により生成された検索パターンを含んだWebページを検索するドメインタスク検索手段と、前記ドメインタスク検索手段により検索されたWebページから、前記検索パターンで示される検索パターン文字列、および当該検索パターン文字列に結びついて動作を表す動作文字列を含んだ一連の文字列をドメインタスクとして抽出するドメインタスク抽出手段と、備え、前記記憶手段は、前記ドメインタスク抽出手段により抽出されたドメインタスクおよび当該ドメインタスクを含んだWebページのアクセス先情報を対応付けてタスクモデルとして記憶するタスクモデル生成装置であって、さらに、予め定められた文字列からなるドメインタスクと関連タスクとの関連度合いを示す共起度を計算する関連タスク共起度計算手段と、前記関連タスク共起度計算手段により計算された共起度に基づいて、関連タスクとドメインタスクとの関連付けを行う関連付け処理手段とを備えることが好ましい。   The task model generation device of the present invention includes a domain task search pattern generation unit that generates a search pattern including an input character string received by the input unit, and a search pattern generated by the domain task search pattern generation unit. A domain task search means for searching for a Web page including the search pattern character string, a search pattern character string indicated by the search pattern from the Web page searched by the domain task search means, and an operation associated with the search pattern character string A domain task extraction unit that extracts a series of character strings including an operation character string as a domain task, and the storage unit includes a domain task extracted by the domain task extraction unit and a Web page including the domain task. Matching access destination information A task model generation device for storing as a model, the related task co-occurrence degree calculating means for calculating a co-occurrence degree indicating a degree of association between a domain task consisting of a predetermined character string and the related task; It is preferable to include association processing means for associating the related task with the domain task based on the co-occurrence degree calculated by the task co-occurrence degree calculating means.

この構成により、予め定められた文字列からなるドメインタスクと関連タスクとの関連度合いを示す共起度を計算し、計算された共起度に基づいて、関連タスクとドメインタスクとの対応付けを行う。これにより、関連タスクを、より関連どの高いドメインタスクに対応付けることができ、ユーザの行動支援をより的確に行うことができる。   With this configuration, the co-occurrence degree indicating the degree of association between the domain task consisting of a predetermined character string and the related task is calculated, and the association between the related task and the domain task is performed based on the calculated co-occurrence degree. Do. As a result, the related task can be associated with a higher related domain task, and the user's action support can be performed more accurately.

本発明によれば、ユーザの行動支援のためのタスクモデル(データベース)を生成することができる。例えば、従来手作業等により1ヶ月程度かかっていたのに対して、本発明においては数時間でタスクモデルを構築することが期待できる。   ADVANTAGE OF THE INVENTION According to this invention, the task model (database) for a user's action assistance can be produced | generated. For example, it can be expected that a task model is constructed in a few hours in the present invention, whereas it takes about one month due to manual work or the like.

本実施形態のタスクモデル生成装置100を含んだ通信システム10のシステム構成を示すシステム構成図である。1 is a system configuration diagram illustrating a system configuration of a communication system 10 including a task model generation device 100 of the present embodiment. タスクモデル生成装置100の機能を示すブロック図である。3 is a block diagram illustrating functions of a task model generation device 100. FIG. タスクモデル生成装置100のハードウェア構成図である。2 is a hardware configuration diagram of a task model generation device 100. FIG. ドメインタスクを抽出する過程を示す説明図である。It is explanatory drawing which shows the process in which a domain task is extracted. 包含タスクを抽出するまでの処理過程を示す説明図である。It is explanatory drawing which shows the processing process until an inclusion task is extracted. ドメイン、ドメインタスク、包含タスクの関連性を示す模式図を示す。The schematic diagram which shows the relationship of a domain, a domain task, and an inclusion task is shown. タスクモデル生成装置100のドメインタスクを抽出する方法を示すフローチャートである。4 is a flowchart illustrating a method for extracting a domain task of the task model generation device 100. 包含タスクを生成するタスクモデル生成装置100の処理を示すフローチャートである。It is a flowchart which shows the process of the task model production | generation apparatus 100 which produces | generates an inclusion task. 関連タスクを抽出するためのタスクモデル生成装置100aの機能を示すブロック図である。It is a block diagram which shows the function of the task model production | generation apparatus 100a for extracting a related task. 関連タスクを抽出する過程を示す説明図である。It is explanatory drawing which shows the process of extracting a related task. 本実施形態のタスクモデル生成装置100aの処理を示すフローチャートである。It is a flowchart which shows the process of the task model production | generation apparatus 100a of this embodiment. ドメインタスクおよび関連タスクの関連付けを示す模式図である。It is a schematic diagram which shows the correlation of a domain task and a related task. タスクモデルの記憶形態を説明する説明図である。It is explanatory drawing explaining the memory | storage form of a task model. タスクモデルを表示する画面を示す説明図である。It is explanatory drawing which shows the screen which displays a task model. タスクモデルの概念を示す概念図である。It is a conceptual diagram which shows the concept of a task model.

添付図面を参照しながら本発明の実施形態を説明する。可能な場合には、同一の部分には同一の符号を付して、重複する説明を省略する。   Embodiments of the present invention will be described with reference to the accompanying drawings. Where possible, the same parts are denoted by the same reference numerals, and redundant description is omitted.

図1は、本実施形態のタスクモデル生成装置100を含んだ通信システム10のシステム構成を示すシステム構成図である。この通信システム10は、タスクモデル生成装置100および検索エンジン200を含んで構成されている。この通信システム10においては、タスクモデル生成装置100は、検索エンジン200を利用して、所定の文字列を含んだWebページを検索し、検索したWebページを所定の文字列であるドメインタスクと対応付けたタスクモデルとして記憶するものである。   FIG. 1 is a system configuration diagram showing a system configuration of a communication system 10 including a task model generation device 100 of the present embodiment. The communication system 10 includes a task model generation device 100 and a search engine 200. In this communication system 10, the task model generation device 100 uses a search engine 200 to search for a Web page that includes a predetermined character string, and corresponds the searched Web page to a domain task that is a predetermined character string. It is memorized as the attached task model.

つぎに、このタスクモデル生成装置100について説明する。図2は、タスクモデル生成装置100の機能を示すブロック図である。図2に示されるとおり、タスクモデル生成装置100は、ドメイン指定部101(入力手段)、ドメインタスク検索パターン生成部102(ドメインタスク検索パターン生成手段)、包含タスク検索パターン生成部103(包含タスク検索パターン生成手段)、Web検索部106(ドメインタスク検索手段)、検索パターンマッチング部107(ドメインタスク抽出手段)、共起度計算部108(ドメイン共起度計算手段、包含タスク共起度計算手段)、タスクモデル生成部109および記憶部110(記憶手段)を含んで構成されている。   Next, the task model generation device 100 will be described. FIG. 2 is a block diagram illustrating functions of the task model generation device 100. As shown in FIG. 2, the task model generation device 100 includes a domain designation unit 101 (input unit), a domain task search pattern generation unit 102 (domain task search pattern generation unit), and an included task search pattern generation unit 103 (included task search). Pattern generation means), Web search section 106 (domain task search means), search pattern matching section 107 (domain task extraction means), co-occurrence degree calculation section 108 (domain co-occurrence degree calculation means, inclusion task co-occurrence degree calculation means) The task model generation unit 109 and the storage unit 110 (storage means) are included.

このタスクモデル生成装置100は、図3に示すとおり、CPU、RAM等からのハードウェアにより実現される。図3は、タスクモデル生成装置100のハードウェア構成図である。図2に示されるタスクモデル生成装置100は、物理的には、図3に示すように、CPU11、主記憶装置であるRAM12及びROM13、入力デバイスであるキーボード及びマウス等の入力装置14、ディスプレイ等の出力装置15、ネットワークカード等のデータ送受信デバイスである通信モジュール16、ハードディスク等の補助記憶装置17などを含むコンピュータシステムとして構成されている。図2において説明した各機能は、図3に示すCPU11、RAM12等のハードウェア上に所定のコンピュータソフトウェアを読み込ませることにより、CPU11の制御のもとで入力装置14、出力装置15、通信モジュール16を動作させるとともに、RAM12や補助記憶装置17におけるデータの読み出し及び書き込みを行うことで実現される。以下、図2に示す機能ブロックに基づいて、各機能ブロックを説明する。   As shown in FIG. 3, the task model generation apparatus 100 is realized by hardware such as a CPU and a RAM. FIG. 3 is a hardware configuration diagram of the task model generation device 100. As shown in FIG. 3, the task model generation device 100 shown in FIG. 2 physically includes a CPU 11, a RAM 12 and a ROM 13 that are main storage devices, an input device 14 such as a keyboard and a mouse that are input devices, a display, and the like. Output device 15, a communication module 16 which is a data transmission / reception device such as a network card, an auxiliary storage device 17 such as a hard disk, and the like. Each function described in FIG. 2 has the input device 14, the output device 15, and the communication module 16 under the control of the CPU 11 by reading predetermined computer software on the hardware such as the CPU 11 and the RAM 12 shown in FIG. 3. This is realized by reading and writing data in the RAM 12 and the auxiliary storage device 17. Hereinafter, each functional block will be described based on the functional blocks shown in FIG.

ドメイン指定部101は、タスクモデル生成装置100のオペレータからのドメインとなる文字列(入力文字列)の入力を受け付ける部分である。例えば、図14の例では、“デパート”がドメインに相当するものである。このドメインは、学習するタスクモデルの領域を定めるための文字列であり、ユーザの行動を支援するためのタスクモデルの中核を示す部分である。   The domain designating unit 101 is a part that receives an input of a character string (input character string) that is a domain from an operator of the task model generation device 100. For example, in the example of FIG. 14, “department store” corresponds to a domain. This domain is a character string for defining the area of the task model to be learned, and is a part indicating the core of the task model for supporting the user's action.

ドメインタスク検索パターン生成部102は、ドメイン指定部101により入力されたドメインを示す入力文字列に基づいて検索パターンを生成する部分である。例えば、ドメインタスク検索パターン生成部102は、ドメイン直下のタスクであるドメインタスクを取得するための検索パターンを生成するものであり、「ドメイン+助詞」からなる検索パターンを生成する。助詞として代表的なものは、“の”“で”“を”“は”等があるが、ここでは“を”が、検索パターンを構成する助詞として選択される。ドメインタスク検索パターン生成部102は、例えば「映画を」を検索パターンとし、後述するWeb検索部106は、「映画を」を含んだWebページを検索することができる。これにより、例えば「映画を観る」「映画を作る」といったドメインタスクを取得することができる。ドメインタスクとは、ユーザの行動を示す文字列であり、ユーザの動作を示す動詞または動作を示す名詞を含んだものである。   The domain task search pattern generation unit 102 is a part that generates a search pattern based on an input character string indicating a domain input by the domain specification unit 101. For example, the domain task search pattern generation unit 102 generates a search pattern for acquiring a domain task that is a task directly under the domain, and generates a search pattern composed of “domain + particle”. As typical particles, there are “no”, “de”, “ha”, “ha”, and the like. Here, “ha” is selected as a particle constituting the search pattern. The domain task search pattern generation unit 102 uses, for example, “movie” as a search pattern, and the Web search unit 106 to be described later can search for a Web page including “movie”. Thereby, for example, domain tasks such as “watch movie” and “make movie” can be acquired. The domain task is a character string indicating the user's action and includes a verb indicating the user's action or a noun indicating the action.

Web検索部106は、検索エンジン200にアクセスして、ドメインタスク検索パターン生成部102により生成された検索パターンを用いて検索を行う部分である。例えば、Web検索部106は、ドメインタスク検索パターン生成部102により生成された“映画を”という文字列からなる検索パターンを検索エンジン200に検索させる部分である。   The Web search unit 106 is a part that accesses the search engine 200 and performs a search using the search pattern generated by the domain task search pattern generation unit 102. For example, the Web search unit 106 is a part that causes the search engine 200 to search for a search pattern composed of a character string “movie” generated by the domain task search pattern generation unit 102.

検索パターンマッチング部107は、Web検索部106により検索されたWebページのスニペット(検索結果)から、予め定められた語彙統語パターンに合致するドメインタスク(文字列)を抽出する部分である。例えば、検索パターンマッチング部107は、語彙統語パターンとして、「ドメイン“映画”+助詞“を”+動詞」が設定された場合、「“映画を”+動詞」を構成する文章(タスク(動詞を示す文字列))を、係り受け解析などを利用して、を抽出する。これにより検索パターンマッチング部107は、“映画を観る”、“映画を作る”などのドメインタスク(文字列)を含んだWebページをタスクモデルとして抽出することができる。なお、ここでは公知技術である係り受け解析を行うことにより、“映画を観る”などのように一連の文字列のみ抽出することなく、例えば“映画を映画館で観る”などの文字列をも抽出することができる。   The search pattern matching unit 107 is a part that extracts a domain task (character string) that matches a predetermined lexical syntactic pattern from the snippet (search result) of the Web page searched by the Web search unit 106. For example, when “domain“ movie ”+ particle“ to ”+ verb” is set as the lexical syntactic pattern, the search pattern matching unit 107 sets sentences (task (verb The character string shown)) is extracted using dependency analysis or the like. As a result, the search pattern matching unit 107 can extract a Web page including a domain task (character string) such as “watch movie” or “create movie” as a task model. Here, by performing dependency analysis, which is a well-known technique, without extracting only a series of character strings such as “watch movie”, a character string such as “watch movie at movie theater” is also included. Can be extracted.

なお、語彙統語パターン(lexico - syntactic patterns)は、大規模なテキストコーパスから知識を抽出する代表的な手法であって、ある特定の表現から上位下位関係(Hyponymy Relation)や、概念具体物関係(concept-instance relation)を得る手法として幅広く利用されている(以下、参考文献を参照)。
[参考文献1]
[1]Philipp Cimiano: Ontology Learning And Population from Text: Algorithms,Evaluation And Applications, Springer-Verlag, 2006.
[参考文献2]
[2] DavidSanchez: Domain Ontology Learning from the Web, VDM Verlag, 2008.
Note that lexico-syntactic patterns (lexico-syntactic patterns) is a typical technique for extracting knowledge from a large-scale text corpus. From a specific expression, lexico-syntactic patterns (Hyponymy Relation) and conceptual concrete relationship ( It is widely used as a method for obtaining concept-instance relations (see references below).
[Reference 1]
[1] Philipp Cimiano: Ontology Learning And Population from Text: Algorithms, Evaluation And Applications, Springer-Verlag, 2006.
[Reference 2]
[2] David Sanchez: Domain Ontology Learning from the Web, VDM Verlag, 2008.

このドメインタスク検索パターン生成部102および検索パターンマッチング部107に関して、以下の通りの変形例もあり得る。すなわち、上述の例では、助詞を用いることを前提としていたが、必ずしも助詞は必要とはしない。例えば、ドメインを“映画”とした場合、検索パターンを“映画”として、語彙統語パターンを“ドメイン+動作を表す漢字のみからなる名詞(例えば、鑑賞や、製作)”とする場合、ドメインタスク検索パターン生成部102は、ドメインをそのまま検索パターンとし、また、検索パターンマッチング部107は、語彙統語パターンに従って、ドメイン(例えば、“映画”)に動作を表す名詞が付加されている一連の文字列を抽出するようにしてもよい。   Regarding the domain task search pattern generation unit 102 and the search pattern matching unit 107, the following modifications may be possible. That is, in the above example, it is assumed that a particle is used, but a particle is not necessarily required. For example, if the domain is “movie”, the search pattern is “movie”, and the lexical syntactic pattern is “domain + a noun consisting only of kanji representing actions (for example, appreciation or production)”. The pattern generation unit 102 uses the domain as a search pattern as it is, and the search pattern matching unit 107 generates a series of character strings in which nouns representing actions are added to the domain (for example, “movie”) according to the lexical syntax pattern. You may make it extract.

共起度計算部108は、ドメイン指定部101により指定されたドメインを示す文字列と、検索パターンマッチング部107により抽出された語彙統語パターンにおけるタスク(動詞部分の文字列)との関連度合いを示す共起度を計算する部分である。検索パターンマッチング部107による処理のみでは、ノイズが含まれるため、共起度の計算を行うことにより、適切な概念のみをフィルタリングしようとするものである。ここで共起度の計算とは、以下の参考文献3により提案された概念間の上位下位関係をWebページの検索数から判定する手法である。下位概念Bの上位概念Aとの包含の度合いを示す評価値(Score)は次式で表される。

Figure 2011048558

ここで、Hits(X)とは、検索エンジンに文字列Xを入力したときの検索数である。
[参考文献3]
[3]P.D.Turney: Mining the Web for Synonyms: PMI-IR versus LSA on TOEFL, ECML2001,pages 491-502, 2001. The co-occurrence degree calculation unit 108 indicates the degree of association between the character string indicating the domain specified by the domain specifying unit 101 and the task (the verb part character string) in the lexical syntactic pattern extracted by the search pattern matching unit 107. This is the part that calculates the co-occurrence. Since only the processing by the search pattern matching unit 107 includes noise, it is intended to filter only appropriate concepts by calculating the co-occurrence degree. Here, the calculation of the degree of co-occurrence is a method of determining the upper and lower relations between concepts proposed by Reference Document 3 below from the number of web page searches. The evaluation value (Score) indicating the degree of inclusion of the subordinate concept B with the superordinate concept A is expressed by the following equation.
Figure 2011048558

Here, Hits (X) is the number of searches when the character string X is input to the search engine.
[Reference 3]
[3] PDTurney: Mining the Web for Synonyms: PMI-IR versus LSA on TOEFL, ECML2001, pages 491-502, 2001.

例えば、共起度計算部108は、“映画”と“作る”との共起度を計算したい場合には、“映画”を含んだWebページの検索数、“作る”を含んだWebページの検索数に基づいて、共起度を算出する。そして、タスクモデル生成部109がこれら閾値T以上であると判断する場合には、それら2つの文字列は関連度合いが大きいものとして扱われ、ドメインタスクとして用いる。   For example, when the co-occurrence degree calculation unit 108 wants to calculate the co-occurrence degree of “movie” and “create”, the number of searches for the Web page including “movie” and the number of Web pages including “create” The co-occurrence degree is calculated based on the number of searches. When the task model generation unit 109 determines that the threshold value T is equal to or greater than the threshold value T, the two character strings are treated as having a high degree of association and used as a domain task.

タスクモデル生成部109は、検索パターンマッチング部107により抽出されたドメインタスクのうち、共起度計算部108により計算された共起度が閾値T以上となるものをタスクモデルとして、記憶部110に記憶させる部分である。例えば、この閾値Tは、経験則上0.00001とすることが好ましい。   The task model generation unit 109 stores the domain task extracted by the search pattern matching unit 107 as a task model in which the co-occurrence degree calculated by the co-occurrence degree calculation unit 108 is equal to or greater than the threshold T in the storage unit 110. It is a part to be memorized. For example, this threshold value T is preferably set to 0.00001 from an empirical rule.

さらに、タスクモデル生成部109は、生成したドメインタスクを示すドメインタスク文字列を包含タスク検索パターン生成部103に出力する。包含タスク検索パターン生成部103における処理については後述する。   Further, the task model generation unit 109 outputs a domain task character string indicating the generated domain task to the inclusion task search pattern generation unit 103. The processing in the included task search pattern generation unit 103 will be described later.

記憶部110は、タスクモデル生成部109により生成されたタスクモデルを記憶する部分である。例えば、記憶部110は、図13に示される管理テーブルであって、タスクID、タスク名、親タスクIDを対応付けて記憶する部分である。図13では、タスクID:1001にはタスク名:“映画を観る”、その親タスクID:0が記述されており、これはドメインタスクであることを示している。また、タスクID:1002、タスク名:“映画館で映画を観る”、親タスクID:1001と記述されている部分については、親タスクID:1001である、タスク名“映画を観る”の下層に配置されるものであり、包含タスクを示す部分である。なお、図13においては、図示していないが、タスクごとにWebページにアクセスするためのURLが対応付けられている。   The storage unit 110 is a part that stores the task model generated by the task model generation unit 109. For example, the storage unit 110 is a management table shown in FIG. 13 and stores a task ID, a task name, and a parent task ID in association with each other. In FIG. 13, task ID: 1001 describes a task name: “watch movie” and its parent task ID: 0, which indicates a domain task. In addition, for a part described as task ID: 1002, task name: “watch movie in cinema”, parent task ID: 1001, parent task ID: 1001, lower layer of task name “watch movie” This is a part indicating an inclusion task. In FIG. 13, although not shown, a URL for accessing the Web page is associated with each task.

なお、これらタスクIDは、タスクモデル生成部109にて、ユニークとなるように付与されるものであり、また親タスクIDは、ドメインタスクと包含タスクとの関連付けを行う際に、対応するドメインタスクのタスクIDが包含タスクの親タスクID欄に付与されるものである。   These task IDs are assigned uniquely by the task model generation unit 109, and the parent task ID is a corresponding domain task when the domain task is associated with the inclusion task. Are assigned to the parent task ID column of the included task.

この記憶部110に記憶されている情報を用いて、ユーザ(携帯端末300)は、図14に示されるとおりの画面表示を行うことができる。すなわち、この記憶部110に記憶されている情報に対してアクセスしたユーザ(携帯端末300)は、この画面302を見ながら、ポインタ303を操作し、サービス取得ボタン301を押下することにより、ドメインタスク、包含タスクまたは関連タスク等に関連付けられているWebページにアクセスすることができる。よって、ユーザが映画館で映画を観たい場合には、“映画館で映画を観る”という項目を選択すると、映画を観ることに関するWebページの一覧表が表示され、さらにユーザはその中から一つを選択することにより、Webページの閲覧を可能にする。   Using the information stored in the storage unit 110, the user (mobile terminal 300) can perform screen display as shown in FIG. That is, the user (mobile terminal 300) accessing the information stored in the storage unit 110 operates the pointer 303 and presses the service acquisition button 301 while looking at the screen 302, thereby the domain task. A web page associated with an inclusion task or related task can be accessed. Therefore, when the user wants to watch a movie in a movie theater, if the item “Watch a movie in a movie theater” is selected, a list of Web pages related to watching a movie is displayed. By selecting one, it is possible to browse a web page.

図4に、ドメインタスクを抽出する過程を示す。図4では、ドメインタスク取得のための検索用パターン、その検索エンジンに入力される入力例、その検索結果、および共起度計算結果の一例を示す。図4に示されるように、ここでは、検索パターンとして、“映画を”が生成され、この文字列が検索エンジン200に入力され、検索処理が行われる。そして、検索結果として、スニペットには、“映画を”の文字列が太字で強調されたスニペットが得られる。図4では、検索結果は1件しか記載していないが、通常何万もの検索結果が得られるものである。   FIG. 4 shows a process of extracting a domain task. FIG. 4 shows an example of a search pattern for domain task acquisition, an input example input to the search engine, a search result, and a co-occurrence degree calculation result. As shown in FIG. 4, here, “movie” is generated as a search pattern, and this character string is input to the search engine 200, and search processing is performed. As a search result, a snippet in which the character string “movie” is highlighted in bold is obtained as a snippet. In FIG. 4, only one search result is shown, but tens of thousands of search results are usually obtained.

そして、この検索結果から、“映画を”につながる動詞の文字列が抽出される。ここでは“作る”が動詞の文字列として抽出される。なお、係り受け解析などを行うことにより、“作る”以外にもいくつかの動詞文字列が抽出される。そして、共起度計算が行われ、ここでは、“映画”と“作る”との共起度が計算される。ここでは、“映画”および“作る”のANDの検索が行われ、また“作る”のみの検索が行われ、それぞれ、1230000件、1430000件の検索数が検索され、これに基づいて共起度が0.86と算出される。この共起度0.86は、閾値Tより大きいため、ドメインタスクとして“映画を作る”が抽出され、また、これに関連するWebページ(またはURL)がタスクモデルとしてドメインタスクと対応付けて記憶部110に記憶される。   Then, from this search result, the character string of the verb that leads to “movie” is extracted. Here, “create” is extracted as a verb string. By performing dependency analysis, several verb character strings are extracted in addition to “create”. Then, the co-occurrence degree calculation is performed, and here, the co-occurrence degree of “movie” and “make” is calculated. Here, an AND search for “movie” and “create” is performed, and a search for only “create” is performed, and the number of searches for 12.3 million and 1.43 million is retrieved, respectively. Is calculated as 0.86. Since the co-occurrence degree 0.86 is larger than the threshold value T, “create movie” is extracted as a domain task, and the Web page (or URL) related thereto is associated with the domain task as a task model and is stored in the storage unit 110. Is remembered.

包含タスク検索パターン生成部103は、上述の通り取得されたドメインタスクを含んだ包含タスクを抽出するための検索パターンを生成する部分である。包含タスクとは、ドメインタスクを含んだタスクであり、「修飾語+助詞+ドメインタスク」で構成された文字列である。すなわち、包含タスクとは、ドメインタスクの下位に属した行動を示したものである。ここでは、包含タスク検索パターン生成部103は、助詞として“で”を選択して、“で映画を観る”といった検索パターンを生成し、Web検索部106は、この検索パターンを検索することができる。なお、本実施形態では、この助詞“で”のようなドメインタスクに対してその動作を修飾するための修飾語に連結させるための文字列を接続文字列と称する。   The included task search pattern generation unit 103 is a part that generates a search pattern for extracting an included task including the domain task acquired as described above. An inclusion task is a task including a domain task, and is a character string composed of “modifier + particle + domain task”. In other words, the inclusion task indicates an action belonging to the lower level of the domain task. Here, the inclusion task search pattern generation unit 103 selects “de” as a particle and generates a search pattern such as “watch a movie”, and the Web search unit 106 can search for this search pattern. . In the present embodiment, a character string that is linked to a modifier for modifying the operation of a domain task such as the particle “de” is referred to as a connection character string.

一方、語彙統語パターンは、この包含タスクに修飾語を付加した「修飾語+包含タスク」となり、検索パターンマッチング部107は、このような語彙統語パターンを有する文字列を抽出する。なお、係り受け解析を行うことにより、検索パターンマッチング部107は、「・・・で・・・映画を観る」というように助詞“で”が離れた場合も抽出することができる。   On the other hand, the lexical syntactic pattern becomes “modifier + inclusion task” obtained by adding a modifier to the inclusion task, and the search pattern matching unit 107 extracts a character string having such a lexical syntactic pattern. Note that by performing dependency analysis, the search pattern matching unit 107 can also extract the case where the particle “by” is separated, such as “... by watching a movie”.

Web検索部106は、包含タスク検索パターン生成部103により生成された包含タスク検索パターンを含んだWebページを検索し、検索パターンマッチング部107は、予め定められた語彙統語パターンを有する文字列(修飾語+助詞+ドメインタスク)を抽出する。   The Web search unit 106 searches for a Web page including the included task search pattern generated by the included task search pattern generation unit 103, and the search pattern matching unit 107 searches for a character string (modifier) having a predetermined lexical syntactic pattern. Word + particle + domain task).

そして、共起度計算部108は、ドメインタスクと修飾語との共起度を計算し、タスクモデル生成部109は、閾値T以上の共起度を有する包含タスクをタスクモデルとして記憶部110に記憶させる。   Then, the co-occurrence degree calculation unit 108 calculates the co-occurrence degree between the domain task and the modifier, and the task model generation unit 109 stores the inclusion task having the co-occurrence degree equal to or greater than the threshold T in the storage unit 110 as a task model. Remember.

この包含タスクの抽出について、図5を用いて説明する。図5は、包含タスクを抽出するまでの処理過程を示す説明図である。図5では、包含タスク取得用検索パターンは、“で映画を観る”が設定されている。そして、これを検索エンジンに入力して、検索結果が得られる。図4と同様に、この包含タスク取得用検索パターンに該当する文字列は太字で表されている。なお、図4と同様に、検索結果は何万ものWebページが検索される。   This inclusion task extraction will be described with reference to FIG. FIG. 5 is an explanatory diagram showing a processing process until an inclusion task is extracted. In FIG. 5, the inclusive task acquisition search pattern is set to “watch movie with”. And this is input into a search engine, and a search result is obtained. As in FIG. 4, the character string corresponding to this inclusion task acquisition search pattern is shown in bold. Similar to FIG. 4, tens of thousands of Web pages are searched as search results.

そして、共起度が計算される。図5では、“映画を観る”と“DVD”との共起度、および“映画を観る”と“映画館”との共起度がそれぞれ計算されている。   Then, the co-occurrence degree is calculated. In FIG. 5, the degree of co-occurrence between “watch movie” and “DVD” and the degree of co-occurrence between “watch movie” and “movie theater” are calculated.

つぎに、このように構成されたタスクモデル生成装置100のドメインタスクを抽出するときの処理について説明する。図7は、タスクモデル生成装置100のドメインタスクを抽出する方法を示すフローチャートである。図7に示されるとおり、オペレータによりドメイン指定部101からドメイン(文字列)が入力されて指定される(S101)。そして、ドメインタスク検索パターン生成部102によりドメインタスクを抽出するための検索パターンが生成される(S102)。   Next, a process for extracting a domain task of the task model generation device 100 configured as described above will be described. FIG. 7 is a flowchart illustrating a method for extracting a domain task of the task model generation device 100. As shown in FIG. 7, a domain (character string) is input and specified from the domain specifying unit 101 by the operator (S101). Then, a search pattern for extracting a domain task is generated by the domain task search pattern generation unit 102 (S102).

つぎに、Web検索部106により、ドメインタスク検索パターン生成部102により生成された検索パターンを用いた検索が行われる(S103)。ここで全ての検索パターンによる検索が実行された場合(S104:YES)、当該検索パターンにマッチする文字列が、検索パターンマッチング部107により抽出される(S105)。そして、共起度計算部108によりドメインと文字列との間の関連度合いを示す共起度が計算される(S106)。そして、タスクモデル生成部109により、閾値T以上の共起度の文字列が選択され、その文字列を含んだドメインタスクが生成される(S107)。生成されたドメインタスクは、そのURLとともに、記憶部110に記憶され、ユーザによりアクセス可能に保持される(S108)。   Next, the Web search unit 106 performs a search using the search pattern generated by the domain task search pattern generation unit 102 (S103). Here, when the search by all the search patterns is executed (S104: YES), the character string matching the search pattern is extracted by the search pattern matching unit 107 (S105). Then, the co-occurrence degree calculation unit 108 calculates the co-occurrence degree indicating the degree of association between the domain and the character string (S106). Then, the task model generation unit 109 selects a character string having a co-occurrence degree equal to or greater than the threshold T, and generates a domain task including the character string (S107). The generated domain task is stored in the storage unit 110 together with the URL, and is held accessible by the user (S108).

このようにして、指定されたドメインに基づいたドメイン検索用の検索パターンに従って該当する文字列が抽出され、その文字列を含んだドメインタスクが生成される。   In this manner, a corresponding character string is extracted according to a search pattern for domain search based on the designated domain, and a domain task including the character string is generated.

つぎに、包含タスクを生成する処理について説明する。図8は、包含タスクを生成するタスクモデル生成装置100の処理を示すフローチャートである。まず、図7に示される方法により、ドメインタスクが生成される(S201)。そして、包含タスク検索パターン生成部103により包含タスクを抽出するための検索パターンが生成される(S202)。そして、Web検索部106により、包含タスク検索パターン生成部103により生成された検索パターンを用いた検索が行われる(S203)。ここで全ての検索パターンによる検索が実行された場合(S204:YES)、当該検索パターンにマッチする文字列が、検索パターンマッチング部107により抽出され、そして語彙統語パターンに合致する文字列が抽出される(S205)。そして、共起度計算部108によりドメインタスクと文字列のうちの修飾語を示す修飾文字列との間の包含程度を示す共起度が計算される(S206)。そして、タスクモデル生成部109により、閾値T以上の共起度の修飾文字列が選択され、その修飾文字列を含んだ包含タスクが生成される(S207)。生成された包含タスクは、そのURLとともに、記憶部110に記憶され、ユーザによりアクセス可能に保持される(S208)。   Next, processing for generating an inclusion task will be described. FIG. 8 is a flowchart showing the processing of the task model generation device 100 that generates an inclusion task. First, a domain task is generated by the method shown in FIG. 7 (S201). Then, the search pattern for extracting the inclusion task is generated by the inclusion task search pattern generation unit 103 (S202). Then, the Web search unit 106 performs a search using the search pattern generated by the inclusion task search pattern generation unit 103 (S203). If a search using all search patterns is executed (S204: YES), a character string that matches the search pattern is extracted by the search pattern matching unit 107, and a character string that matches the lexical syntactic pattern is extracted. (S205). Then, the co-occurrence degree calculation unit 108 calculates the co-occurrence degree indicating the degree of inclusion between the domain task and the modifier character string indicating the modifier of the character string (S206). Then, the task model generation unit 109 selects a modified character string having a co-occurrence degree equal to or greater than the threshold T, and an included task including the modified character string is generated (S207). The generated inclusion task is stored in the storage unit 110 together with the URL, and is held accessible by the user (S208).

このようにして、ドメインが指定され、指定されたドメインに基づいたドメインタスクが抽出され、さらにこのドメインタスクを包含する包含タスクが抽出される。図6に、ドメイン、ドメインタスク、包含タスクの関連性を示す模式図を示す。図6に示されるとおり、ドメインとして“映画”が指定され、このドメインに基づいて、ドメインタスクとして“映画を観る”、“映画に出演する”、“映画を作る”が抽出される。さらに、“映画を観る”に包含される包含タスクとして、“映画館で映画を観る”、“家で映画を観る”、“字幕で映画を観る”、“TVで映画を観る”が抽出される。このようにして、ドメイン、ドメインタスク、包含タスクが関連付けられ、ユーザの行動を支援可能にするための、タスクモデルを生成することができる。   In this way, a domain is specified, a domain task based on the specified domain is extracted, and an inclusion task that includes this domain task is extracted. FIG. 6 is a schematic diagram showing the relationship between domains, domain tasks, and inclusion tasks. As shown in FIG. 6, “movie” is designated as a domain, and “watch movie”, “appear in movie”, and “create movie” are extracted as domain tasks based on this domain. In addition, “watch movie at cinema”, “watch movie at home”, “watch movie with subtitles”, “watch movie on TV” are extracted as inclusion tasks included in “watch movie” The In this way, a task model for associating a domain, a domain task, and an inclusion task and making it possible to support user behavior can be generated.

つぎに、ドメインタスクに関連する関連タスクについて説明する。この関連タスクは、ドメインを含んだ文字列のうち、ドメインタスクに関連の深いタスクである。例えば、ドメインが“映画”、ドメインタスクが“映画を観る”とした場合に、関連タスクは、ドメインタスク“映画を観る”に関連の深い“映画のチケットを買う”である。なお、関連の深いとは、ドメインタスクと関連タスクとの共起度が所定値以上であるものとする。以下、その詳細処理について説明する。   Next, related tasks related to the domain task will be described. This related task is a task closely related to the domain task among the character strings including the domain. For example, when the domain is “movie” and the domain task is “watch movie”, the related task is “buy a movie ticket” which is closely related to the domain task “watch movie”. Note that deeply related means that the co-occurrence degree between a domain task and a related task is a predetermined value or more. The detailed processing will be described below.

図9は、関連タスクを抽出するためのタスクモデル生成装置100aの機能を示すブロック図である。このタスクモデル生成装置100aは、ドメイン指定部101(入力手段)、ドメインタスク検索パターン生成部102(ドメインタスク検索パターン生成手段)、包含タスク検索パターン生成部103、Web検索部106(ドメインタスク検索手段)、検索パターンマッチング部107(ドメインタスク抽出手段)、共起度計算部108、タスクモデル生成部109、記憶部110、サブドメイン検索パターン生成部111(サブドメイン検索パターン生成手段)、Web検索部112(サブドメイン検索手段)、検索パターンマッチング部113(サブドメイン抽出手段)、関連タスク検索パターン生成部115(関連タスク検索パターン生成手段)、共起度計算部117(関連タスク共起度計算手段)、および関連付処理部118(関連付け処理手段)を含んで構成される。   FIG. 9 is a block diagram illustrating functions of the task model generation device 100a for extracting related tasks. The task model generation device 100a includes a domain designation unit 101 (input unit), a domain task search pattern generation unit 102 (domain task search pattern generation unit), an included task search pattern generation unit 103, a Web search unit 106 (domain task search unit). ), Search pattern matching unit 107 (domain task extraction unit), co-occurrence degree calculation unit 108, task model generation unit 109, storage unit 110, subdomain search pattern generation unit 111 (subdomain search pattern generation unit), Web search unit 112 (subdomain search means), search pattern matching section 113 (subdomain extraction means), related task search pattern generation section 115 (related task search pattern generation means), co-occurrence degree calculation section 117 (related task co-occurrence degree calculation means) ) And the association processing unit 118 ( Configured to include a communication with the processing unit).

このタスクモデル生成装置100aは、CPU等を備えたハードウェアから構成されているものであり、例えば、図3に示されているハードウェアにより各種機能が実現される。以下、各機能ブロックの説明をする。なお、ドメイン指定部101、ドメインタスク検索パターン生成部102、包含タスク検索パターン生成部103、Web検索部106、検索パターンマッチング部107、共起度計算部108、タスクモデル生成部109、記憶部110は、タスクモデル生成装置100と同じ機能構成をとるものであり、その詳細説明は省略する。   The task model generation device 100a is configured by hardware including a CPU and the like. For example, various functions are realized by the hardware illustrated in FIG. Hereinafter, each functional block will be described. The domain specifying unit 101, the domain task search pattern generation unit 102, the inclusion task search pattern generation unit 103, the Web search unit 106, the search pattern matching unit 107, the co-occurrence degree calculation unit 108, the task model generation unit 109, and the storage unit 110 Has the same functional configuration as that of the task model generation device 100, and a detailed description thereof will be omitted.

サブドメイン検索パターン生成部111は、サブドメインのための検索パターンを生成する部分である。サブドメインは、ドメイン指定部101から入力されたドメインを含んだ文字列であり、本実施形態では、「ドメイン+助詞“の”」と設定された文字列である。例えば、ドメインが“映画”である場合には、サブドメインは“映画の”となる。   The subdomain search pattern generation unit 111 is a part that generates a search pattern for a subdomain. The sub-domain is a character string including the domain input from the domain designating unit 101. In the present embodiment, the sub-domain is a character string set as “domain + particle”. For example, if the domain is “movie”, the subdomain is “movie”.

Web検索部112は、検索エンジン200にアクセスして、サブドメイン検索パターン生成部111により生成されたサブドメイン検索パターンに基づいて検索処理を行う部分である。例えば、Web検索部112は、サブドメイン検索パターン生成部111により生成された“映画の”という文字列からなる検索パターンを検索エンジン200に検索させる部分である。   The Web search unit 112 is a part that accesses the search engine 200 and performs a search process based on the subdomain search pattern generated by the subdomain search pattern generation unit 111. For example, the Web search unit 112 is a part that causes the search engine 200 to search for a search pattern composed of the character string “movie” generated by the subdomain search pattern generation unit 111.

検索パターンマッチング部113は、Web検索部112により検索されたWebページのスニペット(検索結果)から、予め定められた語彙統語パターンに合致するサブドメイン(文字列)を抽出する部分である。例えば、検索パターンマッチング部113は、語彙統語パターンとして、「ドメイン“映画”+助詞“の”+名詞」が設定された場合、「“映画の”+名詞」を構成する文章を、係り受け解析などを利用して抽出する。これにより検索パターンマッチング部113は、“映画のチケット”、“映画のスケジュール”などのサブドメイン(文字列)を含んだWebページをサブドメインとして抽出することができる。なお、ここでは公知技術である係り受け解析を行うことにより、「映画のチケット」などのように一連の文字列のみ抽出することなく、例えば「映画の試写会のチケット」などの文字列をも抽出することができる。また、検索パターンマッチング部113は、サブドメインとして、“ドメイン+名詞”とした語彙統語パターンに従った文字列を抽出するようにしてもよい。すなわち、助詞を用いない文字列としてもよく、上述の例では、“映画チケット”をサブドメインとしてもよい。   The search pattern matching unit 113 is a part that extracts a subdomain (character string) that matches a predetermined lexical syntactic pattern from a snippet (search result) of a Web page searched by the Web search unit 112. For example, when “domain“ movie ”+ particle“ no ”+ noun” is set as the lexical syntactic pattern, the search pattern matching unit 113 performs dependency analysis on the sentences constituting ““ movie ”+ noun”. Extract using etc. As a result, the search pattern matching unit 113 can extract a Web page including a subdomain (character string) such as “movie ticket” and “movie schedule” as a subdomain. Here, by performing dependency analysis, which is a well-known technique, without extracting only a series of character strings such as “movie ticket”, for example, a character string such as “movie preview ticket” is also included. Can be extracted. Further, the search pattern matching unit 113 may extract a character string according to a lexical syntactic pattern “domain + noun” as a subdomain. That is, it may be a character string that does not use a particle, and in the above example, “movie ticket” may be a subdomain.

さらに、検索パターンマッチング部113は、後述する関連タスク検索パターン生成部115により生成された関連タスクの検索パターンに基づいて検索処理された検索結果(スニペット)から、予め定められた語彙統語パターンに合致する関連タスク(文字列)を抽出する。ここでは、サブドメインを含んだ関連タスク(文字列)を抽出するものであり、「サブドメイン+助詞+動詞」を語彙統語パターンとする関連タスクを抽出する。例えば、サブドメイン“映画のチケット”、助詞“を”、動詞“購入する”で構成される関連タスクを抽出する。なお、助詞“を”にかえて、“の”、または“で”などとしてもよく、そのほかの助詞を適用してもよい。   Further, the search pattern matching unit 113 matches a predetermined lexical syntactic pattern from a search result (snippet) searched based on a search pattern of related tasks generated by the related task search pattern generation unit 115 described later. Related tasks (character strings) are extracted. Here, a related task (character string) including a subdomain is extracted, and a related task having “subdomain + particle + verb” as a lexical syntactic pattern is extracted. For example, a related task composed of the subdomain “movie ticket”, the particle “has”, and the verb “buy” is extracted. The particle “in” may be replaced with “no”, “de”, etc., and other particles may be applied.

関連タスク検索パターン生成部115は、検索パターンマッチング部113において抽出されたサブドメインに基づいて、関連タスクの検索パターンを生成する部分である。関連タスクは、サブドメインを含んだ文字列であり、本実施形態では、「サブドメイン+助詞“を”」と設定された文字列である。例えば、サブドメインが“映画のチケット”とした場合、検索パターンは、“映画のチケットを”となる。Web検索部112は、この検索パターンを含んだWebページを検索し、検索パターンマッチング部113は、「ドメイン+助詞“を”+動詞」を語彙統語パターンとする関連タスクを抽出する。例えば、検索パターンマッチング部113は、“映画のチケットを購入する”といった関連タスクを抽出することができる。なお、助詞を用いない場合もあり、その場合“映画チケット購入”とする関連タスクを抽出するようにしてもよい。   The related task search pattern generation unit 115 is a part that generates a search pattern for related tasks based on the subdomain extracted by the search pattern matching unit 113. The related task is a character string including a subdomain. In this embodiment, the related task is a character string set as “subdomain + particle”. For example, when the subdomain is “movie ticket”, the search pattern is “movie ticket”. The Web search unit 112 searches for a Web page including the search pattern, and the search pattern matching unit 113 extracts a related task having “domain + particle” as “+ verb” as a lexical syntactic pattern. For example, the search pattern matching unit 113 can extract a related task such as “purchase a movie ticket”. In some cases, particles are not used, and in this case, a related task for “movie ticket purchase” may be extracted.

共起度計算部117は、タスクモデル生成部109において生成されたドメインタスクと、検索パターンマッチング部113において、抽出された関連タスクとの関連度合いを示す共起度を計算する部分である。すなわち、共起度計算部117は、一の関連タスクがどのドメインタスクに対して関連付けをするかを決定するために、一の関連タスクと、タスクモデル生成部109において生成された複数のドメインタスクのそれぞれとの間の共起度を計算する。具体的な共起度の計算方法は、式1に示したものと同じである。   The co-occurrence degree calculation unit 117 is a part that calculates the co-occurrence degree indicating the degree of association between the domain task generated in the task model generation unit 109 and the extracted related task in the search pattern matching unit 113. That is, the co-occurrence degree calculation unit 117 determines a domain task to which one related task is associated with a plurality of domain tasks generated in the task model generation unit 109. Calculate the co-occurrence between each of the. A specific method for calculating the co-occurrence degree is the same as that shown in Equation 1.

関連付処理部118は、共起度計算部117において計算された共起度に基づいて、一番共起度の値の大きいドメインタスクに対して、一の関連タスクを対応付ける処理を行う。すなわち、関連付処理部118は、記憶部110において、どのドメインタスクの下層部分に関連タスクを記憶させるかを決定し、そのドメインタスクに関連付けて関連タスクを記憶させる。具体的には、関連付処理部118は、図13に示すとおり、関連付けられるドメインタスクのタスクIDを、関連タスクの親タスクID欄に記述することで、関連付けの処理を行う。また、関連付け処理部118は、関連タスクのタスクIDをユニークとなるように付与するものである。   The association processing unit 118 performs processing for associating one related task with the domain task having the largest co-occurrence value based on the co-occurrence degree calculated by the co-occurrence degree calculation unit 117. In other words, the association processing unit 118 determines which domain task is to store the related task in the storage unit 110 and stores the related task in association with the domain task. Specifically, as shown in FIG. 13, the association processing unit 118 performs association processing by describing the task ID of the associated domain task in the parent task ID column of the related task. The association processing unit 118 assigns the task ID of the related task to be unique.

このように構成されたタスクモデル生成装置100aにおける関連タスクを抽出するまでの過程について図10を用いて説明する。図10は、関連タスクを抽出する過程を示す説明図である。   A process until the related task is extracted in the task model generation device 100a configured as described above will be described with reference to FIG. FIG. 10 is an explanatory diagram showing a process of extracting related tasks.

図10では、サブドメイン取得用検索パターンとして、検索パターン“映画の”が生成されていることを示している。そして、これを用いて、検索エンジン200に、“映画の”を検索させる。検索エンジン200では、例えば、図10の検索結果欄に示されるような検索結果が得られる。例えば、サブドメインとして“映画のチケット”や、“映画の英語”などが得られる。   FIG. 10 shows that the search pattern “movie” is generated as the subdomain acquisition search pattern. Then, using this, the search engine 200 is caused to search for “movie”. In the search engine 200, for example, a search result as shown in the search result column of FIG. 10 is obtained. For example, “movie ticket” or “movie English” can be obtained as a subdomain.

つぎに、達成タスク取得用検索パターンが生成され、これに基づいた検索が行われる。例えば、本実施形態では、1)“映画のチケットを”、2)“映画の映画を”が生成され、これに基づいた検索が行われる。   Next, an achievement task acquisition search pattern is generated, and a search based on this is performed. For example, in this embodiment, 1) “movie ticket” and 2) “movie movie” are generated, and a search based on this is performed.

共起度の計算では、ドメインタスクとして、“映画を観る”、“映画で学ぶ”が生成されていたとすると、それぞれのドメインタスクと、関連タスク“映画のチケットを購入する”との間の共起度が、共起度計算部117により計算される。本実施形態では、関連タスク“映画のチケットを購入する”と、ドメインタスク“映画を観る”との共起度は、0.052、関連タスク“映画のチケットを購入する”と、ドメインタスク“映画で学ぶ”との共起度は、0.0021であることから、関連タスク“映画のチケットを購入する”は、ドメインタスク“映画を観る”に関連付けられる。同様にして、関連タスク“映画の英語を聞き取る”についても度面タスクとの間で関連付けがなされる。   In the calculation of the co-occurrence, if “watch movie” and “learn with movie” are generated as domain tasks, the co-occurrence between each domain task and the related task “buy movie ticket” The degree of occurrence is calculated by the co-occurrence degree calculation unit 117. In this embodiment, the co-occurrence of the related task “purchase a movie ticket” and the domain task “watch a movie” is 0.052, the related task “purchase a movie ticket”, and the domain task “ Since the co-occurrence with “learn in movies” is 0.0021, the related task “buy movie tickets” is associated with the domain task “watch movies”. Similarly, the related task “listening to English of the movie” is also associated with the front task.

つぎに、このように構成されたタスクモデル生成装置100aの処理について説明する。図11は、本実施形態のタスクモデル生成装置100aの処理を示すフローチャートである。まず、タスクモデル生成部109によりドメインタスクのタスクモデルが生成される(S301)。この詳細な処理は、図7および図8に示したとおりである。   Next, processing of the task model generation device 100a configured as described above will be described. FIG. 11 is a flowchart showing the processing of the task model generation device 100a of this embodiment. First, a task model for the domain task is generated by the task model generation unit 109 (S301). This detailed processing is as shown in FIG. 7 and FIG.

つぎに、サブドメイン検索パターン生成部111により、サブドメイン検索パターンが生成され(S302)、Web検索部112によりサブドメインの検索パターンを含んだWebページの検索が行われる(S303)。そして、Web検索部112において、全ての検索パターンを実行したと判断されると(S304)、検索パターンマッチング部113により検索パターンにマッチするサブドメインが抽出される(S305)。   Next, a subdomain search pattern is generated by the subdomain search pattern generation unit 111 (S302), and a Web page including the search pattern of the subdomain is searched by the Web search unit 112 (S303). When the Web search unit 112 determines that all search patterns have been executed (S304), the search pattern matching unit 113 extracts subdomains that match the search pattern (S305).

関連タスク検索パターン生成部115では、検索パターンマッチング部113により抽出されたサブドメインを用いて関連タスクの検索パターンが生成される(S306)。そして、この関連タスクの検索パターンによる検索が、Web検索部112により行われる(S307)。そして、Web検索部112において、全ての検索パターンを実行したと判断されると(S308)、検索パターンマッチング部113により検索パターンにマッチする関連タスクが抽出される(S309)。   The related task search pattern generation unit 115 generates a search pattern for related tasks using the subdomain extracted by the search pattern matching unit 113 (S306). Then, the search by the search pattern of the related task is performed by the Web search unit 112 (S307). If the Web search unit 112 determines that all search patterns have been executed (S308), the search pattern matching unit 113 extracts related tasks that match the search pattern (S309).

関連タスクが抽出されると、どのドメインタスクに関連付けたらよいか、その処理を行うために、抽出した一の関連タスクと、すでに抽出されている複数のドメインタスクとの間の共起度が計算される(S310)。そして、この共起度が高いドメインタスクに対して、関連タスクが関連付け処理が行われ(S311)、その関連付けが記憶部110に記憶される(S312)。   When related tasks are extracted, to determine which domain task should be associated, the co-occurrence degree between one extracted related task and multiple domain tasks that have already been extracted is calculated. (S310). Then, the related task is associated with the domain task having a high co-occurrence degree (S311), and the association is stored in the storage unit 110 (S312).

このように処理されたドメインタスクおよび関連タスクの関連付けを示す模式図を図12に示す。図12に示されるとおり、ドメインタスク“映画を観る”には、包含タスク“映画館で映画を観る”、“家で映画を観る”などが下層に関連付けられている。また、ドメインタスク“映画を観る”には、関連タスク“映画のチケットを買う”、“映画のスケジュールを確認する”などが関連付けられている。   FIG. 12 shows a schematic diagram showing the association between domain tasks and related tasks processed in this way. As shown in FIG. 12, the domain task “watch movie” has associated tasks “watch movie at cinema”, “watch movie at home”, and the like associated with lower layers. The domain task “watch movie” is associated with related tasks “buy movie ticket”, “check movie schedule”, and the like.

つぎに、本実施形態のタスクモデル生成装置100およびタスクモデル生成装置100aの作用効果について説明する。本実施形態のタスクモデル生成装置100において、ドメイン指定部101がユーザからドメインとなる文字列の入力を受け付け、ドメインタスク検索パターン生成部102は、このドメイン(入力文字列)を含んだドメインタスク取得用の検索パターンを生成する。Web検索部106は、生成された検索パターンを含んだWebページを検索し、検索パターンマッチング部107は、検索されたWebページから、検索パターンで示される検索パターン文字列(例えば、“映画を”)、および当該検索パターン文字列に結びついて動作を表す動作文字列(例えば、“観る”)含んだ一連の文字列(“映画を観る”)をドメインタスクとして抽出する。記憶部110は、抽出されたドメインタスクおよび当該ドメインタスクを含んだWebページのアクセス先情報(URL)を対応付けてタスクモデルとして記憶する。これにより、ユーザの行動支援のためのタスクモデル(データベース)を生成することができる。例えば、従来手作業等により1ヶ月程度かかっていたのに対して、本発明においては数時間でタスクモデルを構築することが期待できる。   Next, operational effects of the task model generation device 100 and the task model generation device 100a of the present embodiment will be described. In the task model generation device 100 of the present embodiment, the domain specification unit 101 receives an input of a character string as a domain from a user, and the domain task search pattern generation unit 102 acquires a domain task including this domain (input character string). Generate a search pattern for The Web search unit 106 searches for a Web page including the generated search pattern, and the search pattern matching unit 107 searches the search pattern character string (for example, “movie”) indicated by the search pattern from the searched Web page. ), And a series of character strings (“watch movie”) including an action character string (for example, “watch”) representing an action linked to the search pattern character string are extracted as domain tasks. The storage unit 110 stores the extracted domain task and the access destination information (URL) of the Web page including the domain task in association with each other as a task model. Thereby, the task model (database) for user's action support can be generated. For example, it can be expected that a task model is constructed in a few hours in the present invention, whereas it takes about one month due to manual work.

また、本実施形態のタスクモデル生成装置100において、ドメイン指定部101において受け付けられたドメインとなる入力文字列(例えば、“映画”)に連結することで動作を表す語句に結びつけるための助詞(本実施形態では、“を”であるが、これに限定はしない)を、入力文字列の後ろに連結して検索パターン(例えば、“映画を”)を生成することができる。これにより、ユーザの行動を支援するための文字列を的確に表すことができ、そのためのタスクモデルを生成することができる。   Further, in the task model generation device 100 of the present embodiment, a particle (this book) for linking to an input character string (for example, “movie”) that is a domain accepted by the domain designating unit 101 and linked to a phrase representing an action. In an embodiment, “but” (but not limited to) can be concatenated after the input string to generate a search pattern (eg, “movie”). Thereby, the character string for supporting a user's action can be represented exactly, and the task model for it can be produced | generated.

また、本実施形態のタスクモデル生成装置100において、助詞“を”をドメインとなる入力文字列の後ろに連結して、検索パターンを生成することができ、ユーザの行動を支援するための文字列を的確に表すことができ、そのためのタスクモデルを生成することができる。   Further, in the task model generation device 100 of the present embodiment, a particle can be generated by concatenating the particle "" to the back of the input character string as a domain, and generate a search pattern. Can be accurately represented, and a task model for that can be generated.

また、本実施形態のタスクモデル生成装置100において、検索部106、若しくは検索エンジン200が係り受け解析を行うことで、検索パターンマッチング部107は、ドメインとなる入力文字列(例えば、“映画”)に対応する動作文字列(例えば、“観る”)を判断し、検索パターンおよび動作文字列を含んだ一連の文字列を抽出することができる。これにより、ユーザの行動を支援するための文字列を的確に表すことができ、そのためのタスクモデルを生成することができる。すなわち、文字のパターンマッチングによらず、文章としても意味を考慮した文字列の抽出を行うことで、より的確なタスクモデルを構築することができる。   In the task model generation device 100 of this embodiment, the search unit 106 or the search engine 200 performs dependency analysis, so that the search pattern matching unit 107 has an input character string (for example, “movie”) serving as a domain. Can be extracted, and a series of character strings including the search pattern and the action character string can be extracted. Thereby, the character string for supporting a user's action can be represented exactly, and the task model for it can be produced | generated. In other words, a more accurate task model can be constructed by extracting a character string considering the meaning of a sentence, regardless of character pattern matching.

また、本実施形態のタスクモデル生成装置100において、検索パターンマッチング部107は、ドメインとなる入力文字列をそのまま検索パターンとする場合においては、その検索パターンの直後に連結され、動作を表す漢字のみからなる文字列(例えば、“鑑賞”)を、検索パターンとともにドメインタスク(この場合、“映画鑑賞”となる)として抽出することにより、助詞を用いることなく、ユーザの行動を支援するための文字列を的確に表すことができ、そのためのタスクモデルを生成することができる。   Further, in the task model generation device 100 of the present embodiment, the search pattern matching unit 107, when an input character string as a domain is used as it is as a search pattern, is connected immediately after the search pattern and only the kanji representing the operation. A character string for supporting a user's action without using a particle by extracting a character string consisting of (for example, “watching”) as a domain task (in this case, “watching movie”) together with a search pattern. The column can be accurately represented, and a task model for it can be generated.

また、本実施形態のタスクモデル生成装置100において、包含タスク検索パターン生成部103は、ドメインタスクであるドメインタスク文字列(例えば、“映画を観る”)に対して、当該ドメインタスク文字列で示される動作を修飾するための修飾語に連結させるための連結文字列(例えば、“で”)を付加した包含タスク検索パターン(例えば、“で映画を観る”)を生成する。Web検索部106は、生成された包含タスク検索パターンを含んだWebページを検索し、検索パターンマッチング部107は、包含タスク検索パターンに修飾語を示す修飾文字列(例えば、“映画館で”)が連結された包含タスク文字列(例えば、“映画館で映画を観る”)を抽出することができる。これにより、ドメインタスクを包含するタスクを取得することができ、ユーザ支援のための行動をさらに細分化して支援することができる。   Further, in the task model generation device 100 of the present embodiment, the inclusion task search pattern generation unit 103 indicates a domain task character string (for example, “watch movie”) that is a domain task by the domain task character string. An inclusion task search pattern (for example, “watch a movie with”) to which a concatenated character string (for example, “by”) is added to a modifier for modifying the generated operation is generated. The Web search unit 106 searches for a Web page that includes the generated inclusion task search pattern, and the search pattern matching unit 107 uses a modifier character string (for example, “in a movie theater”) that indicates a modifier in the inclusion task search pattern. Can be extracted (for example, “watch a movie in a movie theater”). As a result, tasks including domain tasks can be acquired, and actions for user support can be further subdivided and supported.

また、本実施形態のタスクモデル生成装置100において、共起度計算部108は、ドメインとなる入力文字列と動作文字列との関連度合いを示す共起度を計算する。そして、この計算結果に基づいて、タスクモデル生成部109は、所定値以上の共起度を有するドメインタスクを抽出することができる。これにより、関連度合いの大きい文字列を結びつけることができ、ユーザに対してより的確な行動支援をすることができ、また関係のあまり無いWebページを除去することができる。   In the task model generation device 100 of the present embodiment, the co-occurrence degree calculation unit 108 calculates a co-occurrence degree indicating the degree of association between the input character string serving as the domain and the action character string. Based on the calculation result, the task model generation unit 109 can extract a domain task having a co-occurrence degree equal to or greater than a predetermined value. As a result, character strings having a high degree of association can be linked, more accurate action support can be provided to the user, and unrelated web pages can be removed.

また、本実施形態のタスクモデル生成装置100において、タスクモデル生成部109において生成されたドメインタスクと修飾文字列との関連度合いを示す共起度を計算し、タスクモデル生成部109は、この計算結果に基づいて、所定値以上の共起度を有する包含タスクを抽出することができる。これにより、関連度合いの大きい文字列を結びつけることができ、ユーザに対してより的確な行動支援をすることができ、また関係のあまり無いWebページを序供することができる。   Further, in the task model generation device 100 of the present embodiment, the co-occurrence degree indicating the degree of association between the domain task generated by the task model generation unit 109 and the modified character string is calculated, and the task model generation unit 109 performs this calculation. Based on the result, an inclusion task having a co-occurrence degree equal to or greater than a predetermined value can be extracted. As a result, character strings having a high degree of association can be linked, more accurate action support can be provided to the user, and a web page with little relation can be provided.

また、本実施形態のタスクモデル生成装置100aにおいて、サブドメイン検索パターン生成部111は、ドメイン指定部101においてユーザから受け付けられた入力文字列を含んだ検索パターン(例えば、“映画の”)を生成し、Web検索部112は、生成された検索パターンを含んだWebページを検索する。そして、検索パターンマッチング部113は、検索されたWebページから、検索パターンに結びついている名詞文字列(例えば、“チケット”)からなる一連の文字列(例えば、“映画のチケット”)をサブドメインとして抽出し、関連タスク検索パターン生成部115は、抽出されたサブドメインを示すサブドメイン文字列を関連タスク取得用の検索パターン(例えば、“映画のチケットを”)として生成する。Web検索部112は、さらに、生成された検索パターンを含んだWebページを検索し、検索パターンマッチング部113は、検索されたWebページから、検索パターン文字列および当該検索パターン文字列に結びついている動作を表す動作文字列(例えば、“購入する”)からなる一連の文字列を関連タスク(例えば、“映画のチケットを購入する”)として抽出する。記憶部110は、抽出された関連タスクおよび当該関連タスクを含んだWebページのアクセス先情報を対応付けて記憶する。これにより、ユーザの行動支援のためのタスクモデル(データベース)を生成することができる。例えば、従来手作業等により1ヶ月程度かかっていたのに対して、本発明においては数時間でタスクモデルを構築することが期待できる。   In the task model generation device 100a of this embodiment, the subdomain search pattern generation unit 111 generates a search pattern (for example, “movie”) including an input character string received from the user in the domain specification unit 101. Then, the Web search unit 112 searches for a Web page including the generated search pattern. Then, the search pattern matching unit 113 sub-domains a series of character strings (for example, “movie ticket”) composed of noun character strings (for example, “ticket”) linked to the search pattern from the searched Web page. The related task search pattern generation unit 115 generates a subdomain character string indicating the extracted subdomain as a search pattern for acquiring a related task (for example, “movie ticket”). The Web search unit 112 further searches for a Web page including the generated search pattern, and the search pattern matching unit 113 is linked to the search pattern character string and the search pattern character string from the searched Web page. A series of character strings consisting of action character strings representing actions (for example, “purchase”) are extracted as related tasks (for example, “purchase a movie ticket”). The storage unit 110 stores the extracted related task and the access destination information of the Web page including the related task in association with each other. Thereby, the task model (database) for user's action support can be generated. For example, it can be expected that a task model is constructed in a few hours in the present invention, whereas it takes about one month due to manual work.

また、本実施形態のタスクモデル生成装置100aにおいて、共起度計算部117は、予め定められた文字列からなるドメインタスク(例えば、“映画を観る”)と関連タスク(例えば、“映画のチケットを購入する”)との関連度合いを示す共起度を計算し、計算された共起度に基づいて、関連タスクとドメインタスクとの対応付けを行う。これにより、関連タスクを、より関連度合いの高いドメインタスクに対応付けることができ、ユーザの行動支援をより的確に行うことができる。   Further, in the task model generation apparatus 100a of the present embodiment, the co-occurrence degree calculation unit 117 includes a domain task (for example, “watch movie”) composed of a predetermined character string and a related task (for example, “movie ticket”). The co-occurrence degree indicating the degree of relevance to “purchased”) is calculated, and the related task and the domain task are associated based on the calculated co-occurrence degree. As a result, the related task can be associated with a domain task having a higher degree of association, and the user's action support can be performed more accurately.

10…通信システム、100…タスクモデル生成装置、100a…タスクモデル生成装置、101…ドメイン指定部、102…ドメインタスク検索パターン生成部、103…包含タスク検索パターン生成部、104…サブドメイン検索パターン生成部、105…関連タスク検索パターン生成部、106…Web検索部、107…検索パターンマッチング部、108…共起度計算部、109…タスクモデル生成部、110…記憶部、111…サブドメイン検索パターン生成部、112…Web検索部、113…検索パターンマッチング部、115…関連タスク検索パターン生成部、117…共起度計算部、118…関連付処理部、200…検索エンジン、300…携帯端末、300…検索エンジン。 DESCRIPTION OF SYMBOLS 10 ... Communication system, 100 ... Task model generation apparatus, 100a ... Task model generation apparatus, 101 ... Domain specification part, 102 ... Domain task search pattern generation part, 103 ... Inclusion task search pattern generation part, 104 ... Sub domain search pattern generation , 105 ... related task search pattern generation unit, 106 ... Web search unit, 107 ... search pattern matching unit, 108 ... co-occurrence degree calculation unit, 109 ... task model generation unit, 110 ... storage unit, 111 ... subdomain search pattern Generation unit 112 ... Web search unit 113 ... Search pattern matching unit 115 ... Related task search pattern generation unit 117 ... Co-occurrence degree calculation unit 118 ... Association processing unit 200 ... Search engine 300 ... Mobile terminal 300 ... Search engine.

Claims (12)

ユーザから文字列の入力を受け付ける入力手段と、
前記入力手段により受け付けられた入力文字列を含んだ検索パターンを生成するドメインタスク検索パターン生成手段と、
前記ドメインタスク検索パターン生成手段により生成された検索パターンを含んだWebページを検索するドメインタスク検索手段と、
前記ドメインタスク検索手段により検索されたWebページから、前記検索パターンで示される検索パターン文字列、および当該検索パターン文字列に結びついて動作を表す動作文字列を含んだ一連の文字列をドメインタスクとして抽出するドメインタスク抽出手段と、
前記ドメインタスク抽出手段により抽出されたドメインタスクおよび当該ドメインタスクを含んだWebページのアクセス先情報を対応付けてタスクモデルとして記憶する記憶手段と
を備えるタスクモデル生成装置。
An input means for receiving input of a character string from the user;
A domain task search pattern generation means for generating a search pattern including an input character string received by the input means;
Domain task search means for searching for a web page including a search pattern generated by the domain task search pattern generation means;
From the Web page searched by the domain task search means, a search pattern character string indicated by the search pattern and a series of character strings including an operation character string representing an operation in connection with the search pattern character string are used as a domain task. A domain task extracting means for extracting;
A task model generation apparatus comprising: a storage unit that stores the domain task extracted by the domain task extraction unit and the access destination information of the Web page including the domain task in association with each other.
前記ドメインタスク検索パターン生成手段は、前記入力手段により受け付けられた入力文字列に連結することで動作を表す語句に結びつけるための助詞を、前記入力文字列の後ろに連結して検索パターンを生成することを特徴とする請求項1に記載のタスクモデル生成装置。   The domain task search pattern generation unit generates a search pattern by connecting a particle that is connected to an input character string received by the input unit to be connected to a word representing an action after the input character string. The task model generation device according to claim 1. 前記ドメインタスク検索パターン生成手段は、助詞“を”を前記入力文字列の後ろに連結して、検索パターンを生成することを特徴とする請求項2に記載のタスクモデル生成装置。   3. The task model generation apparatus according to claim 2, wherein the domain task search pattern generation unit generates a search pattern by connecting the particle "" to the end of the input character string. 前記ドメインタスク抽出手段は、係り受け解析を行うことで、前記入力文字列に対応する動作文字列を判断し、前記検索パターンおよび前記動作文字列を含んだ一連の文字列を抽出することを特徴とする請求項1から3のいずれか一項に記載のタスクモデル生成装置。   The domain task extraction unit performs dependency analysis to determine an operation character string corresponding to the input character string, and extracts a series of character strings including the search pattern and the operation character string. The task model generation device according to any one of claims 1 to 3. 前記ドメインタスク抽出手段は、前記検索パターンの直後に連結され、動作を表す漢字のみからなる文字列を、前記検索パターンとともにドメインタスクとして抽出することを特徴とする請求項1に記載のタスクモデル生成装置。   2. The task model generation according to claim 1, wherein the domain task extraction unit extracts, as a domain task, a character string that is connected immediately after the search pattern and includes only kanji representing an action together with the search pattern. apparatus. 前記ドメインタスク抽出手段により抽出されたドメインタスクであるドメインタスク文字列に対して、当該ドメインタスク文字列で示される動作を修飾するための修飾語に連結させるための連結文字列を付加した包含タスク検索パターンを生成する包含タスク検索パターン生成手段、
をさらに備え、
前記ドメインタスク検索手段は、前記包含タスク検索パターン生成手段により生成された包含タスク検索パターンを含んだWebページを検索し、
前記ドメインタスク抽出手段は、前記包含タスク検索パターンに修飾語を示す修飾文字列が連結された包含タスク文字列を抽出することを特徴とする請求項1から5のいずれか一項に記載のタスクモデル生成装置。
An inclusion task in which a concatenated character string for concatenating a domain task character string, which is a domain task extracted by the domain task extracting means, with a modifier for modifying the operation indicated by the domain task character string is added. Inclusion task search pattern generation means for generating a search pattern;
Further comprising
The domain task search means searches for a web page including the inclusion task search pattern generated by the inclusion task search pattern generation means,
The task according to any one of claims 1 to 5, wherein the domain task extraction unit extracts an inclusion task character string in which a modification character string indicating a modification word is connected to the inclusion task search pattern. Model generator.
前記入力文字列と前記動作文字列との関連度合いを示す共起度を計算するドメイン共起度計算手段をさらに備え、
前記ドメインタスク抽出手段は、前記ドメイン共起度計算手段による計算結果に基づいて、所定値以上の共起度を有するドメインタスクを抽出することを特徴とする請求項1から6のいずれか一項に記載のタスクモデル生成装置。
A domain co-occurrence degree calculating means for calculating a co-occurrence degree indicating a degree of association between the input character string and the action character string;
7. The domain task extraction unit extracts a domain task having a co-occurrence degree equal to or greater than a predetermined value based on a calculation result by the domain co-occurrence degree calculation unit. The task model generation device described in 1.
前記ドメインタスクと前記修飾文字列との関連度合いを示す共起度を計算する包含タスク共起度計算手段をさらに備え、
前記ドメインタスク抽出手段は、前記包含タスク共起度計算手段による計算結果に基づいて、所定値以上の共起度を有する包含タスクを抽出することを特徴とする請求項6または7のいずれか一項に記載のタスクモデル生成装置。
An inclusion task co-occurrence degree calculating means for calculating a co-occurrence degree indicating a degree of association between the domain task and the modifier character string;
8. The domain task extraction unit extracts an inclusion task having a co-occurrence degree equal to or greater than a predetermined value based on a calculation result by the inclusion task co-occurrence degree calculation unit. The task model generation device according to item.
ユーザから文字列の入力を受け付ける入力手段と、
前記入力手段により受け付けられた入力文字列を含んだ検索パターンを生成するサブドメイン検索パターン生成手段と、
前記サブドメイン検索パターン生成手段により生成された検索パターンを含んだWebページを検索するサブドメイン検索手段と、
前記ドメインタスク検索手段により検索されたWebページから、前記検索パターンに結びついている名詞文字列からなる一連の文字列をサブドメインとして抽出するサブドメイン抽出手段と、
前記サブドメイン抽出手段により抽出されたサブドメインを示すサブドメイン文字列から関連タスクの検索パターンとして生成する関連タスク検索パターン生成手段と、
前記関連タスク検索パターン生成手段により生成された検索パターンを含んだWebページを検索する関連タスク検索手段と、
前記関連タスク検索手段により検索されたWebページから、前記検索パターン文字列および当該検索パターン文字列に結びついている動作を表す動作文字列からなる一連の文字列を関連タスクとして抽出する関連タスク抽出手段と、
前記関連タスク抽出手段により抽出された関連タスクおよび当該関連タスクを含んだWebページのアクセス先情報を対応付けて記憶する記憶手段と
を備えるタスクモデル生成装置。
An input means for receiving input of a character string from the user;
Sub-domain search pattern generation means for generating a search pattern including an input character string received by the input means;
Subdomain search means for searching for a web page including a search pattern generated by the subdomain search pattern generation means;
Subdomain extraction means for extracting, as a subdomain, a series of character strings composed of noun character strings linked to the search pattern from the web page searched by the domain task search means;
Related task search pattern generation means for generating a search pattern of related tasks from a subdomain character string indicating a subdomain extracted by the subdomain extraction means;
Related task search means for searching for a Web page including a search pattern generated by the related task search pattern generation means;
Related task extraction means for extracting, as a related task, a series of character strings composed of the search pattern character string and an action character string representing an action linked to the search pattern character string from the Web page searched by the related task search means When,
A task model generation device comprising: a storage unit that stores the related task extracted by the related task extraction unit and the access destination information of the Web page including the related task in association with each other.
前記入力手段により受け付けられた入力文字列を含んだ検索パターンを生成するドメインタスク検索パターン生成手段と、
前記ドメインタスク検索パターン生成手段により生成された検索パターンを含んだWebページを検索するドメインタスク検索手段と、
前記ドメインタスク検索手段により検索されたWebページから、前記検索パターンで示される検索パターン文字列、および当該検索パターン文字列に結びついて動作を表す動作文字列を含んだ一連の文字列をドメインタスクとして抽出するドメインタスク抽出手段と、
を備え、前記記憶手段は、前記ドメインタスク抽出手段により抽出されたドメインタスクおよび当該ドメインタスクを含んだWebページのアクセス先情報を対応付けてタスクモデルとして記憶するタスクモデル生成装置であって、
さらに、
予め定められた文字列からなるドメインタスクと関連タスクとの関連度合いを示す共起度を計算する関連タスク共起度計算手段と、
前記関連タスク共起度計算手段により計算された共起度に基づいて、関連タスクとドメインタスクとの関連付けを行う関連付け処理手段とを備える請求項9に記載のタスクモデル生成装置。
A domain task search pattern generation means for generating a search pattern including an input character string received by the input means;
Domain task search means for searching for a web page including a search pattern generated by the domain task search pattern generation means;
From the Web page searched by the domain task search means, a search pattern character string indicated by the search pattern and a series of character strings including an operation character string representing an operation in connection with the search pattern character string are used as a domain task. A domain task extracting means for extracting;
The storage means is a task model generation device that stores the domain task extracted by the domain task extraction means and the access destination information of the Web page including the domain task as a task model in association with each other,
further,
A related task co-occurrence degree calculating means for calculating a co-occurrence degree indicating a degree of association between a domain task and a related task made of a predetermined character string;
The task model generation device according to claim 9, further comprising an association processing unit that associates a related task with a domain task based on the co-occurrence degree calculated by the related task co-occurrence degree calculating unit.
ユーザから文字列の入力を受け付ける入力ステップと、
前記入力ステップにより受け付けられた入力文字列を含んだ検索パターンを生成するドメインタスク検索パターン生成ステップと、
前記ドメインタスク検索パターン生成ステップにより生成された検索パターンを含んだWebページを検索する検索ステップと、
前記検索ステップにより検索されたWebページから、前記検索パターンで示される検索パターン文字列、および当該検索パターン文字列に結びついて動作を表す動作文字列を含んだ一連の文字列をドメインタスクとして抽出するドメインタスク抽出ステップと、
前記ドメインタスク抽出ステップにより抽出されたドメインタスクおよび当該ドメインタスクを含んだWebページのアクセス先情報を対応付けてタスクモデルとして記憶手段に記憶する記憶ステップと
を備えるタスクモデル生成方法。
An input step for accepting input of a character string from the user;
A domain task search pattern generation step for generating a search pattern including the input character string received by the input step;
A search step of searching for a web page including the search pattern generated by the domain task search pattern generation step;
From the Web page searched by the search step, a search pattern character string indicated by the search pattern and a series of character strings including an action character string representing an action linked to the search pattern character string are extracted as a domain task. A domain task extraction step;
A storage step of storing the domain task extracted in the domain task extraction step and the access destination information of the Web page including the domain task in a storage unit in association with each other.
ユーザから文字列の入力を受け付ける入力ステップと、
前記入力ステップにより受け付けられた入力文字列を含んだ検索パターンを生成するサブドメイン検索パターン生成ステップと、
前記サブドメイン検索パターン生成ステップにより生成された検索パターンを含んだWebページを検索するサブドメイン検索ステップと、
前記サブドメイン検索ステップにより検索されたWebページから、前記検索パターンに結びついている名詞文字列からなる一連の文字列をサブドメインとして抽出するサブドメイン抽出ステップと、
前記サブドメイン抽出ステップにより抽出されたサブドメインを示すサブドメイン文字列を関連タスクの検索パターンとして生成する関連タスク検索パターン生成ステップと、
前記関連タスク検索パターン生成ステップにより生成された検索パターンを含んだWebページを検索する関連タスク検索ステップと、
前記関連タスク検索ステップにより検索されたWebページから、前記検索パターン文字列および当該検索パターン文字列に結びついている動作を表す動作文字列からなる一連の文字列を関連タスクとして抽出する関連タスク抽出ステップと、
前記関連タスク抽出ステップにより抽出された関連タスクおよび当該関連タスクを含んだWebページのアクセス先情報を対応付けて記憶手段に記憶する記憶ステップと
を備えるタスクモデル生成方法。

An input step for accepting input of a character string from the user;
A subdomain search pattern generation step of generating a search pattern including the input character string received by the input step;
A subdomain search step of searching for a Web page including the search pattern generated by the subdomain search pattern generation step;
A subdomain extraction step of extracting a series of character strings consisting of noun character strings linked to the search pattern as subdomains from the web page searched by the subdomain search step;
A related task search pattern generation step of generating a subdomain character string indicating the subdomain extracted by the subdomain extraction step as a search pattern of the related task;
A related task search step of searching for a Web page including the search pattern generated by the related task search pattern generation step;
Related task extraction step for extracting a series of character strings consisting of the search pattern character string and an action character string representing an action linked to the search pattern character string as a related task from the Web page searched in the related task search step When,
And a storage step of storing the related task extracted in the related task extraction step and the access destination information of the Web page including the related task in a storage unit in association with each other.

JP2009195567A 2009-08-26 2009-08-26 Task model generation apparatus and task model generation method Active JP5378109B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009195567A JP5378109B2 (en) 2009-08-26 2009-08-26 Task model generation apparatus and task model generation method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009195567A JP5378109B2 (en) 2009-08-26 2009-08-26 Task model generation apparatus and task model generation method

Publications (2)

Publication Number Publication Date
JP2011048558A true JP2011048558A (en) 2011-03-10
JP5378109B2 JP5378109B2 (en) 2013-12-25

Family

ID=43834820

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009195567A Active JP5378109B2 (en) 2009-08-26 2009-08-26 Task model generation apparatus and task model generation method

Country Status (1)

Country Link
JP (1) JP5378109B2 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08129554A (en) * 1994-05-25 1996-05-21 Fuji Xerox Co Ltd Relation expression extracting device and retrieval device for relation expression
JPH11259524A (en) * 1998-03-06 1999-09-24 Omron Corp Information retrieval system, information processing method in information retrieval system and record medium
JP2008140204A (en) * 2006-12-04 2008-06-19 Toshiba Corp Data retrieval system and program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08129554A (en) * 1994-05-25 1996-05-21 Fuji Xerox Co Ltd Relation expression extracting device and retrieval device for relation expression
JPH11259524A (en) * 1998-03-06 1999-09-24 Omron Corp Information retrieval system, information processing method in information retrieval system and record medium
JP2008140204A (en) * 2006-12-04 2008-06-19 Toshiba Corp Data retrieval system and program

Also Published As

Publication number Publication date
JP5378109B2 (en) 2013-12-25

Similar Documents

Publication Publication Date Title
JP5647508B2 (en) System and method for identifying short text communication topics
CN102779114B (en) It is supported using the unstructured data of automatically rule generation
JP5229226B2 (en) Information sharing system, information sharing method, and information sharing program
US20100185600A1 (en) Apparatus and method for integration search of web site
US20100138428A1 (en) Keyword output apparatus and method
JP5090547B2 (en) Transliteration processing device, transliteration processing program, computer-readable recording medium recording transliteration processing program, and transliteration processing method
GB2401972A (en) Identifying special word usage in a document
WO2008151466A1 (en) Dictionary word and phrase determination
US8099430B2 (en) Computer method and apparatus of information management and navigation
WO2008022581A1 (en) Method and device for obtaining the new words and input method system
JP2011108085A (en) Knowledge construction device and program
WO2009026850A1 (en) Domain dictionary creation
JP2022532451A (en) How to disambiguate Chinese place name meanings based on encyclopedia knowledge base and word embedding
Strzelecki et al. Direct answers in Google search results
CN111259262A (en) Information retrieval method, device, equipment and medium
JPWO2003060764A1 (en) Information retrieval system
JP5302614B2 (en) Facility related information search database formation method and facility related information search system
JP2011175486A (en) Apparatus, program and method for supporting check of name collecting
JP2006023968A (en) Unique expression extracting method and device and program to be used for the same
JP5378109B2 (en) Task model generation apparatus and task model generation method
JP2009265770A (en) Significant sentence presentation system
JP5228529B2 (en) Data search program, data search device, and data search method
KR101421819B1 (en) Method for providing keyword search result using balloon in an online environment
JP5843235B2 (en) WEB information processing apparatus, WEB information processing method, and program
Kuo et al. MusicStand: Listening to song lyrics using a map query interface

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120224

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130527

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130604

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130719

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130925

R150 Certificate of patent or registration of utility model

Ref document number: 5378109

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250