WO2023073777A1 - 情報処理システム、情報処理方法及びプログラム - Google Patents

情報処理システム、情報処理方法及びプログラム Download PDF

Info

Publication number
WO2023073777A1
WO2023073777A1 PCT/JP2021/039345 JP2021039345W WO2023073777A1 WO 2023073777 A1 WO2023073777 A1 WO 2023073777A1 JP 2021039345 W JP2021039345 W JP 2021039345W WO 2023073777 A1 WO2023073777 A1 WO 2023073777A1
Authority
WO
WIPO (PCT)
Prior art keywords
query
morphemes
morpheme
search
pages
Prior art date
Application number
PCT/JP2021/039345
Other languages
English (en)
French (fr)
Inventor
直也 榊原
祐樹 廣部
Original Assignee
データ・サイエンティスト株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by データ・サイエンティスト株式会社 filed Critical データ・サイエンティスト株式会社
Priority to PCT/JP2021/039345 priority Critical patent/WO2023073777A1/ja
Priority to JP2023525619A priority patent/JP7437104B2/ja
Publication of WO2023073777A1 publication Critical patent/WO2023073777A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Definitions

  • the present invention relates to an information processing system, an information processing method, and a program.
  • search engine measures are often emphasized when creating web pages (hereinafter referred to as pages).
  • any search query that is expected to be used by the target user of the page to be produced (hereinafter referred to as the target query) is regarded as the theme of the page, and the table of contents, menus, tables, and commentary to establish the theme
  • page morphemes included in multiple pages (hereinafter referred to as search hit pages) that are displayed at the top of the search results of the target query (see Patent Document 1) Refer to it or use it.
  • the query morpheme may be the smallest word that makes sense, or a group of multiple words that make sense.
  • Query morphemes are known to tend to indicate the sub-needs of the target user, and are suitable for descriptions on pages with the subject of the target query, especially HTML tags or attributes that indicate the table of contents, menus, etc. tend to include
  • the page creator manually investigates a large number of query morphemes ranging from tens to thousands, selects the one that seems appropriate for each page, and inserts it into HTML tags that seem appropriate within each page. Describes the character string or the attribute in the HTML tag. After that, check for omissions of query morphemes for each page and handle excesses and deficiencies. In addition, by comparing the degree of implementation of query morphemes on the page to be produced with those of each upper page, we will try to grasp the content competitiveness of the page to be produced before release. Since this series of operations is extremely complicated and requires a large number of man-hours, an auxiliary tool for rationalization is required.
  • One object of the present invention is to improve the efficiency of query morpheme selection work on production target pages or implementation degree analysis of query morphemes on pages hit by target queries. It is to provide an information processing system, an information processing method, and a program that make it possible.
  • the information processing system includes counting means for counting the number or ratio of query morphemes included in part or all of the source of the search hit page of the target query, and the counted query morpheme and an output means for outputting information for displaying the number or ratio, and the query morpheme is the target query used when requesting a search to a search engine.
  • counting means for counting the number or ratio of query morphemes included in part or all of the source of the search hit page of the target query
  • the counted query morpheme and an output means for outputting information for displaying the number or ratio
  • the query morpheme is the target query used when requesting a search to a search engine.
  • the compound queries used in searches in the past It is morpheme-less of the target query.
  • An information processing system is the information processing system according to the first aspect, wherein the query morpheme included in part of the source of the plurality of pages is a plurality of sites in the source a plurality of strings described in association with skeleton tags, wherein the counting means counts the number or proportion of query morphemes in the plurality of strings associated with the plurality of site skeleton tags in the source;
  • the output means outputs information for displaying the number or ratio of the counted query morphemes, and the site skeleton tag uses words that form the skeleton of the site content, such as the table of contents and linked page theme.
  • An information processing system is the information processing system according to the second aspect, wherein for each search hit page of the target query, the counting means counts a plurality of Counting the number or ratio of query morphemes in a plurality of character strings associated with the site skeleton tag, the output means outputs information for comparatively displaying the counted number or ratio of query morphemes. .
  • An information processing system is the information processing system according to the second aspect, wherein the counting means counts the number or ratio of the query morphemes for each type of site skeleton tag.
  • the output means outputs information for displaying the number or ratio of the query morphemes for each type of the site skeleton tag.
  • An information processing system is the information processing system according to the fourth aspect, wherein for each search hit page of the target query, the counting means counts a plurality of The number or ratio of query morphemes contained in a plurality of character strings associated with a site skeleton tag is counted for each type of site skeleton tag, and the output means counts the number or ratio of query morphemes in the site skeleton tag. Outputs information for comparative display for each type.
  • An information processing system is the information processing system according to the first aspect, wherein the counting means includes a plurality of The number or ratio of query morphemes is counted for each type of query morpheme, and the output means outputs information for displaying the counted number or ratio of query morphemes for each query morpheme.
  • An information processing system is the information processing system according to the sixth aspect, wherein the counting means includes, for each search hit page of the target query, a part or all of the source of the page counting the number or ratio of a plurality of query morphemes included in each type of query morpheme, and the output means counts the number or ratio of the counted query morphemes among a plurality of pages for each type of query morpheme Output information for comparative display.
  • An information processing system is the information processing system according to the sixth or seventh aspect, wherein each query morpheme is classified into one of a plurality of segments based on the query morpheme Classification means, acquisition means for acquiring segments specified by the user, and processing means for filtering or sorting the plurality of query morphemes by the segments specified by the user, wherein the output means is the filter or after sorting Output information to display the query morpheme.
  • An information processing system is the information processing system according to the sixth or seventh aspect, wherein the number of types of search queries including both morphemes and query morphemes of the target query is a type number counting means for counting each morpheme; and a processing means for filtering or sorting the plurality of query morphemes by the corresponding counted number of search query types, wherein the output means is configured to perform the filtering or sorting Outputs information to display later query morphemes.
  • An information processing system is the information processing system according to the sixth or seventh aspect, wherein the number of searches including both the morpheme of the target query and the query morpheme is calculated for each query morpheme a search number counting means for counting; and a processing means for filtering or sorting a plurality of said query morphemes by the corresponding said counted search numbers, said output means displaying said query morphemes after said filtering or sorting.
  • An information processing system is the information processing system according to the sixth or seventh aspect, wherein both a core morpheme and a query morpheme that constitute the target query are included.
  • Economic scale determination means for determining the economic scale for the search query for each query morpheme using each of the search numbers of the search query and the corresponding click cost and / or competitiveness, and a plurality of the query morphemes.
  • processing means for filtering or sorting by the counted economic scale, and the output means outputs information for displaying the query morpheme after filtering or sorting.
  • An information processing system is the information processing system according to the sixth or seventh aspect, wherein an acquisition means for acquiring a query morpheme specified by the user or a search query including the query morpheme; For each of the plurality of pages included in the search results of the target query, a result of ranking the plurality of pages by the number of the obtained query morphemes included in the source of the page, and the obtained query morpheme among the plurality of query morphemes.
  • the output means outputs information for displaying the query morphemes after the filtering or sorting.
  • An information processing system is the information processing system according to the sixth or seventh aspect, wherein the user selects from a plurality of pages (for example, top pages) included in the search results by the target query an acquisition means for acquiring a selection page; filtering the plurality of query morphemes by query morphemes included in the acquired selection page; or sorting by the number of query morphemes included in the acquired selection page; Alternatively, processing means for filtering or sorting the plurality of pages according to the number of query morphemes included in the acquired selection page in order of ranking, and the output means displaying the query morphemes after the filtering or sorting. output information for a plurality of pages (for example, top pages) included in the search results by the target query an acquisition means for acquiring a selection page; filtering the plurality of query morphemes by query morphemes included in the acquired selection page; or sorting by the number of query morphemes included in the acquired selection page; Alternatively, processing means for filtering or sorting the plurality of pages according to
  • An information processing system is the information processing system according to the sixth or seventh aspect, in which a selected page selected by a user is acquired from a plurality of pages included in search results based on a target query.
  • acquisition means for acquiring an analysis result of the nature of search needs regarding to what extent different search needs are mixed for each of the plurality of pages;
  • extraction means for extracting similar pages having a similar mixture of search needs from the selected page, and a statistic based on the number of query morphemes included in each of the similar pages for each query morpheme and a processing means for filtering or sorting a plurality of the query morphemes with the corresponding determined statistics, wherein the output means outputs the filtered or sorted query morphemes Output information for display.
  • An information processing system is the information processing system according to the fourteenth aspect, wherein the acquiring means acquires the ranking specified by the user as the user-specified ranking, and determines the statistics. The means determines the statistic based on the number of query morphemes included in each of the similar pages selected up to the user-specified order from the plurality of pages in descending order of the query morpheme for each query morpheme.
  • An information processing system is the information processing system according to the 6th or 7th aspect, comprising: acquiring means for acquiring the top page selected by the user; and processing means for filtering or sorting by statistics for each query morpheme in the upper page, and the output means outputs information for displaying the query morpheme after filtering or sorting.
  • An information processing system is the information processing system according to the 6th or 7th aspect, comprising an acquisition means for acquiring the upper page and the lower page selected by the user, and a plurality of the queries and processing means for filtering or sorting morphemes by values based on the statistics of query morphemes in upper pages and the statistics of query morphemes in lower pages determined for each query morpheme, wherein the output means comprises: Outputs information to display query morphemes after filtering or sorting.
  • An information processing system is the information processing system according to the sixth or seventh aspect, wherein an acquisition means for acquiring a request for filtering or sorting by economic scale, and a plurality of query morphemes , and a processing means for filtering or sorting on the economic scale, and the output means outputs information for displaying the query morphemes after the filtering or sorting.
  • An information processing system is the information processing system according to the sixth or seventh aspect, in which how characteristically on the top page of the search query containing both the core morpheme and the query morpheme Acquisition means for acquiring a request for filtering or sorting by industry specificity, which is an index indicating whether the target morpheme is used, and processing means for filtering or sorting the plurality of query morphemes by the industry specificity.
  • the output means outputs information for displaying the filtered or sorted query morphemes.
  • the information processing system provides the number of first-type site skeleton tags and the number of second-type site skeleton tags included in the source of pages included in search results from a target query. and an output means for outputting information for displaying the determined category.
  • An information processing system is the information processing system according to the twentieth aspect, wherein the page category includes an explanation type explaining a core morpheme included in the target query, the target A list type is included that lists those that correspond to the core morphemes contained in the query.
  • the information processing method includes a counting procedure for counting the number or ratio of query morphemes included in part or all of the source of the search hit page of the target query, and the counted query morpheme and an output procedure for outputting information for displaying a number or percentage, wherein the query morpheme is the target query used when requesting a search to a search engine, and the compound query used in a search in the past. , excluding the morpheme of the target query.
  • the number of first type site skeleton tags and the number of second type site skeleton tags included in the source of pages included in search results by the target query are and an outputting step for outputting information for displaying the determined category.
  • a program according to the twenty-fourth aspect of the present invention comprises, in a computer, a counting procedure for counting the number or ratio of query morphemes included in part or all of a source of a search hit page of a target query, the number of counted query morphemes An output procedure for outputting information for displaying a number or percentage, wherein the query morpheme has been used in a search in the past together with the target query used when requesting a search to a search engine It is a program that excludes the morpheme of the target query from the compound query.
  • a program provides a computer with the number of first-type site skeleton tags and the number of second-type site skeleton tags included in the source of pages included in search results from a target query.
  • a program for executing a determination procedure for determining a category of a page evaluated by the target query based on a comparison with a number, and an output procedure for outputting information for displaying the determined category.
  • the user can grasp the number or ratio of query morphemes included in part or all of the source of the page, thereby facilitating the grasp of missing query morphemes on the page. can improve the efficiency of the selection work of query morphemes in the page.
  • FIG. 1 is a schematic configuration diagram of an information processing system according to an embodiment
  • FIG. 1 is a schematic configuration diagram of a terminal according to this embodiment
  • FIG. 1 is a schematic configuration diagram of a computer system according to this embodiment
  • FIG. It is an example of a query morpheme tabulation screen. It is an example of screen G2 for demonstrating the filter sort example of a query morpheme.
  • FIG. 10 is a sequence diagram showing an example of common processing before filtering or sorting
  • 10 is a flow chart showing an example of processing for displaying query morphemes of a group of queries whose search results are similar to the selected search query.
  • FIG. 11 is a flow chart showing a first example of processing for displaying query morphemes of a group of queries reached by a selected site;
  • FIG. 11 is a flow chart showing a second example of processing for displaying query morphemes of queries reached by a selected site;
  • FIG. 10 is a flow chart showing an example of processing for displaying statistics of pages with similar search needs to the selected page.
  • FIG. 11 is an example of a query morpheme tabulation screen when the page evaluated by the target query is of description type;
  • FIG. It is an example of a query morpheme tabulation screen when the page evaluated by the target query is a list type.
  • a web page is sometimes simply called a page.
  • a top page is a page that is displayed at the top of search results in a search engine.
  • the higher order can be set arbitrarily, and is, for example, 1st to Nth (N is a natural number).
  • the query morpheme is the core morpheme included in any search query (hereinafter referred to as the target query) used when the target user of the page to be produced makes a search request to the search engine. Except for Here, one or more core morphemes may be included in the target query, and the target query itself may be included. The user can arbitrarily decide which morphemes are considered core morphemes in the target query. In this embodiment, for the sake of simplification of explanation, it is assumed that there is one core morpheme.
  • a page morpheme is a morpheme described on a page, and the page creator may consciously or unconsciously include the same morpheme as the query morpheme.
  • a site skeleton tag is a general term for tags or attributes that use words that form the skeleton of the site content (suitable for, for example, the introduction of morphemes that are components of the skeleton of a page). They are characterized by the fact that they are easy to announce or suggest the theme of other linked pages. It is extremely important in considering Tags included in the site skeleton tag include, for example, heading tags (e.g. h1 to h6), list tags (e.g. ul, ol, li, dt), table tags (e.g. th, td), input tags within the form (e.g.
  • Attributes included in the site skeleton tag include, for example, information attached to the a tag such as the href attribute, the type attribute of the input tag, the alt attribute of the img tag, the title attribute, and the like. Examples of attributes will now be described in detail.
  • checkbox, radio, etc. use the same input tag as text input, and switching is done with the type attribute.
  • query morphemes are used for such attributes rather than content, for example the alt attribute of img tags.
  • FIG. 1 is a schematic configuration diagram of an information processing system according to this embodiment.
  • an information processing system S includes terminals 1-1 to 1-K (K is a natural number) and a computer system 2 connected to the terminals 1-1 to 1-K via a communication network CN.
  • a search engine server 3 which is an example of a search engine, is communicably connected to the computer system 2 via a communication network CN.
  • Terminals 1-1 to 1-K are used by different users, and are, for example, mobile phones such as multifunctional mobile phones (so-called smart phones), tablets, laptop computers, or desktop computers. In the present embodiment, as an example, it is assumed that information transmitted from the computer system 2 is displayed on the terminals 1-1 to 1-K via, for example, a web browser. Terminals 1-1 to 1-K are also collectively referred to as terminal 1 hereinafter.
  • the computer system 2 is used by a management organization that manages the information processing system S according to this embodiment.
  • Computer system 2 provides information to terminals 1-1 to 1-K.
  • the computer system 2 may be composed of one computer or may be composed of a plurality of computers. In this embodiment, as an example, the computer system 2 is described as one computer.
  • FIG. 2 is a schematic configuration diagram of a terminal according to this embodiment.
  • the terminal 1 includes an input interface 11, a communication module 12, a storage 13, a memory 14, an output interface 15, and a processor 16, for example.
  • the input interface 11 receives an input from a user and outputs an input signal to the processor 16 according to the received input.
  • the communication module 12 is connected to the communication network CN and communicates with the computer system 2 . This communication may be wired or wireless, but will be described as wireless.
  • the storage 13 stores programs and various data for the processor 16 to read and execute.
  • the memory 14 temporarily holds data and programs.
  • the memory 14 is a volatile memory, such as a RAM (Random Access Memory).
  • the output interface 15 is connected to the display 17 and outputs video signals to the display 17 according to instructions from the processor 16 .
  • Processor 16 performs processing by loading a program from storage 13 into memory 14 and executing a series of instructions contained in the program.
  • the display 17 displays information according to instructions from the processor 16 . Note that the display 17 may not only be externally connected to the terminal 1 but may also be built in the terminal 1 .
  • FIG. 3 is a schematic configuration diagram of a computer system according to this embodiment.
  • the computer system 2 includes an input interface 21, a communication module 22, a storage 23, a memory 24, an output interface 25, and a processor 26.
  • the input interface 21 receives input from an administrator of the computer system 2 (e.g., an employee of a management organization) and outputs an input signal to the processor 26 according to the received input.
  • the communication module 22 is connected to the communication network CN and communicates with the terminals 1-1 to 1-K. Although this communication may be wired or wireless, it will be explained assuming that it is wired.
  • the storage 23 stores programs and various data for the processor 26 to read and execute.
  • the memory 24 temporarily holds data and programs.
  • the memory 24 is a volatile memory, such as a RAM (Random Access Memory).
  • the output interface 25 can be connected to an external device and can output a signal to the external device.
  • the processor 26 loads a program from the storage 23 to the memory 24 and executes a series of instructions included in the program to perform counting means 261, output means 262, classification means 263, processing means 264, and type number counting means 265. , search number counting means 266, economic scale determination means 267, acquisition means 268, similarity determination means 269, analysis result acquisition means 270, extraction means 271, statistics determination means 272, determination means 273, and uniqueness determination means 274 do. Each process will be described later.
  • the counting means 261 counts the number or ratio of query morphemes included in part or all of the sources of the search hit pages of the target query.
  • the output means 262 outputs information for displaying the number or ratio of the counted query morphemes. This processing will be described using the number of query morphemes displayed on the query morpheme counting screen in FIG.
  • FIG. 4 is an example of a query morpheme tabulation screen.
  • the pages ranked 1st to 10th included in the search results of the search engine using the target query "cad" are displayed with the title of the page, It is shown together with the URL and the analysis result.
  • the analysis result is the result of analyzing the difference in the distribution of morphemes contained in each page.
  • the morphemes contained in each page are converted into multidimensional feature vector data and the results of clustering are displayed with different colors and patterns on the color bars of each page.
  • the analysis result obtaining means 270 obtains an analysis result of the nature of the search needs regarding the degree to which different search needs are mixed for each of the plurality of pages.
  • the analysis result acquisition means 270 uses the method described in claim 12 of Patent Document 3 (Japanese Patent No. 6680956) and the corresponding part of the specification thereof, or claim 17 and the corresponding part of the specification thereof. Acquire the analysis results according to the method described in .
  • the analysis result screen G1 displays the total number of query morphemes (the number corresponding to TOTAL in FIG. 4) included in each of the pages ranked 1st to 6th. Also, on the analysis result screen G1, the query morpheme described in association with the site skeleton tag included in each of the pages ranked 1st to 6th (for example, sandwiched between tags or described as an attribute). The total number (number corresponding to the site skeleton tag TOTAL in FIG. 4) is displayed.
  • each of the header tags, list tags, table tags, in-form tags, anchor tags, and image tags included in each of the pages ranked 1st to 6th in the search ranking for example, The number of query morphemes (written or listed as attributes) is indicated. Furthermore, the total number of query morphemes (for example, sandwiched between tags or described as attributes) described in association with other tags included in each of the pages ranked 1 to 6 (other A number corresponding to the tag TOTAL) is displayed.
  • the query morphemes included in part of the source of the page to be counted by the counting means 261 are multiple character strings described in association with multiple site skeleton tags in the source. .
  • the counting means 261 counts the number or proportion of query morphemes in strings associated with site skeleton tags in the source.
  • the output means 262 then outputs information for displaying the number or ratio of the counted query morphemes.
  • the counting means 261 counts, for each of the search hit pages, the number or ratio of query morphemes in multiple character strings associated with multiple site skeleton tags in the source of the page.
  • the output means 262 then outputs information for comparably displaying the number or ratio of the counted query morphemes. This allows the number of query morphemes associated with one site skeleton tag to be compared between search hit pages.
  • Countering viewpoint 2 Counting for each type of site skeleton tag> Further, the counting means 261 counts the number or ratio of the query morphemes for each type of site skeleton tag. Then, the output means 262 outputs information for displaying the number or ratio of the query morphemes for each type of the site skeleton tag. This makes it possible to compare the number of query morphemes associated with site skeleton tags among multiple types of site skeleton tags.
  • the counting means 261 calculates, for each search hit page of the target query, a plurality of character strings associated with a plurality of site skeleton tags in the source of the page. The number or ratio of query morphemes contained therein is counted for each type of site skeleton tag. Then, the output means 262 outputs information for displaying the number or ratio of the query morphemes for each type of the site skeleton tag in a comparable manner. This allows the number of query morphemes associated with each site skeleton tag to be compared between search hit pages.
  • the name, number of query types, and economic scale are displayed for each query morpheme.
  • the number of query types is the number of search queries including the target query (“cad” in the example of FIG. 4) and the corresponding query morpheme (for example, the query morpheme “auto” extracted from the search query ⁇ autocad>).
  • the economic scale indicates the economic scale of one or more search queries from which query morphemes are extracted.
  • the economic scale of a query morpheme is, for example, the number of searches (also referred to as search volume) per unit period (for example, month), the cost per click of PPC advertising, and the PPC It is a value obtained by multiplying any two or three of the ad competitiveness and the sum of the values.
  • the counting means 261 counts the number or ratio of multiple query morphemes included in part or all of the sources of the search hit pages of the target query for each type of query morpheme. Then, the output means 262 outputs information for displaying the number or ratio of the counted query morphemes for each query morpheme.
  • the ratio is, for example, the ratio of the target query morpheme to the total number of query morphemes included in the page. This makes it possible to compare the number or percentage contained in the page across multiple query morphemes.
  • the counting means 261 counts the number or ratio of multiple query morphemes included in part or all of the source of the page for each type of query morpheme.
  • the output unit 262 outputs information for displaying the counted number or ratio of query morphemes among a plurality of pages for each type of query morpheme in a comparable manner.
  • the ratio is, for example, the ratio of the target query morpheme to the total number of query morphemes included in the page. This allows comparison of the number or percentage of query morphemes for each type of query morpheme across search hit pages for the target query.
  • FIG. 6 is a sequence diagram showing an example of common processing before filtering or sorting.
  • the computer system 2 transmits search query input screen data to the terminal 1 in response to the request from the terminal 1 . Thereby, a search query input screen is displayed on the terminal 1 .
  • Step S120 Next, the terminal 1 transmits to the computer system 2 the search query input by the user on the search query input screen.
  • Step S130 Next, the computer system 2 transmits a search request to the search engine server 3 together with the search query.
  • Step S140 The search engine server 3 receives the search request together with the search query, and executes a search using the search query in response to the search request.
  • Step S150 The search engine server 3 transmits the search result to the computer system 2.
  • Step S160 The computer system 2 receives the search results and sequentially transmits HTTP requests addressed to, for example, the first to tenth URLs (Uniform Resource Locators) of the search results to the communication network CN.
  • HTTP requests addressed to, for example, the first to tenth URLs (Uniform Resource Locators) of the search results to the communication network CN.
  • Step S170 The web server that has received each HTTP request returns the corresponding page data to the computer system 2.
  • Step S180 When receiving these page data, the computer system 2 counts each morpheme included in each page, generates analysis result screen data, and transmits the analysis result screen data to the terminal 1. As a result, a query morpheme tabulation screen (for example, screen G1 in FIG. 4) is displayed on the terminal 1.
  • FIG. 1 For example, screen G1 in FIG. 4, is displayed on the terminal 1.
  • multiple morphemes may be grouped into one group, and the sum of the counting results of the morphemes in the group may be used. For example, instead of counting morphemes that have the same content read by target users, such as synonyms related to “learning” and “studying,” they are counted as a group, so that paraphrases with the same morpheme are counted together. It becomes possible to count as , and it becomes possible to count in a form close to the reader's sense.
  • automatic processing based on a predefined synonym/similar word database may be used.
  • the user may make adjustments by adding groups or adding/deleting morphemes in groups. This allows the user to adjust, for example, whether "learning” and “studying” should be treated as the same thing or whether they should be strictly separated.
  • a mechanism may be added to update the definition and classification of synonyms/synonyms using a machine learning algorithm or the like by using the result of the user's adjustment.
  • FIG. 5 is an example of a screen G2 for explaining an example of filtering and sorting query morphemes.
  • the query morpheme tabulation screen for example, screen G1 in FIG. 4
  • a pop-up screen for setting the query morpheme filter/sort is displayed, as in screen G2 in FIG.
  • a setting area R2 is displayed.
  • a select box R21 for selecting a search query is displayed. can be displayed.
  • FIG. 7 is a flowchart showing an example of processing for displaying query morphemes of a group of queries whose search results are similar to the selected search query.
  • Step S210 The processor 16 of the terminal 1 receives, for example, a search query including query morphemes selected in the select box R21 in the setting area R2 of the screen G2 of FIG.
  • Step S220 The processor 16 of the terminal 1 transmits the received search query to the computer system 2.
  • Step S230 The acquisition unit 268 acquires a query morpheme (eg, "3d") specified by the user or a search query (eg, "3d cad” in the example of FIG. 5) containing the query morpheme (eg, "3d”). . Then, the similarity determining means 269 determines the number of the acquired query morphemes ("3d” in the example of FIG. 5) included in the source of each of the plurality of pages included in the search results by the target query.
  • a query morpheme eg, "3d”
  • search query eg, "3d cad cad” in the example of FIG. 5
  • Step S240 The processing means 264 filters or sorts the plurality of query morphemes by the corresponding determined similarities.
  • Step S250 The output means 262 outputs the information for displaying the filtered or sorted query morphemes as screen data after processing, and transmits it to the terminal 1.
  • Step S260 The terminal 1 receives the post-processing screen data, and uses the post-processing screen data to display the post-processing screen.
  • a select box R22 that allows site selection is displayed, and when a site is selected, the query morphemes of the query group reached by the selected site are displayed.
  • FIG. 8 is a flow chart showing a first example of processing for displaying query morphemes of a group of queries reached by a selected site.
  • Step S310 The processor 16 of the terminal 1 receives, for example, the selected page selected in the select box R22 in the setting area R2 of the screen G2 of FIG.
  • Step S320 The processor 16 of the terminal 1 transmits to the computer system 2 selected page identification information for identifying the accepted selected page.
  • Step S330 Acquisition unit 268 acquires the selected site selected by the user from a plurality of sites (or pages) included in the search results of the target query.
  • the plurality of sites are, for example, upper sites.
  • the top sites may be sites within a predetermined ranking range (for example, sites ranked 1st to 3rd), or may be sites within a range specified by the user.
  • the processing means 264 filters the plurality of query morphemes by query morphemes contained in the obtained selected sites or sorts by the number of query morphemes contained in the obtained selected sites.
  • Step S340 The output means 262 outputs the information for displaying the filtered or sorted query morphemes as screen data after processing, and transmits it to the terminal 1.
  • Step S350 The terminal 1 receives the post-processing screen data, and uses the post-processing screen data to display the post-processing screen.
  • FIG. 9 is a flow chart showing a second example of processing for displaying query morphemes of a group of queries reached by the selected site.
  • Steps S410, S420, S440, and S450 are the same as corresponding steps S310, S320, S340, and S350 in FIG. 8, so description thereof will be omitted.
  • Acquisition unit 268 acquires a selected site selected by the user from a plurality of sites (or pages) included in the search results of the target query.
  • the processing means 264 filters or sorts the plurality of pages according to the number of query morphemes included in the acquired selected site when ranked.
  • a select box R23 for selecting pages is displayed, and a selectable select box R230 for selecting up to how many upper pages as upper pages is displayed.
  • an ascending order button R231 and a descending order button R232 are displayed.
  • the ascending order button R231 is pressed with a page selected in the select box R23 and the number of top pages selected in the select box R24, for example, the top M pages of characters similar to the selected page (example in FIG. 5) are displayed.
  • M multiple query morphemes are sorted and displayed in ascending order of the total content of 3).
  • FIG. 10 is a flow chart showing an example of processing for displaying statistics of pages with similar search needs to the selected page.
  • Step S510 The processor 16 of the terminal 1 receives, for example, the selected page selected in the select box R23 in the setting area R2 of the screen G2 of FIG. It also accepts the number of pages corresponding to upper pages selected in the select box R230.
  • Step S520 The processor 16 of the terminal 1 transmits to the computer system 2 selected page identification information for identifying the accepted selected page and the number of pages corresponding to the upper page.
  • Step S530 The acquisition unit 268 acquires a selection page selected by the user from a plurality of pages included in the search results of the target query.
  • the analysis result acquisition unit 270 acquires an analysis result of the nature of search needs regarding to what extent different search needs are mixed for each of the plurality of pages.
  • Step S540 The extraction means 271 extracts, from the plurality of pages, similar pages in which the degree of mixture of search needs is similar to that of the selected page, based on the analysis results.
  • the extracting unit 271 extracts, for example, the top M pages (M is the number of pages corresponding to the top pages selected by the user) having similar mixed conditions of search needs as similar pages.
  • the statistic determination means 272 determines a statistic (here, as an example, total content) based on the number of query morphemes included in each of the similar pages for each query morpheme.
  • Step S560 The processing means 264 filters or sorts the plurality of query morphemes with the corresponding determined statistics.
  • Step S570 The output means 262 outputs the information for displaying the filtered or sorted query morphemes as screen data after processing, and transmits it to the terminal 1.
  • Step S580 The terminal 1 receives the post-processing screen data, and uses the post-processing screen data to display the post-processing screen.
  • the acquisition means 268 acquires the order specified by the user as the user-specified order.
  • the statistic determining means 272 determines the number of query morphemes included in each of the similar pages selected from the plurality of pages in descending order of the number of query morphemes up to the user-specified order. to decide.
  • a selectable select box R24 for selecting the top page as the top page is displayed, and here, the top "3 pages" is selected in the select box R24.
  • a select box R241, a select box R242, and a select box R243 are displayed that allow the user to specifically select which page the upper "three pages" are.
  • "1st place”, “2nd place”, and “3rd place” are selected as the top "3 pages”.
  • an ascending order button R244 and a descending order button R245 are displayed.
  • the plurality of query morphemes are sorted in ascending order of the total content of each query morpheme in the selected "1st", “2nd”, and "3rd” pages, for example. displayed.
  • the descending order button R245 is pressed in this state, a plurality of query morphemes will be displayed in descending order of the total content of each query morpheme in the selected "1st", “2nd”, and "3rd” pages. sorted and displayed.
  • the computer system 2 executes, for example, the following processes.
  • Acquisition means 268 acquires the upper page selected by the user.
  • the processing means 264 filters or sorts the plurality of query morphemes by statistics (here, total content as an example) for each query morpheme in the upper page. For example, when the ascending order button R244 is pressed, the processing means 264 sorts in ascending order, and when the descending order button R245 is pressed, the processing means 264 sorts in descending order.
  • the output unit 262 outputs information for displaying the filtered or sorted query morphemes as screen data after processing, and transmits the processed screen data to the terminal 1 . As a result, the screen after processing is displayed on the terminal 1 .
  • a selectable select box R25 for selecting the top page as the top page is displayed.
  • the top "3 pages” is selected in the select box R25.
  • a select box R251, a select box R252, and a select box R253 are displayed that allow the user to specifically select which page the upper "three pages" are.
  • “1st place”, “2nd place”, and “3rd place” are selected as the top "3 pages”.
  • a selectable select box R26 for selecting the lower page as the upper page is displayed.
  • the lower "3 pages” is selected in the select box R26.
  • a select box R261, a select box R262, and a select box R263 are displayed that allow the user to specifically select which page the lower "three pages" are.
  • "8th place”, “9th place”, and “10th place” are selected as the lower "3 pages”.
  • an ascending order button R254 and a descending order button R255 are displayed.
  • the computer system 2 executes, for example, the following processes.
  • Acquisition means 268 acquires the upper page and lower page selected by the user.
  • the processing means 264 converts the plurality of query morphemes into a value (here, as an example, a difference value) based on the statistic of the query morpheme in the upper page and the statistic of the query morpheme in the lower page determined for each query morpheme. Filter or sort. For example, when the ascending order button R254 is pressed, the processing means 264 sorts in ascending order, and when the descending order button R255 is pressed, the processing means 264 sorts in descending order.
  • the output unit 262 outputs information for displaying the filtered or sorted query morphemes as screen data after processing, and transmits the processed screen data to the terminal 1 . As a result, the screen after processing is displayed on the terminal 1 .
  • An ascending order button R271 and a descending order button R272 corresponding to the economic scale are displayed in the setting area R2 in the screen G2 of FIG.
  • the target query here, “cad” as an example
  • the economic scale is the economic scale described in Patent Document 2, for example.
  • the ascending order button R271 When the ascending order button R271 is pressed, a plurality of query morphemes are sorted and displayed in ascending order of economic scale of the search query including the target query and the query morpheme.
  • the descending order button R272 is pressed, a plurality of query morphemes are sorted and displayed in descending order of economic scale of the search query including the target query and the query morpheme.
  • the computer system 2 executes, for example, the following processes.
  • Acquisition means 268 acquires requests for filtering or sorting by economic scale.
  • the economic scale determination means 267 uses each of the search numbers of a plurality of search queries that include both the core morpheme and the query morpheme, which are morphemes that make up the target query, and the corresponding cost per click and / or competitiveness, An economic scale for a search query is determined for each query morpheme.
  • Processing means 264 economically filters or sorts the plurality of query morphemes.
  • the processing means 264 sorts in ascending order
  • the processing means 264 sorts in descending order.
  • the output unit 262 outputs information for displaying the filtered or sorted query morphemes as screen data after processing, and transmits the processed screen data to the terminal 1 .
  • the screen after processing is displayed on the terminal 1 .
  • an ascending order button R281 and a descending order button R282 corresponding to the number of searches are displayed in the setting area R2 in the screen G2 of FIG.
  • the ascending order button R281 is pressed, a plurality of query morphemes are sorted and displayed in ascending order of the number of searches in the past predetermined period of the search query including the target query and the query morpheme.
  • the descending order button R282 is pressed, a plurality of query morphemes are sorted and displayed in descending order of the number of searches in the past predetermined period of the search query including the target query and the query morpheme.
  • the computer system 2 executes, for example, the following processes.
  • Acquisition means 268 acquires requests for filtering or sorting by the number of searches.
  • the search number counting means 266 counts the number of searches that include both the core morpheme and the query morpheme, which are morphemes forming the target query, for each query morpheme.
  • Processing means 264 filters or sorts a plurality of said query morphemes by corresponding said counted search numbers. At this time, for example, when the ascending order button R281 is pressed, the processing means 264 sorts in ascending order, and when the descending order button R282 is pressed, the processing means 264 sorts in descending order.
  • the output unit 262 outputs information for displaying the filtered or sorted query morphemes as screen data after processing, and transmits the processed screen data to the terminal 1 . As a result, the screen after processing is displayed on the terminal 1 .
  • an ascending order button R291 and a descending order button R292 corresponding to the number of query types are displayed in the setting area R2 in the screen G2 of FIG.
  • the ascending order button R291 is pressed, a plurality of query morphemes are sorted and displayed in ascending order of the number of types of search queries including the target query and the query morpheme.
  • the number of types of search queries is, for example, the number of types of search queries executed in a predetermined period of time in the past.
  • the descending order button R292 is pressed, a plurality of query morphemes are sorted and displayed in descending order of the number of types of search queries including the target query and the query morpheme.
  • the computer system 2 executes, for example, the following processes.
  • Acquisition means 268 acquires requests for filtering or sorting by the number of types of search queries.
  • the number-of-types counting means 265 counts the number of types of search queries that include both core morphemes and query morphemes, which are morphemes constituting the target query, for each query morpheme.
  • the processing means 264 filters or sorts the plurality of query morphemes by the corresponding counted number of search query types. At this time, for example, when the ascending order button R291 is pressed, the processing means 264 sorts in ascending order, and when the descending order button R292 is pressed, the processing means 264 sorts in descending order.
  • the output unit 262 outputs information for displaying the filtered or sorted query morphemes as screen data after processing, and transmits the processed screen data to the terminal 1 . As a result, the screen after processing is displayed on the terminal 1 .
  • an ascending order button R301 and a descending order button R302 corresponding to industry uniqueness are displayed.
  • the ascending order button R301 is pressed, a plurality of query morphemes are sorted and displayed in ascending order of industry specificity.
  • the descending order button R302 is pressed, a plurality of query morphemes are sorted and displayed in descending order of industry specificity.
  • industry-specificity refers to how characteristically the target morpheme is used on the top pages of search queries that include both the core morpheme (e.g. "cad"), which is a morpheme that makes up the target query, and the query morpheme.
  • This industry uniqueness may be, for example, the uniqueness of Patent Document 4 (Japanese Patent No. 6253041). Specifically, for example, the uniqueness of the morpheme as an industry term is calculated based on a predetermined evaluation function. However, it is not limited to this.
  • the computer system 2 executes, for example, the following processes.
  • Acquisition means 268 acquires requests for filtering or sorting by the number of types of search queries.
  • the uniqueness determining means 274 determines industry uniqueness for each query morpheme based on a predetermined evaluation function.
  • a processing means 264 filters or sorts a plurality of said query morphemes by corresponding said determined industry-specificity.
  • the output unit 262 outputs information for displaying the filtered or sorted query morphemes as screen data after processing, and transmits the processed screen data to the terminal 1 . As a result, the screen after processing is displayed on the terminal 1 .
  • the classification means 263 classifies each query morpheme into one of a plurality of segments based on the query morpheme.
  • Acquisition means 268 acquires a segment specified by the user.
  • Processing means 264 filters or sorts the plurality of query morphemes by user-specified segments.
  • the output unit 262 outputs information for displaying the filtered or sorted query morphemes as screen data after processing, and transmits the processed screen data to the terminal 1 . As a result, the screen after processing is displayed on the terminal 1 .
  • the information processing system S includes the counting means 261 for counting the number or ratio of query morphemes included in part or all of the source of the search hit page of the target query, and the number of the counted query morphemes and an output means 262 for outputting information for displaying the number or percentage.
  • the user can grasp the number or ratio of query morphemes included in part or all of the source of the page, thereby facilitating the grasp of missing query morphemes on the page, and the query on the page
  • the efficiency of morpheme selection work can be improved.
  • Example 2 a query morpheme counting screen displayed on the terminal 1 will be described with reference to FIGS. 11 and 12.
  • FIG. FIG. 11 is an example of the query morpheme tabulation screen when the page evaluated by the target query is of description type.
  • FIG. 12 is an example of the query morpheme tabulation screen when the page evaluated by the target query is of list type.
  • the explanation type is a category for explaining the core morphemes that constitute the target query
  • the list type is a category for listing those corresponding to the core morphemes that constitute the target query.
  • Page categories include description type and list type.
  • the text box R41 shows "vacuum cleaner function” input by the user as an example of the target query.
  • a search query that includes the query morpheme "function”
  • the page explaining the "function" of the morpheme included in the search query here, "vacuum cleaner”
  • a search query containing a query morpheme is of "description type.” Therefore, when "vacuum cleaner function" is entered in the text box R41, the category "description type" is displayed as the label R42.
  • the text box R43 shows "vacuum cleaner comparison” input by the user as an example of the target query.
  • a search query that includes the query morpheme "comparison”
  • the pages that "compare” the morpheme (here, "vacuum cleaner”) included in the search query and display a list are extracted as search results, so this "comparison is of "list type”.
  • the category "list type” is displayed as the label R44.
  • the determining means 273 determines the number of first-type site skeleton tags and the number of second-type site skeleton tags included in the source of pages included in search results by a target query (for example, "vacuum cleaner comparison"). may determine the category of pages rated by the target query.
  • a target query for example, "vacuum cleaner comparison"
  • the computer system 2 executes, for example, the following processes.
  • the determining means 273 determines the number of first-type site skeleton tags and the number of second-type site skeleton tags included in the source of pages included in search results by a target query (for example, "vacuum cleaner comparison"). may determine the category of pages rated by the target query.
  • a target query for example, "vacuum cleaner comparison"
  • the determination means 273 compares the number of first type tags (eg, a tags) and the number of second type tags (eg, h tags) included in the source of pages included in the search results of the target query. Based on this, the category of pages evaluated by the target query may be determined. At this time, for example, the judging means 273 judges the category to be a list type if the ratio of the number of a tags to the number of h tags is larger than the ratio of the number of a tags, and if the ratio of h tags is larger A category may be determined to be a description type.
  • the output means 262 outputs information for displaying the determined category and transmits this information to the terminal 1 . By displaying this information, the terminal 1 displays a category (for example, “description type” or “list type”) as shown in FIG. 11 or 12 .
  • the information processing system S has the number of query morphemes included in the source of the page included in the search result by the target query, and the plurality of characters sandwiched between the plurality of site skeleton tags in the source.
  • Determination means 273 for determining the category of the page evaluated by the search query based on comparison with the number of query morphemes contained in the column, and output means for outputting information for displaying the determined category. 262;
  • a part or all of the means executed by the processor 26 of the computer system 2 described in the above embodiment may be executed by the processor 16 of the terminal 1.
  • At least part of the computer system 2 described in the above embodiments may be configured with hardware or software.
  • a program that implements at least part of the functions of the computer system 2 may be stored in a computer-readable recording medium and read and executed by a computer.
  • the recording medium is not limited to a detachable one such as a magnetic disk or an optical disk, and may be a fixed recording medium such as a hard disk device or memory.
  • a program that implements at least part of the functions of the computer system 2 may be distributed via a communication line (including wireless communication) such as the Internet.
  • the program may be encrypted, modulated, or compressed and distributed via a wired line or wireless line such as the Internet, or stored in a recording medium and distributed.
  • the computer system 2 may be operated by one or more information devices.
  • one of them may be a computer, and the computer may implement a function as at least one means of the computer system 2 by executing a predetermined program.
  • all processes may be automatically controlled by a computer.
  • progress control between steps may be manually performed.
  • at least a part of all steps may be performed manually.
  • the present invention is not limited to the above-described embodiments as they are, and can be embodied by modifying the constituent elements without departing from the gist of the present invention at the implementation stage. Further, various inventions can be formed by appropriate combinations of the plurality of constituent elements disclosed in the above embodiments. For example, some components may be omitted from all components shown in the embodiments. Furthermore, components across different embodiments may be combined as appropriate.

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

検索エンジンにおいて、任意のウェブページの標的とする検索クエリによる検索結果として抽出されたウェブページのソースの一部または全部に含まれるクエリ形態素の数または割合を計数する計数手段と、前記計数されたクエリ形態素の数または割合を表示するための情報を出力する出力手段と、を備え、前記クエリ形態素は、検索エンジンに検索要求する際に用いられる前記標的クエリの形態素とともに過去に検索で用いられた複合クエリの形態素のうち、標的クエリの形態素を除いたものである。

Description

情報処理システム、情報処理方法及びプログラム
 本発明は、情報処理システム、情報処理方法及びプログラムに関する。
 ウェブページ(以下、ページという)の制作にあたっては、検索エンジン対策が重視されることが多い。その際、制作対象ページの標的ユーザが用いると予測される任意の検索クエリ(以下、標的クエリという)をそのページの主題とみたて、その主題を成立させるための目次やメニュー、表、解説文などを的確に選定し記述すべく、その標的クエリの検索結果に上位表示される複数のページ(以下、検索ヒットページという)に含まれる形態素(以下、ページ形態素という)(特許文献1参照)を参考にしたり用いたりする。さらには、標的クエリを構成する形態素(以下、コア形態素という)に別の形態素が追加されて検索される、より複合度の高い検索クエリ(以下、複合クエリ)にも着目し、それらに含まれるコア形態素以外の形態素(以下、クエリ形態素という)についても参考にしたり用いたりする(例えば、特許文献2参照)。
このときクエリ形態素は、意味を成す最小の単語としても良いし、意味を成す複数語のまとまりを形態素としても良い。
特許第6164436号公報 国際公開2021/040003号公報 特許第6680956号公報 特許第6253041号公報
 クエリ形態素は、標的ユーザのサブニーズを示す傾向があることが知られており、標的クエリを主題としたページへの記述、とりわけ目次やメニューなどを示すHTMLタグまたは属性への記述に適しているものが含まれる傾向にある。
 ページ制作者は例えば、数十~数千に及ぶ多数のクエリ形態素を手作業で調査し、ページごとに適切と思われるものを選定したうえで、各ページ内において適切と思われるHTMLタグで挟まれた文字列またはHTMLタグ内の属性等を記載する。その後、ページごとにクエリ形態素の抜け漏れの確認や過不足対応なども行う。また、制作対象ページのクエリ形態素の実装度合いと各上位ページのそれらとを比較することによって、制作対象ページの内容的な競争力をリリース前に把握しようとする。これら一連の業務は非常に煩雑で多くの工数を要するため、合理化するための補助ツールが求められている。
 本発明の一つの目的は、上記問題に鑑みてなされたものであり、制作対象ページにおけるクエリ形態素の選定作業または標的クエリで検索ヒットするページにおけるクエリ形態素の実装度分析の効率を向上させることを可能とする情報処理システム、情報処理方法及びプログラムを提供することである。
 本発明の第1の態様に係る情報処理システムは、標的クエリの検索ヒットページのソースの一部または全部に含まれるクエリ形態素の数または割合を計数する計数手段と、前記計数されたクエリ形態素の数または割合を表示するための情報を出力する出力手段と、を備え、前記クエリ形態素は、検索エンジンに検索要求する際に用いられる前記標的クエリとともに過去に検索で用いられた複合クエリのうち、標的クエリの形態素を除いたものである。
 本発明の第2の態様に係る情報処理システムは、第1の態様に係る情報処理システムであって、前記複数のページのソースの一部に含まれるクエリ形態素は、当該ソース中の複数のサイト骨格タグに関連付けられて記載された複数の文字列であり、前記計数手段は、前記ソース中の複数のサイト骨格タグに関連付けられた複数の文字列中のクエリ形態素の数または割合を計数し、前記出力手段は、前記計数されたクエリ形態素の数または割合を表示するための情報を出力し、前記サイト骨格タグは目次やリンク先のページ主題など、サイト内容の骨格となる言葉が使用されるタグまたは属性の総称である。
 本発明の第3の態様に係る情報処理システムは、第2の態様に係る情報処理システムであって、前記計数手段は、前記標的クエリの検索ヒットページそれぞれについて、当該ページのソース中の複数のサイト骨格タグに関連付けられた複数の文字列中のクエリ形態素の数または割合を計数し、前記出力手段は、前記計数されたクエリ形態素の数または割合を比較可能に表示するための情報を出力する。
 本発明の第4の態様に係る情報処理システムは、第2の態様に係る情報処理システムであって、前記計数手段は、前記クエリ形態素の数または割合を、サイト骨格タグの種類毎に計数し、前記出力手段は、前記サイト骨格タグの種類毎に前記クエリ形態素の数または割合を表示するための情報を出力する。
 本発明の第5の態様に係る情報処理システムは、第4の態様に係る情報処理システムであって、前記計数手段は、前記標的クエリの検索ヒットページそれぞれについて、当該ページのソース中の複数のサイト骨格タグに関連付けられた複数の文字列中に含まれるクエリ形態素の数または割合、サイト骨格タグの種類毎に計数し、前記出力手段は、前記クエリ形態素の数または割合を前記サイト骨格タグの種類毎に比較可能に表示するための情報を出力する。
 本発明の第6の態様に係る情報処理システムは、第1の態様に係る情報処理システムであって、前記計数手段は、標的クエリの検索ヒットページのソースの一部または全部に含まれる複数のクエリ形態素の数または割合を、クエリ形態素の種類毎に計数し、前記出力手段は、前記計数されたクエリ形態素の数または割合を、クエリ形態素毎に表示するための情報を出力する。
 本発明の第7の態様に係る情報処理システムは、第6の態様に係る情報処理システムであって、前記計数手段は、標的クエリの検索ヒットページそれぞれについて、当該ページのソースの一部または全部に含まれる複数のクエリ形態素の数または割合を、クエリ形態素の種類毎に計数し、前記出力手段は、前記計数されたクエリ形態素の数または割合を複数のページの間でクエリ形態素の種類毎に比較可能に表示するための情報を出力する。
 本発明の第8の態様に係る情報処理システムは、第6または7の態様に係る情報処理システムであって、クエリ形態素それぞれを、当該クエリ形態素に基づいて、複数のセグメントのいずれかに分類する分類手段と、ユーザが指定するセグメントを取得する取得手段と、複数の前記クエリ形態素をユーザが指定するセグメントでフィルタもしくはソートする処理手段と、を備え、前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する。
 本発明の第9の態様に係る情報処理システムは、第6または7の態様に係る情報処理システムであって、前記標的クエリの形態素とクエリ形態素の両方が含まれる検索クエリの種類数を、クエリ形態素毎に計数する種類数計数手段と、複数の前記クエリ形態素を、対応する前記計数された検索クエリの種類数でフィルタもしくはソートする処理手段と、を備え、前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する。
 本発明の第10の態様に係る情報処理システムは、第6または7の態様に係る情報処理システムであって、前記標的クエリの形態素とクエリ形態素の両方が含まれる検索数を、クエリ形態素毎に計数する検索数計数手段と、複数の前記クエリ形態素を、対応する前記計数された検索数でフィルタもしくはソートする処理手段と、を備え、前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する。
 本発明の第11の態様に係る情報処理システムは、第6または7の態様に係る情報処理システムであって、前記標的クエリを構成する形態素であるコア形態素とクエリ形態素の両方が含まれる複数の検索クエリの検索数それぞれと、対応するクリック単価及び/または競合性を用いて、当該検索クエリに対する経済規模を、クエリ形態素毎に決定する経済規模決定手段と、複数の前記クエリ形態素を、対応する前記計数された経済規模でフィルタもしくはソートする処理手段と、を備え、前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する。
 本発明の第12の態様に係る情報処理システムは、第6または7の態様に係る情報処理システムであって、ユーザが指定したクエリ形態素もしくは当該クエリ形態素を含む検索クエリを取得する取得手段と、標的クエリによる検索結果に含まれる複数のページそれぞれについて、当該ページのソースに含まれる前記取得されたクエリ形態素の数で前記複数のページをランキングした結果と、複数の前記クエリ形態素のうち当該取得されたクエリ形態素以外の別クエリ形態素の数で前記複数のページをランキングした結果との類似度を、当該別クエリ形態素毎に決定する類似度決定手段と、複数の前記クエリ形態素を、対応する前記決定された類似度でフィルタもしくはソートする処理手段を備え、前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する。
 本発明の第13の態様に係る情報処理システムは、第6または7の態様に係る情報処理システムであって、標的クエリによる検索結果に含まれる複数のページ(例えば上位ページト)からユーザが選択した選択ページを取得する取得手段と、複数の前記クエリ形態素を、前記取得された選択ページに含まれるクエリ形態素でフィルタするか、前記取得された選択ページに含まれるクエリ形態素の数でソートするか、または前記取得された選択ページに含まれるクエリ形態素の数で前記複数のページをランキングした場合の順位でフィルタまたはソートする処理手段と、前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する。
 本発明の第14の態様に係る情報処理システムは、第6または7の態様に係る情報処理システムであって、標的クエリによる検索結果に含まれる複数のページからユーザが選択した選択ページを取得する取得手段と、前記複数のページそれぞれについて、異なる検索ニーズがどの程度混在しているかに関する検索のニーズの性質の解析結果を取得する解析結果取得手段と、前記解析結果に基づいて、前記複数のページから、前記選択ページとの間で、検索ニーズの混在具合が類似している類似ページを抽出する抽出手段と、クエリ形態素毎に、前記類似ページそれぞれに含まれるクエリ形態素の数に基づいて統計量を決定する統計量決定手段と、複数の前記クエリ形態素を、対応する前記決定された統計量でフィルタもしくはソートする処理手段と、を備え、前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する。
 本発明の第15の態様に係る情報処理システムは、第14の態様に係る情報処理システムであって、前記取得手段は、ユーザによって指定された順位をユーザ指定順位として取得し、前記統計量決定手段は、クエリ形態素毎に、前記複数のページのうちから当該クエリ形態素が多い順に前記ユーザ指定順位まで選択された前記類似ページそれぞれに含まれるクエリ形態素の数に基づいて前記統計量を決定する。
 本発明の第16の態様に係る情報処理システムは、第6または7の態様に係る情報処理システムであって、ユーザによって選択された上位ページを取得する取得手段と、複数の前記クエリ形態素を、前記上位ページにおけるクエリ形態素毎の統計量でフィルタもしくはソートする処理手段と、を備え、前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する。
 本発明の第17の態様に係る情報処理システムは、第6または7の態様に係る情報処理システムであって、ユーザによって選択された上位ページ及び下位ページを取得する取得手段と、複数の前記クエリ形態素を、当該クエリ形態素それぞれ毎に決定される上位ページにおけるクエリ形態素の統計量と下位ページにおけるクエリ形態素の統計量に基づく値でフィルタもしくはソートする処理手段と、を備え、前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する。
 本発明の第18の態様に係る情報処理システムは、第6または7の態様に係る情報処理システムであって、経済規模によるフィルタもしくはソートの要求を取得する取得手段と、複数の前記クエリ形態素を、前記経済規模でフィルタもしくはソートする処理手段と、を備え、前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する。
 本発明の第19の態様に係る情報処理システムは、第6または7の態様に係る情報処理システムであって、コア形態素とクエリ形態素の両方が含まれる検索クエリの上位ページでどの程度特徴的に対象形態素が使用されているかを表す指標である業界特有度によるフィルタもしくはソートの要求を取得する取得手段と、複数の前記クエリ形態素を、前記業界特有度でフィルタもしくはソートする処理手段と、を備え、前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する。
 本発明の第20の態様に係る情報処理システムは、標的クエリによる検索結果に含まれるページのソース中に含まれる第1の種類のサイト骨格タグの数と第2の種類のサイト骨格タグの数との比較に基づいて、当該標的クエリによって評価されるページのカテゴリを判定する判定手段と、前記判定されたカテゴリを表示するための情報を出力する出力手段と、を備える。
 本発明の第21の態様に係る情報処理システムは、第20の態様に係る情報処理システムであって、前記ページのカテゴリには、当該標的クエリに含まれるコア形態素を説明する説明タイプ、当該標的クエリに含まれるコア形態素に該当するものを一覧表示する一覧タイプが含まれる。
 本発明の第22の態様に係る情報処理方法は、標的クエリの検索ヒットページのソースの一部または全部に含まれるクエリ形態素の数または割合を計数する計数手順と、前記計数されたクエリ形態素の数または割合を表示するための情報を出力する出力手順と、を有し、前記クエリ形態素は、検索エンジンに検索要求する際に用いられる前記標的クエリとともに過去に検索で用いられた複合クエリのうち、標的クエリの形態素を除いたものである。
 本発明の第23の態様に係る情報処理方法は、標的クエリによる検索結果に含まれるページのソース中に含まれる第1の種類のサイト骨格タグの数と第2の種類のサイト骨格タグの数との比較に基づいて、当該標的クエリによって評価されるページのカテゴリを判定する判定手順と、前記判定されたカテゴリを表示するための情報を出力する出力手順と、を有する。
 本発明の第24の態様に係るプログラムは、コンピュータに、標的クエリの検索ヒットページのソースの一部または全部に含まれるクエリ形態素の数または割合を計数する計数手順、前記計数されたクエリ形態素の数または割合を表示するための情報を出力する出力手順、を実行させるためのプログラムであって、前記クエリ形態素は、検索エンジンに検索要求する際に用いられる前記標的クエリとともに過去に検索で用いられた複合クエリのうち、標的クエリの形態素を除いたものであるプログラムである。
 本発明の第25の態様に係るプログラムは、コンピュータに、標的クエリによる検索結果に含まれるページのソース中に含まれる第1の種類のサイト骨格タグの数と第2の種類のサイト骨格タグの数との比較に基づいて、当該標的クエリによって評価されるページのカテゴリを判定する判定手順、前記判定されたカテゴリを表示するための情報を出力する出力手順、を実行させるためのプログラムである。
 本発明の一態様によれば、ページのソースの一部または全部に含まれるクエリ形態素の数または割合をユーザが把握することにより、当該ページにおいて、足りていないクエリ形態素の把握を容易化することができ、ページにおけるクエリ形態素の選定作業の効率を向上させることができる。
本実施形態に係る情報処理システムの概略構成図である。 本実施形態に係る端末の概略構成図である。 本実施形態に係るコンピュータシステムの概略構成図である。 クエリ形態素集計画面の一例である。 クエリ形態素のフィルタ・ソート例を説明するための画面G2の一例である。 フィルタまたはソート前の共通処理の一例を示すシーケンス図である。 選択された検索クエリと検索結果が似たクエリ群のクエリ形態素を表示するための処理の一例を示すフローチャートである。 選択されたサイトがリーチしているクエリ群のクエリ形態素を表示するための処理の第1の例を示すフローチャートである。 選択されたサイトがリーチしているクエリ群のクエリ形態素を表示するための処理の第2の例を示すフローチャートである。 選択されたページと検索ニーズが類似するページの統計量を表示するための処理の一例を示すフローチャートである。 標的クエリによって評価されるページが説明タイプの場合のクエリ形態素集計画面の一例である。 標的クエリによって評価されるページが一覧タイプの場合のクエリ形態素集計画面の一例である。
 以下、各実施形態について、図面を参照しながら説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
 <定義>
 本実施形態における用語の定義について説明する。ウェブページは単にページということがある。また上位ページは、検索エンジンにおいて検索結果の上位に表示されるページである。ここで上位は任意に設定可能であり、例えば1位~N位(Nは自然数)である。
 クエリ形態素は、制作対象ページの標的ユーザが検索エンジンに検索要求する際に用いる任意の検索クエリ(以下、標的クエリという)に含まれるコア形態素とともに過去に他の複合クエリのうち、標的クエリの形態素を除いたものである。ここで標的クエリに含まれるコア形態素は1つであっても複数であってもよく、標的クエリそのものであってもよい。どの形態素を標的クエリ内のコア形態素とみなすかは、ユーザが任意に決定することができる。本実施形態では説明の簡略化のためコア形態素は1つであるものとして説明する。
 ページ形態素は、ページに記載された形態素であり、ページ制作者が意識的または無意識的にクエリ形態素と同一の形態素を含めることがある。
 サイト骨格タグは、(例えばページの骨子の構成要素にあたる形態素の投入が適する)サイト内容の骨格となる言葉が使用されるタグまたは属性の総称である。それらにおいてはリンク関係にある他のページの主題を予告または示唆しやすいという特徴があり、それぞれのサイト骨格タグにどのようなクエリ形態素を登用するかはサイトの構造設計(複数のページ同士の意味的な関係の設計)を検討するうえで極めて重要である。サイト骨格タグに含まれるタグには例えば、見出しタグ(例えば、h1~h6)、リストタグ(例えば、ul、ol、li、dt)、テーブルタグ(例えば、th、td)、フォーム内入力タグ(selectタグやcheckbox、radioなどinputタグ)、アンカータグ(例えば、aタグ)、画像タグ(imgタグ)、オプションタグ(optionタグ)等が含まれる。
 サイト骨格タグに含まれる属性には、例えばhref属性のようにaタグに付与する情報、inputタグのtype属性、imgタグのalt属性、title属性等が含まれる。ここで属性の例について詳細に説明する。<a href=”/index.html”>リンク</a>のような例の場合、<a></a>で挟まれている部分はコンテンツとなり、hrefのようにaタグに付与する情報が属性であり、aタグのhref属性に/index.htmlが指定されている。例えば、checkboxやradioなどはテキスト入力と同じinputタグが使用され、type属性で切り替えが行われる。クエリ形態素がコンテンツではなくこのような属性に使われるケースもあり、例えばimgタグのalt属性に使われる。
 図1は、本実施形態に係る情報処理システムの概略構成図である。図1に示すように、情報処理システムSは、端末1-1~1-K(Kは自然数)と、端末1-1~1-Kと通信回路網CNを介して接続されたコンピュータシステム2とを備える。検索エンジンの一例である検索エンジンサーバ3は、通信回路網CNを介して通信可能にコンピュータシステム2に接続されている。
 端末1-1~1-Kは、別々のユーザによって使用されるもので、例えば、多機能携帯電話(いわゆるスマートフォン)などの携帯電話、タブレット、ノートパソコン、またはデスクトップパソコンなどである。本実施形態では一例として、端末1-1~1-Kには、例えばウェブブラウザを介して、コンピュータシステム2から送信された情報が表示されるものとして以下説明する。以下、端末1-1~1-Kを総称して端末1とも呼ぶ。
 コンピュータシステム2は、本実施形態に係る情報処理システムSを管理する管理団体によって使用されるものである。コンピュータシステム2は端末1-1~1-Kに対して情報を提供する。コンピュータシステム2は、一台のコンピュータで構成されてもよいし、複数のコンピュータで構成されてもよい。本実施形態では一例として、コンピュータシステム2は、一台のコンピュータであるものとして説明する。
 図2は、本実施形態に係る端末の概略構成図である。図2に示すように、端末1は例えば、入力インタフェース11と、通信モジュール12と、ストレージ13と、メモリ14と、出力インタフェース15と、プロセッサ16とを備える。
 入力インタフェース11は、ユーザからの入力を受け付け、受け付けた入力に応じた入力信号をプロセッサ16へ出力する。
 通信モジュール12は、通信回路網CNに接続されており、コンピュータシステム2と通信する。この通信は有線であっても無線であってもよいが、無線であるものとして説明する。
 ストレージ13には、プロセッサ16が読み出して実行するためのプログラム及び各種のデータが格納されている。
 メモリ14は、データ及びプログラムを一時的に保持する。メモリ14は、揮発性メモリであり、例えばRAM(Random Access Memory)である。
 出力インタフェース15は、ディスプレイ17に接続されており、プロセッサ16の指令に従って映像信号をディスプレイ17に出力する。
 プロセッサ16は、ストレージ13からプログラムをメモリ14にロードし、当該プログラムに含まれる一連の命令を実行することによって、処理を実行する。
 ディスプレイ17は、プロセッサ16の指令に従って情報を表示する。なおディスプレイ17は端末1に外付けで接続されているだけではなく、端末1に内蔵であってもよい。
 図3は、本実施形態に係るコンピュータシステムの概略構成図である。図3に示すように、コンピュータシステム2は、入力インタフェース21と、通信モジュール22と、ストレージ23と、メモリ24と、出力インタフェース25と、プロセッサ26とを備える。
 入力インタフェース21は、コンピュータシステム2の管理者(例えば、管理団体の従業員)からの入力を受け付け、受け付けた入力に応じた入力信号をプロセッサ26へ出力する。
 通信モジュール22は、通信回路網CNに接続されており、端末1-1~1-Kと通信する。この通信は有線であっても無線であってもよいが、有線であるものとして説明する。
 ストレージ23は、プロセッサ26が読み出して実行するためのプログラム及び各種のデータが格納されている。
 メモリ24は、データ及びプログラムを一時的に保持する。メモリ24は、揮発性メモリであり、例えばRAM(Random Access Memory)である。
 出力インタフェース25は、外部の装置と接続可能であり、当該外部の装置へ信号を出力可能である。
 プロセッサ26は、ストレージ23からプログラムをメモリ24にロードし、当該プログラムに含まれる一連の命令を実行することによって、計数手段261、出力手段262、分類手段263、処理手段264、種類数計数手段265、検索数計数手段266、経済規模決定手段267、取得手段268、類似度決定手段269、解析結果取得手段270、抽出手段271、統計量決定手段272、判定手段273、特有度決定手段274として機能する。それぞれの処理については後述する。
 計数手段261は、標的クエリの検索ヒットページのソースの一部または全部に含まれるクエリ形態素の数または割合を計数する。出力手段262は、前記計数されたクエリ形態素の数または割合を表示するための情報を出力する。この処理について、図4におけるクエリ形態素集計画面に表示されるクエリ形態素の数を用いてについて説明する。
 <実施例1>
 続いて実施例1において端末1に表示されるクエリ形態素集計画面について説明する。図4は、クエリ形態素集計画面の一例である。図4に示すように、クエリ形態素集計画面G1には、一例として標的クエリ「cad」を用いた検索エンジンでの検索結果に含まれる検索順位1~10位までのページが、そのページのタイトル、URL、解析結果とともに示されている。ここで解析結果とは、各ページに含まれる形態素の分布の違いを解析した結果である。ここでは一例として、各ページに含まれる形態素を多次元の特徴ベクトルデータに変換してクラスタリング処理を行った結果を、各ページそれぞれのカラーバー上に色や模様を異ならせて表示している。
 この解析結果を取得するために、解析結果取得手段270は、複数のページそれぞれについて、異なる検索ニーズがどの程度混在しているかに関する検索のニーズの性質の解析結果を取得する。具体的には例えば、解析結果取得手段270は、特許文献3(特許第6680956号公報)の請求項12及びその明細書の対応箇所に記載の方法、または請求項17及びその明細書の対応箇所に記載の方法に従って、解析結果を取得する。
 図4に示すように、解析結果画面G1には、検索順位1~6位までのページそれぞれに含まれるクエリ形態素の総数(図4のTOTALに対応する数字)が表示されている。また解析結果画面G1には、検索順位1~6位までのページそれぞれに含まれるサイト骨格タグと関連付けられて記載された(例えば、タグに挟まれたもしくは、属性として記載された)クエリ形態素の総数(図4のサイト骨格タグTOTALに対応する数字)が表示されている。その内訳として、検索順位1~6位までのページそれぞれに含まれる、ヘッダータグ、リストタグ、テーブルタグ、フォーム内タグ、アンカータグ、画像タグそれぞれと関連付けられて記載された(例えば、タグに挟まれたもしくは、属性として記載された)クエリ形態素の数が示されている。更に、検索順位1~6位までのページそれぞれに含まれるその他のタグと関連付けられて記載された(例えば、タグに挟まれたもしくは属性として記載された)クエリ形態素の総数(図4のその他のタグTOTALに対応する数字)が表示されている。
 上記の例では、計数手段261が計数する対象となる前記ページのソースの一部に含まれるクエリ形態素は、当該ソース中の複数のサイト骨格タグに関連付けられて記載された複数の文字列である。上記の表示を実現するために、計数手段261は、前記ソース中の複数のサイト骨格タグに関連付けられた複数の文字列中のクエリ形態素の数または割合を計数する。そして出力手段262は、前記計数されたクエリ形態素の数または割合を表示するための情報を出力する。
 <計数の観点1:一つのサイト骨格タグについて複数のページそれぞれで計数>
 より詳細には、計数手段261は、前記の検索ヒットページそれぞれについて、当該ページのソース中の複数のサイト骨格タグに関連付けられた複数の文字列中のクエリ形態素の数または割合を計数する。
 そして出力手段262は、前記計数されたクエリ形態素の数または割合を比較可能に表示するための情報を出力する。これにより、一つのサイト骨格タグに関連付けられたクエリ形態素の数を、検索ヒットページ間で比較することができる。
 <計数の観点2:サイト骨格タグの種類毎の計数>
 また計数手段261は、前記クエリ形態素の数または割合を、サイト骨格タグの種類毎に計数する。そして出力手段262は、前記サイト骨格タグの種類毎に前記クエリ形態素の数または割合を表示するための情報を出力する。これにより、複数種類のサイト骨格タグの間で、そのサイト骨格タグに関連付けられたクエリ形態素の数を、比較することができる。
 <計数の観点1と計数の観点2の組合せ>
 この計数の観点1とこの計数の観点2の組合せると、計数手段261は、前記標的クエリの検索ヒットページそれぞれについて、当該ページのソース中の複数のサイト骨格タグに関連付けられた複数の文字列中に含まれるクエリ形態素の数または割合、サイト骨格タグの種類毎に計数する。そして出力手段262は、前記クエリ形態素の数または割合を前記サイト骨格タグの種類毎に比較可能に表示するための情報を出力する。これにより、サイト骨格タグそれぞれに関連付けられたクエリ形態素の数を、検索ヒットページ間で比較することができる。
 更に解析結果画面G1には、クエリ形態素毎に、その名称、クエリ種類数、経済規模が表示されている。ここでは、クエリ種類数とは、標的クエリ(図4の例では「cad」)と該当するクエリ形態素(例えば、検索クエリ〈autocad〉から抽出されたクエリ形態素「auto」)とを含む検索クエリの種類数である。ここで、経済規模は、クエリ形態素の抽出元となった1つまたは複数の検索クエリについてどのくらいの経済規模があるかを示す。クエリ形態素の経済規模は例えば、標的クエリと当該クエリ形態素が使用されている検索クエリそれぞれについて、単位期間(例えば月)あたりの検索数(検索ボリュームともいう)と、PPC広告のクリック単価と、PPC広告の競合性と、のうち、いずれか2つまたは3つを乗じた値を合計した値である。
 更にクエリ形態素毎に、検索順位1~6位までのページそれぞれに含まれる当該クエリ形態素の数が示されている。
 上記の表示を実現するために、計数手段261は、標的クエリの検索ヒットページのソースの一部または全部に含まれる複数のクエリ形態素の数または割合を、クエリ形態素の種類毎に計数する。そして出力手段262は、前記計数されたクエリ形態素の数または割合を、クエリ形態素毎に表示するための情報を出力する。ここで割合は例えば、上記ページに含まれるクエリ形態素の総数に占める対象のクエリ形態素の割合である。これにより、複数のクエリ形態素に渡って、上記ページに含まれる数または割合を比較することができる。
 より詳細には、計数手段261は、標的クエリの検索ヒットページそれぞれについて、当該ページのソースの一部または全部に含まれる複数のクエリ形態素の数または割合を、クエリ形態素の種類毎に計数する。そして出力手段262は、前記計数されたクエリ形態素の数または割合を複数のページの間でクエリ形態素の種類毎に比較可能に表示するための情報を出力する。ここで割合は例えば、上記ページに含まれるクエリ形態素の総数に占める対象のクエリ形態素の割合である。これにより、標的クエリの検索ヒットページに渡って、クエリ形態素の種類毎に、クエリ形態素の数または割合を比較することができる。
 図6は、フィルタまたはソート前の共通処理の一例を示すシーケンス図である。
 (ステップS110)コンピュータシステム2は、端末1からの要求に応じて検索クエリ入力画面データを端末1に送信する。これにより、検索クエリ入力画面が端末1に表示される。
 (ステップS120)次に端末1は、検索クエリ入力画面においてユーザによって入力された検索クエリをコンピュータシステム2へ送信する。
 (ステップS130)次にコンピュータシステム2は、検索クエリとともに検索要求を検索エンジンサーバ3へ送信する。
 (ステップS140)検索エンジンサーバ3は、検索クエリとともに検索要求を受信し、検索要求に応じて検索クエリで検索を実行する。
 (ステップS150)検索エンジンサーバ3は、検索結果をコンピュータシステム2へ送信する。
 (ステップS160)コンピュータシステム2は、検索結果を受信し、検索結果の例えば1位から10位の各URL(Uniform Resource Locator)を宛先とするHTTPリクエストを通信回路網CNに順次送信する。
 (ステップS170)各HTTPリクエストを受信したウェブサーバは、該当するページデータをコンピュータシステム2に返信する。
 (ステップS180)コンピュータシステム2は、これらのページデータを受信した場合、各ページに含まれる形態素毎に計数し、解析結果画面データを生成して、解析結果画面データを端末1へ送信する。これにより、クエリ形態素集計画面(例えば、図4の画面G1)が端末1に表示される。
 このとき、複数の形態素をひとつのグループとしてまとめ、グループ内の形態素の計数結果の合計としても良い。例えば「学習」、「勉強」の関係にあるような同義語など標的ユーザが読み取る内容が同じ形態素について別々に計数するのではなく、一つのグループとしてまとめて計数することで、言い換えなどを同じ形態素としてカウントすることが可能になり、読者の感覚に近い形で計数することが可能となる。
 このとき、複数の形態素をまとめる方法として、あらかじめ定義した同義語・類似語データベースに基づいて自動で処理しても良い。また、グループの追加やグループ内の形態素を追加・削除することで、ユーザが調整しても良い。これにより、例えば「学習」「勉強」を同じ意味として扱うべき状況か、それぞれを厳密に分けるべきかをユーザが調整することが可能となる。
 前記ユーザが調整した結果を用いることで、同義語・類義語の定義や分類を機械学習アルゴリズムなどを用いて更新する仕組みを追加しても良い。
 <クエリ形態素のフィルタ・ソート例>
 続いてクエリ形態素のフィルタ・ソート例について説明する。図5は、クエリ形態素のフィルタ・ソート例を説明するための画面G2の一例である。クエリ形態素集計画面(例えば、図4の画面G1)表示後において、ユーザから所定の操作を受け付けた場合、図5の画面G2のように、クエリ形態素のフィルタ・ソートを設定するためにポップアップされた設定領域R2が表示される。図5の画面G2における設定領域R2において、検索クエリを選択可能なセレクトボックスR21が表示されており、検索クエリが選択された場合、選択された検索クエリと検索結果が似たクエリ群のクエリ形態素を表示することができる。
 選択された検索クエリと検索結果が似たクエリ群のクエリ形態素を表示するための処理について図7を用いて説明する。図7は、選択された検索クエリと検索結果が似たクエリ群のクエリ形態素を表示するための処理の一例を示すフローチャートである。
 (ステップS210)端末1のプロセッサ16は、例えば、図5の画面G2の設定領域R2におけるセレクトボックスR21で選択された、クエリ形態素を含む検索クエリを受け付ける。
 (ステップS220)端末1のプロセッサ16は、受け付けた検索クエリをコンピュータシステム2へ送信する。
 (ステップS230)取得手段268は、ユーザが指定したクエリ形態素(例えば「3d」)もしくは当該クエリ形態素(例えば「3d」)を含む検索クエリ(図5の例では、「3d cad」)を取得する。
 そして類似度決定手段269は、標的クエリによる検索結果に含まれる複数のページそれぞれについて、当該ページのソースに含まれる前記取得されたクエリ形態素(図5の例では「3d」)の数で前記複数のページをランキングした結果と、複数の前記クエリ形態素のうち当該取得されたクエリ形態素以外の別クエリ形態素(例えば、「auto」)の数で前記複数のページをランキングした結果との類似度を、当該別クエリ形態素毎に(図5の例では、「auto」、「free」、「soft」、「2020」など毎に)決定する。
 (ステップS240)処理手段264は、複数の前記クエリ形態素を、対応する前記決定された類似度でフィルタもしくはソートする。
 (ステップS250)出力手段262は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を処理後画面データとして出力し、端末1へ送信する。
 (ステップS260)端末1は、処理後画面データを受信し、この処理後画面データを用いて処理後画面を表示する。
 図5の画面G2における設定領域R2において、サイトを選択可能なセレクトボックスR22が表示されており、サイトを選択された場合、選択されたサイトがリーチしているクエリ群のクエリ形態素が表示される。
 選択されたサイトがリーチしているクエリ群のクエリ形態素を表示するための処理の第1の例について図8を用いて説明する。図8は、選択されたサイトがリーチしているクエリ群のクエリ形態素を表示するための処理の第1の例を示すフローチャートである。
 (ステップS310)端末1のプロセッサ16は、例えば、図5の画面G2の設定領域R2におけるセレクトボックスR22で選択された、選択ページを受け付ける。
 (ステップS320)端末1のプロセッサ16は、受け付けた選択ページを識別する選択ページ識別情報をコンピュータシステム2へ送信する。
 (ステップS330)取得手段268は、標的クエリによる検索結果に含まれる複数のサイト(もしくはページ)からユーザが選択した選択サイトを取得する。ここで当該複数のサイトは例えば上位サイトである。上位サイトは予め決められた順位範囲のサイト(例えば1位~3位のサイト)であってもよいし、ユーザによって指定された範囲のサイトであってもよい。
 処理手段264は、複数の前記クエリ形態素を、前記取得された選択サイトに含まれるクエリ形態素でフィルタするか、前記取得された選択サイトに含まれるクエリ形態素の数でソートする。
 (ステップS340)出力手段262は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を処理後画面データとして出力し、端末1へ送信する。
 (ステップS350)端末1は、処理後画面データを受信し、この処理後画面データを用いて処理後画面を表示する。
 選択されたサイトがリーチしているクエリ群のクエリ形態素を表示するための処理の第2の例について図9を用いて説明する。図9は、選択されたサイトがリーチしているクエリ群のクエリ形態素を表示するための処理の第2の例を示すフローチャートである。ステップS410、S420、S440、S450は、図8の対応するステップS310、S320、S340、S350と同様であるので、その説明を省略する。
 (ステップS430)取得手段268は、標的クエリによる検索結果に含まれる複数のサイト(もしくはページ)からユーザが選択した選択サイトを取得する。
 処理手段264は、前記取得された選択サイトに含まれるクエリ形態素の数で前記複数のページをランキングした場合の順位でフィルタまたはソートする。
 図5の画面G2における設定領域R2において、ページを選択可能なセレクトボックスR23が表示されており、上位何ページまでを上位ページとして選択する選択可能なセレクトボックスR230が表示されている。更に昇順ボタンR231、降順ボタンR232が表示されている。
 セレクトボックスR23でページが選択され且つセレクトボックスR24で上位何ページまでかを選択された状態で、昇順ボタンR231が押された場合、例えば選択されたページと似たキャラの上位Mページ(図5の例ではMは3)の含有量合計の昇順で複数のクエリ形態素がソートされて表示される。一方、セレクトボックスR23でページが選択され且つセレクトボックスR24で上位何ページまでかを選択された状態で、降順ボタンR232が押された場合、例えば選択されたページと似たキャラの上位Mページ(図5の例ではMは3)の含有量合計の降順で複数のクエリ形態素がソートされて表示される。ここでキャラとは、異なる検索ニーズがどの程度混在しているかに関する検索のニーズの性質である。
 選択されたページと検索ニーズが類似するページの統計量(例えば上位ページの含有量合計)を表示するための処理について図10を用いて説明する。図10は、選択されたページと検索ニーズが類似するページの統計量を表示するための処理の一例を示すフローチャートである。
 (ステップS510)端末1のプロセッサ16は、例えば、図5の画面G2の設定領域R2におけるセレクトボックスR23で選択された、選択ページを受け付ける。またセレクトボックスR230で選択された、上位ページに該当するページ数を受け付ける。
 (ステップS520)端末1のプロセッサ16は、受け付けた選択ページを識別する選択ページ識別情報と上位ページに該当するページ数をコンピュータシステム2へ送信する。
 (ステップS530)取得手段268は、標的クエリによる検索結果に含まれる複数のページからユーザが選択した選択ページを取得する。
 解析結果取得手段270は、前記複数のページそれぞれについて、異なる検索ニーズがどの程度混在しているかに関する検索のニーズの性質の解析結果を取得する。
 (ステップS540)抽出手段271は、前記解析結果に基づいて、前記複数のページから、前記選択ページとの間で、検索ニーズの混在具合が類似している類似ページを抽出する。図5の例では抽出手段271は例えば、検索ニーズの混在具合が類似している上位Mページ(Mは、ユーザによって選択された上位ページに該当するページ数)を類似ページとして抽出する。
 (ステップS550)統計量決定手段272は、クエリ形態素毎に、前記類似ページそれぞれに含まれるクエリ形態素の数に基づいて統計量(ここではその一例として含有量合計)を決定する。
 (ステップS560)処理手段264は、複数の前記クエリ形態素を、対応する前記決定された統計量でフィルタもしくはソートする。
 (ステップS570)出力手段262は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を処理後画面データとして出力し、端末1へ送信する。
 (ステップS580)端末1は、処理後画面データを受信し、この処理後画面データを用いて処理後画面を表示する。
 ここでは、取得手段268は、ユーザによって指定された順位をユーザ指定順位として取得する。統計量決定手段272は、クエリ形態素毎に、前記複数のページのうちから当該クエリ形態素が多い順に前記ユーザ指定順位まで選択された前記類似ページそれぞれに含まれるクエリ形態素の数に基づいて前記統計量を決定する。
 図5の画面G2における設定領域R2において、上位何ページを上位ページとして選択する選択可能なセレクトボックスR24が表示されており、ここではセレクトボックスR24において上位「3ページ」が選択されている。これに伴い、上位「3ページ」が具体的に何位のページかを選択可能なセレクトボックスR241、セレクトボックスR242、セレクトボックスR243が表示されている。ここでは一例として「1位」、「2位」、「3位」が上位「3ページ」として選択されている。更に昇順ボタンR244、降順ボタンR245が表示されている。
 この状態で昇順ボタンR244が押された場合、例えば選択された「1位」、「2位」、「3位」のページにおけるクエリ形態素毎の含有量合計の昇順で複数のクエリ形態素がソートされて表示される。一方、この状態で降順ボタンR245が押された場合、例えば選択された「1位」、「2位」、「3位」のページにおけるクエリ形態素毎の含有量合計の降順で複数のクエリ形態素がソートされて表示される。
 この表示を実現するために、コンピュータシステム2において例えば以下の処理が実行される。
 取得手段268は、ユーザによって選択された上位ページを取得する。
 処理手段264は、複数の前記クエリ形態素を、上位ページにおけるクエリ形態素毎の統計量(ここでは一例として含有量合計)でフィルタもしくはソートする。例えば昇順ボタンR244が押された場合、処理手段264は昇順にソートし、降順ボタンR245が押された場合、処理手段264は降順にソートする。
 出力手段262は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を処理後画面データとして出力し、端末1へ送信する。これにより、端末1で処理後画面が表示される。
 図5の画面G2における設定領域R2において、上位何ページを上位ページとして選択する選択可能なセレクトボックスR25が表示されており、ここではセレクトボックスR25において上位「3ページ」が選択されている。これに伴い、上位「3ページ」が具体的に何位のページかを選択可能なセレクトボックスR251、セレクトボックスR252、セレクトボックスR253が表示されている。ここでは一例として「1位」、「2位」、「3位」が上位「3ページ」として選択されている。
 更に図5の画面G2における設定領域R2において、下位何ページまでを上位ページとして選択する選択可能なセレクトボックスR26が表示されており、ここではセレクトボックスR26において下位「3ページ」が選択されている。これに伴い、下位「3ページ」が具体的に何位のページかを選択可能なセレクトボックスR261、セレクトボックスR262、セレクトボックスR263が表示されている。ここでは一例として「8位」、「9位」、「10位」が下位「3ページ」として選択されている。更に昇順ボタンR254、降順ボタンR255が表示されている。
 この状態で昇順ボタンR254が押された場合、選択された「1位」、「2位」、「3位」のページにおけるクエリ形態素の含有量合計と、選択された「8位」、「9位」、「10位」のページにおける対応するクエリ形態素の含有量合計の差が、当該クエリ形態素それぞれ毎に決定される。そして、この含有量合計の差の昇順で複数のクエリ形態素がソートされて表示される。一方、この状態で降順ボタンR255が押された場合、この含有量合計の差の降順で複数のクエリ形態素がソートされて表示される。
 この表示を実現するために、コンピュータシステム2において例えば以下の処理が実行される。
 取得手段268は、ユーザによって選択された上位ページ及び下位ページを取得する。
 処理手段264は、複数の前記クエリ形態素を、当該クエリ形態素それぞれ毎に決定される上位ページにおけるクエリ形態素の統計量と下位ページにおけるクエリ形態素の統計量に基づく値(ここでは一例として差分値)でフィルタもしくはソートする。例えば昇順ボタンR254が押された場合、処理手段264は昇順にソートし、降順ボタンR255が押された場合、処理手段264は降順にソートする。
 出力手段262は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を処理後画面データとして出力し、端末1へ送信する。これにより、端末1で処理後画面が表示される。
 <経済規模によるフィルタまたはソート>
 図5の画面G2における設定領域R2において、経済規模に対応する昇順ボタンR271、降順ボタンR272が表示されている。クエリ形態素(例えば、「auto」、「free」、「soft」など)毎に、標的クエリ(ここでは一例として「cad」)と当該クエリ形態素を含む検索クエリの経済規模が算出可能である。ここで経済規模は例えば特許文献2に記載の経済規模である。
 昇順ボタンR271が押された場合、標的クエリとクエリ形態素を含む検索クエリの経済規模の昇順で複数のクエリ形態素がソートされて表示される。一方、降順ボタンR272が押された場合、標的クエリとクエリ形態素を含む検索クエリの経済規模の降順で複数のクエリ形態素がソートされて表示される。
 この表示を実現するために、コンピュータシステム2において例えば以下の処理が実行される。
 取得手段268は、経済規模によるフィルタもしくはソートの要求を取得する。
 経済規模決定手段267は例えば、標的クエリを構成する形態素であるコア形態素とクエリ形態素の両方が含まれる複数の検索クエリの検索数それぞれと、対応するクリック単価及び/または競合性を用いて、当該検索クエリに対する経済規模を、クエリ形態素毎に決定する。
 処理手段264は、複数の前記クエリ形態素を、経済規模でフィルタもしくはソートする。その際、例えば昇順ボタンR271が押された場合、処理手段264は昇順にソートし、降順ボタンR272が押された場合、処理手段264は降順にソートする。
 出力手段262は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を処理後画面データとして出力し、端末1へ送信する。これにより、端末1で処理後画面が表示される。
 <検索数によるフィルタまたはソート>
 また図5の画面G2における設定領域R2において、検索数に対応する昇順ボタンR281、降順ボタンR282が表示されている。昇順ボタンR281が押された場合、標的クエリとクエリ形態素を含む検索クエリの過去の所定期間の検索数の昇順で複数のクエリ形態素がソートされて表示される。一方、降順ボタンR282が押された場合、標的クエリとクエリ形態素を含む検索クエリの過去の所定期間の検索数の降順で複数のクエリ形態素がソートされて表示される。
 この表示を実現するために、コンピュータシステム2において例えば以下の処理が実行される。
 取得手段268は、検索数によるフィルタもしくはソートの要求を取得する。
 検索数計数手段266は、標的クエリを構成する形態素であるコア形態素とクエリ形態素の両方が含まれる検索数を、クエリ形態素毎に計数する。
 処理手段264は、複数の前記クエリ形態素を、対応する前記計数された検索数でフィルタもしくはソートする。その際、例えば昇順ボタンR281が押された場合、処理手段264は昇順にソートし、降順ボタンR282が押された場合、処理手段264は降順にソートする。
 出力手段262は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を処理後画面データとして出力し、端末1へ送信する。これにより、端末1で処理後画面が表示される。
 <クエリ種類数によるフィルタまたはソート>
 また図5の画面G2における設定領域R2において、クエリ種類数に対応する昇順ボタンR291、降順ボタンR292が表示されている。昇順ボタンR291が押された場合、標的クエリとクエリ形態素を含む検索クエリの種類数の昇順で複数のクエリ形態素がソートされて表示される。ここで検索クエリの種類数は、例えば過去の所定期間で検索実行された検索クエリの種類の数である。一方、降順ボタンR292が押された場合、標的クエリとクエリ形態素を含む検索クエリの種類数の降順で複数のクエリ形態素がソートされて表示される。
 この表示を実現するために、コンピュータシステム2において例えば以下の処理が実行される。
 取得手段268は、検索クエリの種類数によるフィルタもしくはソートの要求を取得する。
 種類数計数手段265は、標的クエリを構成する形態素であるコア形態素とクエリ形態素の両方が含まれる検索クエリの種類数を、クエリ形態素毎に計数する。
 処理手段264は、複数の前記クエリ形態素を、対応する前記計数された検索クエリの種類数でフィルタもしくはソートする。その際、例えば昇順ボタンR291が押された場合、処理手段264は昇順にソートし、降順ボタンR292が押された場合、処理手段264は降順にソートする。
 出力手段262は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を処理後画面データとして出力し、端末1へ送信する。これにより、端末1で処理後画面が表示される。
 <業界特有度によるフィルタまたはソート>
 また図5の画面G2における設定領域R2において、業界特有度に対応する昇順ボタンR301、降順ボタンR302が表示されている。昇順ボタンR301が押された場合、業界特有度の昇順で複数のクエリ形態素がソートされて表示される。一方、降順ボタンR302が押された場合、業界特有度の降順で複数のクエリ形態素がソートされて表示される。
 ここで業界特有度は、標的クエリを構成する形態素であるコア形態素(例えば「cad」)とクエリ形態素の両方が含まれる検索クエリの上位ページでどの程度特徴的に対象形態素が使用されているかを表す指標であり、例えばコア形態素(例えば「cad」)とクエリ形態素の両方が含まれる検索クエリによる検索結果の上位ページ群で登場頻度が高いほど高く且つコア形態素(例えば「cad」)と他のクエリ形態素の両方が含まれる他の検索クエリ群の検索結果の上位ページ群で頻度が低いほど高くなるように設定されたパラメータである。この業界特有度は、一例として特許文献4(特許第6253041号公報)の特有度であってもよく、具体的には例えば当該形態素の業界用語としての特有度を所定の評価関数に基づき算定されたものであってもよいが、これに限らない。
 この表示を実現するために、コンピュータシステム2において例えば以下の処理が実行される。
 取得手段268は、検索クエリの種類数によるフィルタもしくはソートの要求を取得する。
 特有度決定手段274は、業界特有度を所定の評価関数に基づき、クエリ形態素毎に決定する。
 処理手段264は、複数の前記クエリ形態素を、対応する前記決定された業界特有度でフィルタもしくはソートする。
 出力手段262は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を処理後画面データとして出力し、端末1へ送信する。これにより、端末1で処理後画面が表示される。
 <セグメントによるフィルタまたはソート>
 また図5の画面G2における設定領域R2において、セグメントの例として、ブランド、エリア、エコノミカル、オピニオン、サービス、その他が示されており、ブランドを選択可能なチェックボックスR31、エリアを選択可能なチェックボックスR32、エコノミカルを選択可能なチェックボックスR33、オピニオンを選択可能なチェックボックスR34、サービスを選択可能なチェックボックスR35、その他を選択可能なチェックボックスR36が示されている。これにより、選択されたセグメントに含まれるクエリ形態素が表示される。ここでは一例として、全てのチェックボックスが選択されているので、全てのセグメントのクエリ形態素が表示される。
 この表示を実現するために、コンピュータシステム2において例えば以下の処理が実行される。
 分類手段263は、クエリ形態素それぞれを、当該クエリ形態素に基づいて、複数のセグメントのいずれかに分類する。
 取得手段268は、ユーザが指定するセグメントを取得する。
 処理手段264は、複数の前記クエリ形態素をユーザが指定するセグメントでフィルタもしくはソートする。
 出力手段262は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を処理後画面データとして出力し、端末1へ送信する。これにより、端末1で処理後画面が表示される。
 以上、本実施形態に係る情報処理システムSは、標的クエリの検索ヒットページのソースの一部または全部に含まれるクエリ形態素の数または割合を計数する計数手段261と、前記計数されたクエリ形態素の数または割合を表示するための情報を出力する出力手段262と、を備える。
 これにより、ページのソースの一部または全部に含まれるクエリ形態素の数または割合をユーザが把握することにより、当該ページにおいて、足りていないクエリ形態素の把握を容易化することができ、ページにおけるクエリ形態素の選定作業の効率を向上させることができる。
 <実施例2>
 続いて実施例2において、端末1に表示されるクエリ形態素集計画面について図11及び図12を用いて説明する。図11は、標的クエリによって評価されるページが説明タイプの場合のクエリ形態素集計画面の一例である。図12は、標的クエリによって評価されるページが一覧タイプの場合のクエリ形態素集計画面の一例である。ここで説明タイプは、当該標的クエリを構成する形態素であるコア形態素を説明するカテゴリであり、一覧タイプは、当該標的クエリを構成する形態素であるコア形態素に該当するものを一覧表示するカテゴリである。ページのカテゴリには、説明タイプ、一覧タイプが含まれる。
 図11の画面G3において、テキストボックスR41には、標的クエリの一例としてユーザによって入力された「掃除機 機能」が示されている。この「機能」というクエリ形態素を含む検索クエリの場合、検索クエリに含まれる形態素(ここでは「掃除機」)の「機能」を説明するページが検索結果として抽出されるから、この「機能」というクエリ形態素を含む検索クエリは「説明タイプ」である。よって、テキストボックスR41に「掃除機 機能」と入力された場合、ラベルR42として「説明タイプ」とカテゴリが表示される。
 一方、図12の画面G4において、テキストボックスR43は、標的クエリの一例としてユーザによって入力された「掃除機 比較」が示されている。この「比較」というクエリ形態素を含む検索クエリの場合、検索クエリに含まれる形態素(ここでは「掃除機」)を「比較」して一覧表示するページが検索結果として抽出されるから、この「比較」というクエリ形態素を含む検索クエリは「一覧タイプ」である。テキストボックスR43に「掃除機 比較」と入力された場合、ラベルR44として「一覧タイプ」とカテゴリが表示される。
 この表示を実現するために、コンピュータシステム2において例えば以下の処理が実行される。
 判定手段273は、標的クエリ(例えば、「掃除機 比較」)による検索結果に含まれるページのソース中に含まれる第1の種類のサイト骨格タグの数と第2の種類のサイト骨格タグの数との比較に基づいて、当該標的クエリによって評価されるページのカテゴリを判定してもよい。ここで例えば、サイト骨格タグのうちaタグとhタグに着目した場合、説明タイプのページであれば、多くの場合、それぞれのサブニーズについてhタグで骨格を作る傾向がある。一方、一覧タイプのページのうち例えば商品一覧などのページであれば、各商品がサブニーズだとするとそれぞれの商品詳細ページへのリンク文字としてaタグ内で使われる頻度が高い傾向にある。このような傾向であれば、標的クエリ群がhタグに偏って使用されているページでは説明タイプ、aタグに偏って使用されているページでは一覧タイプと判断することも可能である。上記は一例であり、機械学習技術により、検索結果上位ページ内での標的クエリの使われ方の傾向とページタイプとの関連を学習させた判別器などによってページタイプを判定しても良い。このように、標的クエリによる検索結果に含まれるページのソース中にサイト骨格タグとして第1の種類のタグ(例えばaタグ)と第2の種類のタグ(例えばhタグ)が含まれる場合において、判定手段273は、標的クエリによる検索結果に含まれるページのソース中に含まれる第1の種類のタグ(例えばaタグ)の数と第2の種類のタグ(例えばhタグ)の数の比較に基づいて、当該標的クエリによって評価されるページのカテゴリを判定してもよい。その際例えば、判定手段273は、aタグの数とhタグの数の割合で、aタグの割合の方が大きければ当該カテゴリを一覧タイプと判定し、hタグの割合の方が大きければ当該カテゴリを説明タイプと判定してもよい。出力手段262は、前記判定されたカテゴリを表示するための情報を出力し、この情報を端末1に送信する。端末1は、この情報を表示することにより、図11または図12のように、カテゴリ(例えば、「説明タイプ」または「一覧タイプ」)が表示される。
 以上、本実施形態に係る情報処理システムSは、標的クエリによる検索結果に含まれるページのソース中に含まれるクエリ形態素の数と、当該ソース中の複数のサイト骨格タグに挟まれた複数の文字列中に含まれるクエリ形態素の数との比較に基づいて、当該検索クエリによって評価されるページのカテゴリを判定する判定手段273と、前記判定されたカテゴリを表示するための情報を出力する出力手段262と、を備える。
 この構成により、標的クエリによる検索結果に含まれるページがどのようなカテゴリに属するページであるのかを把握することができる。
 なお、上述した実施形態で説明したコンピュータシステム2のプロセッサ26で実行された一部または全部の手段が、端末1のプロセッサ16で実行されてもよい。上述した実施形態で説明したコンピュータシステム2の少なくとも一部は、ハードウェアで構成してもよいし、ソフトウェアで構成してもよい。ソフトウェアで構成する場合には、コンピュータシステム2の少なくとも一部の機能を実現するプログラムをコンピュータ読み取り可能な記録媒体に収納し、コンピュータに読み込ませて実行させてもよい。記録媒体は、磁気ディスクや光ディスク等の着脱可能なものに限定されず、ハードディスク装置やメモリなどの固定型の記録媒体でもよい。
 また、コンピュータシステム2の少なくとも一部の機能を実現するプログラムを、インターネット等の通信回線(無線通信も含む)を介して頒布してもよい。さらに、同プログラムを暗号化したり、変調をかけたり、圧縮した状態で、インターネット等の有線回線や無線回線を介して、あるいは記録媒体に収納して頒布してもよい。
 さらに、一つまたは複数の情報機器によってコンピュータシステム2を機能させてもよい。複数の情報機器を用いる場合、そのうちの1つをコンピュータとし、当該コンピュータが所定のプログラムを実行することによりコンピュータシステム2の少なくとも1つの手段として機能が実現されてもよい。
 また、方法の発明においては、全ての工程(ステップ)をコンピュータによって自動制御で実現するようにしてもよい。また、各工程をコンピュータに実施させながら、工程間の進行制御を人の手によって実施するようにしてもよい。また、さらには、全工程のうちの少なくとも一部を人の手によって実施するようにしてもよい。
 以上、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
1 端末
11 入力インタフェース
12 通信モジュール
13 ストレージ
14 メモリ
15 出力インタフェース
16 プロセッサ
17 ディスプレイ
2 コンピュータシステム
21 入力インタフェース
22 通信モジュール
23 ストレージ
24 メモリ
25 出力インタフェース
26 プロセッサ
261 計数手段
262 出力手段
263 分類手段
264 処理手段
265 種類数計数手段
266 検索数計数手段
267 経済規模決定手段
268 取得手段
269 類似度決定手段
270 解析結果取得手段
271 抽出手段
272 統計量決定手段
273 判定手段
274 特有度決定手段
3 検索エンジンサーバ
 

 
 

Claims (25)

  1.  標的クエリの検索ヒットページのソースの一部または全部に含まれるクエリ形態素の数または割合を計数する計数手段と、
     前記計数されたクエリ形態素の数または割合を表示するための情報を出力する出力手段と、
     を備え、
     前記クエリ形態素は、検索エンジンに検索要求する際に用いられる前記標的クエリとともに過去に検索で用いられた複合クエリの形態素のうち、標的クエリの形態素を除いたものである
     情報処理システム。
  2.  前記複数のページのソースの一部に含まれるクエリ形態素は、当該ソース中の複数のサイト骨格タグに関連付けられて記載された複数の文字列であり、
     前記計数手段は、前記ソース中の複数のサイト骨格タグに関連付けられた複数の文字列中のクエリ形態素の数または割合を計数し、
     前記出力手段は、前記計数されたクエリ形態素の数または割合を表示するための情報を出力し、
     前記サイト骨格タグはサイト内容の骨格となる言葉が使用されるタグまたは属性の総称である
     請求項1に記載の情報処理システム。
  3.  前記計数手段は、前記標的クエリの検索ヒットページそれぞれについて、当該ページのソース中の複数のサイト骨格タグに関連付けられた複数の文字列中のクエリ形態素の数または割合を計数し、
     前記出力手段は、前記計数されたクエリ形態素の数または割合を比較可能に表示するための情報を出力する
     請求項2に記載の情報処理システム。
  4.  前記計数手段は、前記クエリ形態素の数または割合を、サイト骨格タグの種類毎に計数し、
     前記出力手段は、前記サイト骨格タグの種類毎に前記クエリ形態素の数または割合を表示するための情報を出力する
     請求項2に記載の情報処理システム。
  5.  前記計数手段は、前記標的クエリの検索ヒットページそれぞれについて、当該ページのソース中の複数のサイト骨格タグに関連付けられた複数の文字列中に含まれるクエリ形態素の数または割合、サイト骨格タグの種類毎に計数し、
     前記出力手段は、前記クエリ形態素の数または割合を前記サイト骨格タグの種類毎に比較可能に表示するための情報を出力する
     請求項4に記載の情報処理システム。
  6.  前記計数手段は、標的クエリの検索ヒットページのソースの一部または全部に含まれる複数のクエリ形態素の数または割合を、クエリ形態素の種類毎に計数し、
     前記出力手段は、前記計数されたクエリ形態素の数または割合を、クエリ形態素毎に表示するための情報を出力する
     請求項1に記載の情報処理システム。
  7.  前記計数手段は、標的クエリの検索ヒットページそれぞれについて、当該ページのソースの一部または全部に含まれる複数のクエリ形態素の数または割合を、クエリ形態素の種類毎に計数し、
     前記出力手段は、前記計数されたクエリ形態素の数または割合を複数のページの間でクエリ形態素の種類毎に比較可能に表示するための情報を出力する
     請求項6に記載の情報処理システム。
  8.  クエリ形態素それぞれを、当該クエリ形態素に基づいて、複数のセグメントのいずれかに分類する分類手段と、
     ユーザが指定するセグメントを取得する取得手段と、
     複数の前記クエリ形態素をユーザが指定するセグメントでフィルタもしくはソートする処理手段と、
     を備え、
     前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する
     請求項6または7に記載の情報処理システム。
  9.  前記標的クエリの形態素とクエリ形態素の両方が含まれる検索クエリの種類数を、クエリ形態素毎に計数する種類数計数手段と、
     複数の前記クエリ形態素を、対応する前記計数された検索クエリの種類数でフィルタもしくはソートする処理手段と、
     を備え、
     前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する
     請求項6または7に記載の情報処理システム。
  10.  前記標的クエリの形態素とクエリ形態素の両方が含まれる検索数を、クエリ形態素毎に計数する検索数計数手段と、
     複数の前記クエリ形態素を、対応する前記計数された検索数でフィルタもしくはソートする処理手段と、
     を備え、
     前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する
     請求項6または7に記載の情報処理システム。
  11.  前記標的クエリを構成する形態素であるコア形態素とクエリ形態素の両方が含まれる複数の検索クエリの検索数それぞれと、対応するクリック単価及び/または競合性を用いて、当該検索クエリに対する経済規模を、クエリ形態素毎に決定する経済規模決定手段と、
     複数の前記クエリ形態素を、対応する前記計数された経済規模でフィルタもしくはソートする処理手段と、
     を備え、
     前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する
     請求項6または7に記載の情報処理システム。
  12.  ユーザが指定したクエリ形態素もしくは当該クエリ形態素を含む検索クエリを取得する取得手段と、
     標的クエリによる検索結果に含まれる複数のページそれぞれについて、当該ページのソースに含まれる前記取得されたクエリ形態素の数で前記複数のページをランキングした結果と、複数の前記クエリ形態素のうち当該取得されたクエリ形態素以外の別クエリ形態素の数で前記複数のページをランキングした結果との類似度を、当該別クエリ形態素毎に決定する類似度決定手段と、
     複数の前記クエリ形態素を、対応する前記決定された類似度でフィルタもしくはソートする処理手段を備え、
     前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する
     請求項6または7に記載の情報処理システム。
  13.  標的クエリによる検索結果に含まれる複数のページからユーザが選択した選択ページを取得する取得手段と、
     複数の前記クエリ形態素を、前記取得された選択ページに含まれるクエリ形態素でフィルタするか、前記取得された選択ページに含まれるクエリ形態素の数でソートするか、または前記取得された選択ページに含まれるクエリ形態素の数で前記複数のページをランキングした場合の順位でフィルタまたはソートする処理手段と、
     前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する
     請求項6または7に記載の情報処理システム。
  14.  標的クエリによる検索結果に含まれる複数のページからユーザが選択した選択ページを取得する取得手段と、
     前記複数のページそれぞれについて、異なる検索ニーズがどの程度混在しているかに関する検索のニーズの性質の解析結果を取得する解析結果取得手段と、
     前記解析結果に基づいて、前記複数のページから、前記選択ページとの間で、検索ニーズの混在具合が類似している類似ページを抽出する抽出手段と、
     クエリ形態素毎に、前記類似ページそれぞれに含まれるクエリ形態素の数に基づいて統計量を決定する統計量決定手段と、
     複数の前記クエリ形態素を、対応する前記決定された統計量でフィルタもしくはソートする処理手段と、
     を備え、
     前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する
     請求項6または7に記載の情報処理システム。
  15.  前記取得手段は、ユーザによって指定された順位をユーザ指定順位として取得し、
     前記統計量決定手段は、クエリ形態素毎に、前記複数のページのうちから当該クエリ形態素が多い順に前記ユーザ指定順位まで選択された前記類似ページそれぞれに含まれるクエリ形態素の数に基づいて前記統計量を決定する
     請求項14に記載の情報処理システム。
  16.  ユーザによって選択された上位ページを取得する取得手段と、
     複数の前記クエリ形態素を、前記上位ページにおけるクエリ形態素毎の統計量でフィルタもしくはソートする処理手段と、
     を備え、
     前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する
     請求項6または7に記載の情報処理システム。
  17.  ユーザによって選択された上位ページ及び下位ページを取得する取得手段と、
     複数の前記クエリ形態素を、当該クエリ形態素それぞれ毎に決定される上位ページにおけるクエリ形態素の統計量と下位ページにおけるクエリ形態素の統計量に基づく値でフィルタもしくはソートする処理手段と、
     を備え、
     前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する
     請求項6または7に記載の情報処理システム。
  18.  経済規模によるフィルタもしくはソートの要求を取得する取得手段と、
     複数の前記クエリ形態素を、前記経済規模でフィルタもしくはソートする処理手段と、
     を備え、
     前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する
     請求項6または7に記載の情報処理システム。
  19.  コア形態素とクエリ形態素の両方が含まれる検索クエリの上位ページでどの程度特徴的に対象形態素が使用されているかを表す指標である業界特有度によるフィルタもしくはソートの要求を取得する取得手段と、
     複数の前記クエリ形態素を、前記業界特有度でフィルタもしくはソートする処理手段と、
     を備え、
     前記出力手段は、前記フィルタもしくはソート後のクエリ形態素を表示するための情報を出力する
     請求項6または7に記載の情報処理システム。
  20.  標的クエリによる検索結果に含まれるページのソース中に含まれる第1の種類のサイト骨格タグの数と第2の種類のサイト骨格タグの数との比較に基づいて、当該標的クエリによって評価されるページのカテゴリを判定する判定手段と、
     前記判定されたカテゴリを表示するための情報を出力する出力手段と、
     を備える情報処理システム。
  21.  前記ページのカテゴリには、当該標的クエリを構成する形態素であるコア形態素を説明する説明タイプ、当該標的クエリを構成する形態素であるコア形態素に該当するものを一覧表示する一覧タイプが含まれる
     請求項20に記載の情報処理システム。
  22.  標的クエリの検索ヒットページのソースの一部または全部に含まれるクエリ形態素の数または割合を計数する計数手順と、
     前記計数されたクエリ形態素の数または割合を表示するための情報を出力する出力手順と、
     を有し、
     前記クエリ形態素は、検索エンジンに検索要求する際に用いられる前記標的クエリとともに過去に検索で用いられた複合クエリのうち、標的クエリの形態素を除いたものである情報処理方法。
  23.  標的クエリによる検索結果に含まれるページのソース中に含まれる第1の種類のサイト骨格タグの数と第2の種類のサイト骨格タグの数との比較に基づいて、当該標的クエリによって評価されるページのカテゴリを判定する判定手順と、
     前記判定されたカテゴリを表示するための情報を出力する出力手順と、
     を有する情報処理方法。
  24.  コンピュータに、
     標的クエリの検索ヒットページのソースの一部または全部に含まれるクエリ形態素の数または割合を計数する計数手順、
     前記計数されたクエリ形態素の数または割合を表示するための情報を出力する出力手順、
     を実行させるためのプログラムであって、
     前記クエリ形態素は、検索エンジンに検索要求する際に用いられる前記標的クエリとともに過去に検索で用いられた複合クエリのうち、標的クエリの形態素を除いたものであるプログラム。
  25.  コンピュータに、
     標的クエリによる検索結果に含まれるページのソース中に含まれる第1の種類のサイト骨格タグの数と第2の種類のサイト骨格タグの数との比較に基づいて、当該標的クエリによって評価されるページのカテゴリを判定する判定手順、
     前記判定されたカテゴリを表示するための情報を出力する出力手順、
     を実行させるためのプログラム。

     
PCT/JP2021/039345 2021-10-25 2021-10-25 情報処理システム、情報処理方法及びプログラム WO2023073777A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2021/039345 WO2023073777A1 (ja) 2021-10-25 2021-10-25 情報処理システム、情報処理方法及びプログラム
JP2023525619A JP7437104B2 (ja) 2021-10-25 2021-10-25 情報処理システム、情報処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2021/039345 WO2023073777A1 (ja) 2021-10-25 2021-10-25 情報処理システム、情報処理方法及びプログラム

Publications (1)

Publication Number Publication Date
WO2023073777A1 true WO2023073777A1 (ja) 2023-05-04

Family

ID=86157518

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2021/039345 WO2023073777A1 (ja) 2021-10-25 2021-10-25 情報処理システム、情報処理方法及びプログラム

Country Status (2)

Country Link
JP (1) JP7437104B2 (ja)
WO (1) WO2023073777A1 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9811591B2 (en) 2012-08-22 2017-11-07 Conductor, Inc. International search engine optimization analytics
JP2016177690A (ja) 2015-03-20 2016-10-06 株式会社電通国際情報サービス サービス推薦装置およびサービス推薦方法並びにサービス推薦プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TAKENAKA, AYAKO ET AL.: "Affiliate really can earn!", PROFESSIONAL REFERENCE FOR AFFILIATE, 10 July 2015 (2015-07-10), pages 110 - 118, XP009546344 *

Also Published As

Publication number Publication date
JP7437104B2 (ja) 2024-02-22
JPWO2023073777A1 (ja) 2023-05-04

Similar Documents

Publication Publication Date Title
US8935197B2 (en) Systems and methods for facilitating open source intelligence gathering
US6574616B1 (en) Stochastic visually based image query and retrieval system
US8739032B2 (en) Method and system for document presentation and analysis
US20140172821A1 (en) Generating filters for refining search results
US8325189B2 (en) Information processing apparatus capable of easily generating graph for comparing of a plurality of commercial products
CN102054024B (zh) 信息处理设备、信息提取方法、程序和信息处理系统
US20120323905A1 (en) Ranking data utilizing attributes associated with semantic sub-keys
KR20070009338A (ko) 이미지 상호간의 유사도를 고려한 이미지 검색 방법 및장치
US8538941B2 (en) Visual information search tool
US9256805B2 (en) Method and system of identifying an entity from a digital image of a physical text
US10037365B2 (en) Computer-implemented patent searching method in connection to matching degree
US20120317141A1 (en) System and method for ordering of semantic sub-keys
JP6534767B1 (ja) データベース作成装置及び検索システム
US9875298B2 (en) Automatic generation of a search query
US20170242851A1 (en) Non-transitory computer readable medium, information search apparatus, and information search method
US20090063464A1 (en) System and method for visualizing and relevance tuning search engine ranking functions
KR101850853B1 (ko) 빅데이터를 이용한 검색 방법 및 장치
JP2017117021A (ja) キーワード抽出装置、コンテンツ生成システム、キーワード抽出方法、およびプログラム
WO2023073777A1 (ja) 情報処理システム、情報処理方法及びプログラム
JP6433270B2 (ja) コンテンツ検索結果提供システム及びコンテンツ検索結果提供方法
JP2005063428A (ja) 情報表示装置、方法及びプログラム
US8719275B1 (en) Color coded radars
US20120317103A1 (en) Ranking data utilizing multiple semantic keys in a search query
JP6894875B2 (ja) ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム。
CN111597787A (zh) 一种试题生成的方法和系统

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 2023525619

Country of ref document: JP

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21962327

Country of ref document: EP

Kind code of ref document: A1