WO2015097881A1 - カテゴリ名抽出装置、カテゴリ名抽出方法及びカテゴリ名抽出プログラム - Google Patents

カテゴリ名抽出装置、カテゴリ名抽出方法及びカテゴリ名抽出プログラム Download PDF

Info

Publication number
WO2015097881A1
WO2015097881A1 PCT/JP2013/085166 JP2013085166W WO2015097881A1 WO 2015097881 A1 WO2015097881 A1 WO 2015097881A1 JP 2013085166 W JP2013085166 W JP 2013085166W WO 2015097881 A1 WO2015097881 A1 WO 2015097881A1
Authority
WO
WIPO (PCT)
Prior art keywords
category
categories
category name
product
phrase
Prior art date
Application number
PCT/JP2013/085166
Other languages
English (en)
French (fr)
Inventor
容朱 鄭
Original Assignee
楽天株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 楽天株式会社 filed Critical 楽天株式会社
Priority to PCT/JP2013/085166 priority Critical patent/WO2015097881A1/ja
Priority to EP13900381.8A priority patent/EP3089096A4/en
Priority to JP2014510593A priority patent/JP5530047B1/ja
Priority to US14/758,318 priority patent/US10621208B2/en
Publication of WO2015097881A1 publication Critical patent/WO2015097881A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation
    • G06Q30/0625Directed, with specific intent or strategy

Definitions

  • One aspect of the present invention relates to a category name extraction device, a category name extraction method, and a category name extraction program.
  • the scene where the category name needs to be maintained is not limited to the electronic commerce site. For example, those that have been categorized by a person, such as classification of services and categorical search sites, need to be maintained later.
  • an object of one aspect of the present invention is to reduce the time and labor required for maintenance of category names for classifying item information relating to items such as products.
  • a category name extraction device includes a plurality of item information items belonging to each of a plurality of categories having a parallel relationship, and the name of the category to which each item information item belongs.
  • a means for identifying a phrase common to a plurality of item information belonging to at least a plurality of different categories as a reference word and a phrase included in the item information belonging to any of the plurality of categories That extracts words / phrases that have a modified or modified relationship with the reference word / phrase and that are not names of a plurality of categories as category name candidates, and output means that outputs the category name candidates extracted by the extracting means And comprising.
  • a category name extraction method is a category name extraction method in a category name extraction apparatus, and is included in a plurality of item information belonging to each of a plurality of categories in parallel relation, and each item information
  • An extraction step that extracts words / phrases that are included in the word / phrase included in the information in a relationship that is modified or modified with a reference word / phrase and that is not a name of a plurality of categories, and a candidate category name extracted in the extraction step Output step.
  • a category name extraction program is included in a plurality of item information items belonging to each of a plurality of categories having a parallel relationship in a computer, and the name of the category to which each item information item belongs and modification or modification A specific function that identifies, as a reference word, a phrase that is common to a plurality of item information belonging to at least a plurality of different categories, and a reference word and phrase that is included in item information belonging to one of a plurality of categories Or, an extraction function for extracting a phrase that is included in a qualified relationship and is not a name of a plurality of categories as a category name candidate, and an output function for outputting the category name candidate extracted by the extraction function are realized. .
  • the phrase that is included in the item information belonging to a plurality of categories with a relationship between the name of the category to which the item information belongs and the modification or the modification, and is included in common in the item information of the plurality of different categories Is identified as a reference phrase. Then, in the item information belonging to a plurality of categories, a phrase that is included in the relationship of the reference phrase with a modification or modification is extracted and output as a category name candidate. As a result, a feature of an item belonging to the same hierarchy as a plurality of categories is expressed, and a word / phrase suitable for classifying the item is output, so that it is possible to reduce the time and effort required for maintenance such as setting a category name.
  • the extracting means includes a phrase that is included in the item information belonging to a plurality of categories with a relationship with a reference word or phrase, or in a plurality of item information belonging to a plurality of categories. It is good also as excluding the phrase included more than predetermined frequency from a category name candidate.
  • the word or phrase included in a plurality of item information belonging to a plurality of categories at a predetermined frequency or more. Is not a feature unique to the item, but is likely to be a phrase representing a feature common to a plurality of categories in general, and is not appropriate for a category name. According to the above aspect, it is possible to prevent a word or phrase that is not appropriate for a category name from being output as a category name candidate.
  • the category name extraction apparatus may further include setting means for setting the category name candidate as a category having a parallel relationship with a plurality of categories.
  • the word / phrase output as the category name candidate is set as the category, it is possible to reduce the time and labor required for setting the category.
  • the setting means has a predetermined condition that the magnitude relationship between the number of searches for each category name in the plurality of categories and the number of searches for the phrase of the category name candidate in the item information belonging to the plurality of categories.
  • the category name candidate may be set as a category having a parallel relationship with a plurality of categories.
  • the category name candidate when a category name candidate word is set as a category, the category name candidate is set as a category when the number of items belonging to the category satisfies a predetermined condition.
  • the category name candidate is set as a category when the number of items belonging to the category satisfies a predetermined condition.
  • the setting means adds the category name of one category of the plurality of categories to a set of search results based on the phrase of the category name candidate in the item information belonging to the plurality of categories.
  • category name candidates may be set as categories instead of one category.
  • the category candidate phrases are more commonly used to represent the category than the existing category names. There is a high probability of becoming. According to the above aspect, a phrase that is more general as a phrase representing a category is set as a category, so that a category configuration suitable for searching for an item is realized.
  • the setting unit includes, in the item information belonging to a plurality of categories, a predetermined description indicating a relationship between the category name of one category of the plurality of categories and the category name candidate. If included, a category name candidate may be set as a category instead of one category.
  • the category name candidate is set as the category when the item information includes a description indicating the relationship between the existing category name and the category name candidate. Therefore, an appropriate phrase as the category name is set as a new category in place of the existing category.
  • the plurality of categories are categories for classifying at least one of the products and services provided by the store of the electronic commerce site, and the item information is information on the products or services.
  • the product is based on the number of times the product or service is purchased based on the search by the phrase of the category name candidate in the product information belonging to a plurality of categories and the product based on the search of each category name of the plurality of categories.
  • the category name candidate may be set as a category having a parallel relationship with a plurality of categories.
  • the plurality of categories are categories for classifying at least one of the products and services provided by the store of the electronic commerce site, and the item information is information on the products or services.
  • the setting means includes a set of stores that sell products or services belonging to a plurality of categories and a set of stores that sell products or services that include the category name candidate phrase in the product information.
  • a category name candidate may be set as a category.
  • the category name candidate for classifying products sold by the same store as the store selling the products belonging to the existing category is set as the category, so that it has a parallel relationship with the existing category.
  • An appropriate category name candidate can be set as a category as a category or a category in place of an existing category.
  • the plurality of categories are categories for classifying at least one of the products and services provided by the store of the electronic commerce site, and the item information is information on the products or services.
  • the product information is a product or service that includes in the product information a set of products or services sold by stores that sell products or services that belong to multiple categories, and a category name candidate phrase.
  • the category name candidate may be set as a category when the set of products or services sold by the store that sells the item matches a predetermined degree or more.
  • category name candidates that are classified as products sold by stores that sell products similar to those sold by stores that sell products that belong to existing categories are set as categories. Therefore, a category name candidate suitable as a category having a parallel relationship with the existing category or a category replacing the existing category can be set as the category.
  • the plurality of categories are categories for classifying at least one of the products and services provided by the store of the electronic commerce site, and the item information is information on the products or services.
  • the product information is the price range of products or services belonging to multiple categories and the price range of products or services that contain category name candidate phrases in the product information match more than a predetermined level.
  • category name candidates may be set as categories.
  • category name candidates in which products in the price range similar to the price range of products belonging to the existing category are classified are set as categories, the category or the existing category in parallel relation with the existing category is set.
  • Candidate category names suitable as alternative categories can be set as categories.
  • the plurality of categories are categories for classifying at least one of the products and services provided by the store of the electronic commerce site, and the item information is information on the products or services.
  • the setting means may set the category name candidate as the category when the variance of the price of the product or service including the phrase of the category name candidate in the product information is equal to or less than a predetermined value.
  • category name candidates that generally classify similar products when set as a category are set as categories, so that they are appropriate as categories that are parallel to existing categories or as alternatives to existing categories.
  • Candidate category names can be set as categories.
  • the plurality of categories are categories for classifying at least one of the products and services provided by the store of the electronic commerce site, and the item information is information on the products or services.
  • the category name candidate is set as a new category by the setting means
  • the product or the item including the phrase of the category name candidate in the product information or the terminal of the store selling the service Registration that changes inquiry category urging to change the category to which the service belongs to a newly set category, and changes the category of the product or the service in response to an answer from the terminal of the store in response to the transmission of the inquiry information Means may be further provided.
  • the products sold by each store can be appropriately reclassified into a newly set category.
  • FIG. 1 It is a figure which shows the structure of the system containing a category name extraction apparatus. It is a block diagram which shows the function structure of a category name extraction apparatus. It is a figure which shows the hardware constitutions of a category name extraction apparatus. It is a figure which shows typically the example of the category information memorize
  • FIG. 1 is a diagram showing a configuration of a category name extraction system 100 including a category name extraction apparatus 1 according to the present embodiment.
  • the category name extraction system 100 includes a category name extraction device 1, a user terminal T, and a store terminal D.
  • the category name extraction device 1, the store terminal D, and the user terminal T are connected to each other via a network N such as the Internet.
  • the store terminal D is a terminal of a store that sells products on the electronic commerce site.
  • the user terminal T is a terminal held by a user who purchases a product at the electronic commerce site.
  • the apparatus which comprises the shop terminal D and the user terminal T is not limited, For example, a stationary or portable personal computer may be sufficient, and portable terminals, such as a highly functional mobile phone (smart phone), a mobile phone, a personal digital assistant (PDA) But you can.
  • portable terminals such as a highly functional mobile phone (smart phone), a mobile phone, a personal digital assistant (PDA) But you can.
  • FIG. 2 is a block diagram showing a functional configuration of the category name extraction apparatus 1 according to the present embodiment.
  • the category name extraction device 1 is a device that automatically extracts and outputs category name candidate phrases for classifying products on an electronic commerce site.
  • the category name extraction apparatus 1 according to the present embodiment functionally includes a specifying unit 11 (specifying unit), an extracting unit 12 (extracting unit), an output unit 13 (output unit), and a setting unit 14. (Setting means) and a registration unit 15 (registration means).
  • Each function unit of the category name extraction device 1 can access the product information storage unit 21 and the product category information storage unit 22.
  • the category name extraction apparatus 1 of the present embodiment can be applied to a category name that is manually set in addition to extraction of category name candidates in a category-type search site or the like.
  • FIG. 3 is a hardware configuration diagram of the category name extraction apparatus 1.
  • the category name extracting device 1 is physically composed of a CPU 101, a main storage device 102 constituted by a memory such as a RAM and a ROM, an auxiliary storage device 103 constituted by a hard disk, a network card, and the like.
  • the computer system includes a communication control device 104 configured, an input device 105 such as a keyboard and mouse as input devices, an output device 106 such as a display, and the like.
  • Each function shown in FIG. 2 performs communication control under the control of the CPU 101 by loading predetermined computer software (category name extraction program) on the hardware such as the CPU 101 and the main storage device 102 shown in FIG. This is realized by operating the device 104, the input device 105, and the output device 106, and reading and writing data in the main storage device 102 and the auxiliary storage device 103. Data and databases necessary for processing are stored in the main storage device 102 and the auxiliary storage device 103.
  • predetermined computer software category name extraction program
  • the product information storage unit 21 is a storage unit that stores product information (item information) of a product (item) sold on the electronic commerce site to which the category name extraction device 1 belongs.
  • the product information includes at least words related to the product.
  • the product information includes a product description, a phrase indicating the product attribute, and the like.
  • the product information includes information on the category to which the product belongs as an attribute.
  • the product category information storage unit 22 is a storage unit that stores category information related to categories for classifying products provided by stores of the electronic commerce site.
  • FIG. 4 is a diagram schematically illustrating an example of category information stored in the product category information storage unit 22.
  • the category information has, for example, a tree structure (or hierarchical structure).
  • the category “oil” is set below the category “skin care”.
  • categories such as “jojoba”, “squalane”, and “others” are set in a lower hierarchy of the category “oil”. “Johovah”, “Squalane”, and “Others” belong to the same hierarchy and are in a parallel relationship.
  • FIG. 4 is a diagram schematically illustrating an example of category information stored in the product category information storage unit 22.
  • the category information has, for example, a tree structure (or hierarchical structure).
  • the category “oil” is set below the category “skin care”.
  • categories such as “jojoba”, “squalane”, and “others” are set in
  • the category “rice” is set below the category “food”.
  • categories such as “Koshihikari”, “Akitakomachi”, and “Chiba 28” are set in the lower hierarchy of the category “rice”. “Koshihikari”, “Akitakomachi”, and “Chiba 28” belong to the same hierarchy and are in a parallel relationship.
  • the specifying unit 11 is a part for specifying a reference word / phrase for extracting category name candidates.
  • the specifying unit 11 includes a plurality of product information (item information) belonging to each of a plurality of categories that are in a parallel relationship, and a phrase that is included in a relationship between the name of the category to which each product information belongs and a modification or a modification. Then, a phrase that is included in common in a plurality of product information belonging to at least a plurality of different categories is specified as a reference phrase.
  • FIG. 5 is a diagram schematically illustrating an example of product information.
  • Product information M 1 shown in FIG. 5A belongs to the category “jojoba” and includes phrases such as “jojoba oil” and “face-washing oil”.
  • Product information M 2 shown in FIG. 5 (b) belongs to a category “squalane” includes phrases such as "squalane oil”, "face washing oil”.
  • Product information M 3 shown in FIG. 5 (c) belong to the category "others” includes terms such "Argan oil”.
  • Identification unit 11 from the product information M 1 belonging to the category "Jojoba”, acquires the phrase "Jojoba oil” including a category name "Jojoba”, from the product information M 2 belonging to the category "squalane”, categories
  • the phrase “squalane oil” including the name “squalane” is acquired. That is, the specifying unit 11 acquires “jojoba oil” and “squalane oil” as words that are included in a plurality of product information belonging to each of a plurality of categories and that include a category name to which the product information belongs. Since the product information M 3 does not include a phrase including the category name “others”, the specifying unit 11 does not acquire a phrase for specifying the reference phrase from the product information M 3 .
  • the specifying unit 11 extracts “oil”, which is a phrase that is included in common and modified by “jojoba” and “squalane” in the acquired phrases “jojoba oil” and “squalane oil”. Then, the specifying unit 11 specifies the extracted word “oil” as a reference word.
  • the extraction unit 12 is a part that extracts, as a category name candidate, a phrase that is included in the phrase included in the product information (item information) belonging to any of a plurality of categories with a relationship of the reference phrase with the modification or modification. With reference to FIG. 5, the extraction of category name candidates will be described in detail.
  • the extraction unit 12 uses the category name among the phrases “jojoba”, “face wash”, “squalane”, and “argan” that modify the reference phrase “oil” in the product information M 1 , M 2 , and M 3 . Extract “face wash” and “Argan” as category name candidates.
  • the extracting unit 12 extracts the category name candidate with reference to the product information stored in the product information storage unit 21 referred to by the specifying unit 11 for specifying the reference phrase.
  • the category name candidates may be extracted by referring to a product information group different from the product information group referred to by FIG.
  • the extraction unit 12 may exclude words included in the plurality of product information M 1 , M 2 , and M 3 from the category name candidates that are included at a predetermined frequency or more together with the reference word / phrase. Specifically, for example, when the predetermined frequency is 2, the extraction unit 12 extracts two phrases “face wash” in the product information M 1 , M 2 , M 3 , and therefore “face wash”. Is excluded from the category name candidates. That is, based on the product information example shown in FIG. 5, the extraction unit 12 extracts a phrase such as “Argan” as a category name candidate. As a result, it is possible to prevent a word or phrase that is not appropriate for a category name from being output as a category name candidate.
  • the output unit 13 is a part that outputs the category name candidates extracted by the extraction unit 12. Specifically, the output unit 13 outputs “Argan” which is a phrase of a category name candidate. Examples of output include display output for presentation to the manager of the commercial transaction management site, output to a predetermined storage means, and the like. Further, the output unit 13 may output category name candidates to the setting unit 14 for setting as a category.
  • the setting unit 14 is a part for setting the category name candidate output by the output unit 13 as a category.
  • the category setting will be specifically described with reference to FIGS.
  • FIG. 6 is category information stored in the product category information storage unit 22 and is a diagram schematically illustrating the category information after the change in FIG. As illustrated in FIG. 6, the setting unit 14 sets a new category “Argan” that is in parallel with “jojoba” and “squalane”.
  • the setting unit 14 is not an essential configuration for the present invention.
  • FIG. 7 is a diagram schematically illustrating an example of product information.
  • FIG. 8 is category information stored in the product category information storage unit 22 and is a diagram schematically showing the category information after the change in FIG. 4B.
  • Each piece of product information shown in FIG. 7 belongs to one of the categories shown in FIG.
  • Product information M 4 shown in FIG. 7 (a) belongs to the category "Koshihikari", including the phrase "Niigata Koshihikari”.
  • the product information M 5 shown in FIG. 7B belongs to the category “Akitakomachi” and includes the phrase “Akitamachi from Akita”.
  • the merchandise information M 7 shown in FIG. 7D belongs to the category “Chiba 28” and includes the phrase “Fusakogane (old name: Chiba 28)”.
  • Specific unit 11 from the product information M 4 belonging to the category "Koshihikari”, acquires the phrase "Niigata Koshihikari” which includes a category name "Koshihikari”, from the product information M 5 belonging to the category "Akitakomachi” Acquire the phrase “Akitamachi from Akita”, which includes the category name “Akitakomachi”.
  • the specifying unit 11 acquires “Niigata Koshihikari” and “Akita Akitakomachi” as terms that are included in a plurality of product information belonging to each of a plurality of categories and include the category name to which the product information belongs. To do.
  • the specifying unit 11 does not acquire a phrase for specifying the reference phrase from the product information M 6 . Further, the specifying unit 11 may acquire the phrase “Fusakogane (old name: Chiba 28)” including the category name “Chiba 28”. Then, the identifying unit 11 includes “(place name) which is a phrase that modifies the phrase of the category name in the acquired phrases“ Koshihikari from Niigata ”,“ Akitamachi from Akita ”, and“ Fusakogane (former name: Chiba 28) ”. ) "Produce”. Then, since the phrase “(place name) product” is included in the product information of a plurality of categories in common, the specifying unit 11 specifies the extracted phrase “(place name) product” as the reference phrase.
  • the extraction unit 12 has already set as a category name among the phrases “Koshihikari”, “Akitakomachi”, and “Fusakogane” that are qualified with the reference phrase “product of (place name)” in the product information M 4 , M 5 , M 6 “Fusakogane”, which is not a phrase that has been set, is extracted as a category name candidate.
  • the output unit 13 outputs “Fusakogane” which is a phrase of the category name candidate.
  • the output unit 13 outputs these category name candidates to the setting unit 14 for setting as a category.
  • Category name candidates may be set as categories. Specifically, a format such as “(existing category name) (old name: (category name candidate))” is preset as a predetermined description in order to set a category name candidate phrase as a new category instead of the existing category. If the description such as “Fusakogane (old name: Chiba 28)” is extracted from the product information M 7 , the setting unit 14 replaces the category name “Chiba 28” (FIG. 4B). )), As shown in FIG. 8, the category name candidate “Fusakogane” is set as a new category. Thereby, an appropriate phrase as the category name is set as a new category in place of the existing category.
  • the setting unit 14 searches the number of searches for each category name of a plurality of categories and the search for a phrase of a category name candidate in the product information belonging to a plurality of categories to which the product information referred to in the extraction of the reference word / phrase is found.
  • the category name candidate may be set as a category having a parallel relation with a plurality of categories.
  • the category name candidate is determined based on the minimum number of searches by the search based on phrases such as “jojoba” and “squalane”.
  • the setting unit 14 sets “Argan” as a category under “Oil”, assuming that the predetermined condition is satisfied when the number of searches based on the phrase “Argan” is large. As a result, it is possible to set a category with an appropriate phrase as a new category name.
  • the number of searches for searching for the category name and the category name candidate phrase in the product information can be acquired by, for example, the setting unit 14 referring to and searching the product information storage unit 21 based on each phrase.
  • the setting unit 14 includes the number of times that a product is purchased based on a search based on a phrase of a category name candidate in the product information belonging to a plurality of categories to which the product information referred to in the extraction of the reference word and the category names of the plurality of categories.
  • the category name candidate may be set as a category having a parallel relationship with a plurality of categories.
  • a search using phrases such as “jojoba” and “squalane” representing categories provided under “oil” in the category configuration of FIG.
  • the unit 14 Based on the result of, set a condition that satisfies the specified condition when the number of purchases is greater than the minimum number of purchases based on the result of a search for terms such as “Argan”
  • the unit 14 sets “Argan” as a category under “Oil”.
  • a category with an appropriate phrase As a result, it is possible to set a category with an appropriate phrase as a new category name.
  • the number of times that a product is purchased based on a search result using a specific phrase can be obtained by referring to a database storing an access log, a product purchase history, and the like at the electronic commerce site to which the category name extraction device 1 belongs.
  • the setting unit 14 adds the category name of one category among the plurality of categories to a set of search results based on the category name candidate phrases in the product information belonging to the plurality of categories to which the product information referred to in the extraction of the reference phrase belongs.
  • category name candidates may be set as categories instead of one category. Specifically, for example, in the category configuration of FIG.
  • the setting unit 14 is a set of stores selling products belonging to a plurality of categories to which the product information referred to in the extraction of the reference word / phrase is extracted, and stores selling products including the word / phrase of category name candidates in the product information
  • the category name candidate may be set as a category when the set matches a predetermined degree or more. Specifically, for example, at the electronic commerce site to which the category name extraction device 1 belongs, the products belonging to the categories “Koshihikari” and “Akitakomachi” provided under “rice” in the category configuration of FIG.
  • a list of stores that sell specific products is, for example, a database (for example, product information storage unit 21) that stores product information sold by each store in the electronic commerce site to which the category name extraction device 1 belongs. Is obtained by referring to.
  • the setting unit 14 includes, in the product information, a set of products sold by a store that sells products that belong to a plurality of categories to which the product information referred to in the extraction of the reference word / phrase is included, and a category name candidate word / phrase.
  • the category name candidate may be set as a category when the set of products sold by the store that sells the item matches a predetermined degree or more. Specifically, for example, at the electronic commerce site to which the category name extraction device 1 belongs, the products belonging to the categories “Koshihikari” and “Akitakomachi” provided under “rice” in the category configuration of FIG.
  • the setting unit 14 sets “Fusakogane” as a category under “rice”.
  • a list of products sold by a store selling a specific product is, for example, a database (for example, a database storing product information sold by each store on the electronic commerce site to which the category name extraction device 1 belongs). It is obtained by referring to the merchandise information storage unit 21). Similarity between product sets can be calculated by a well-known analysis technique.
  • the setting unit 14 matches the price range of the product belonging to the plurality of categories to which the product information referred to in the extraction of the reference word and the price range of the product including the category name candidate word / phrase in the product information more than a predetermined degree.
  • the category name candidate may be set as a category. Specifically, for example, in the electronic commerce site to which the category name extraction device 1 belongs, in the category configuration of FIG.
  • the setting unit 14 sets “Fusakogane” as a category under “rice”. Set as.
  • For the price range of a specific product for example, by referring to a database (for example, product information storage unit 21) that stores product information sold by each store in the electronic commerce site to which the category name extraction device 1 belongs. can get.
  • the degree of matching of price ranges can be calculated by a well-known analysis technique.
  • the setting unit 14 may set the category name candidate as the category when the variance of the price of the product including the phrase of the category name candidate in the product information is equal to or less than a predetermined value. Specifically, for example, in the electronic commerce site to which the category name extraction apparatus 1 belongs, the setting unit 14 when the variance of the price of the product including the category name candidate “Fusakogane” in the product information is equal to or less than a predetermined value. Sets “Fusakogane” as a category under “rice”.
  • the distribution of the price of a specific product is well-known by referring to a database (for example, product information storage unit 21) storing product information sold by each store in the electronic commerce site to which the category name extraction device 1 belongs. It can be calculated by using the statistical method.
  • the registration unit 15 stores stores that sell products that include the category name candidate words in the product information.
  • inquiry information that prompts the terminal D to change the category to which the product belongs to a newly set category, and changing the category of the product in response to an answer from the store terminal D in response to the transmission of the inquiry information is there.
  • the registration unit 15 extracts product information including “Argan” from the product information storage unit 21. Then, the registration unit 15 transmits inquiry information that prompts the user to change the category to which the product belongs to a newly set category to the store terminal D of the store that sells the product with the extracted product information.
  • FIG. 9 is a diagram illustrating an example of an inquiry information display screen. As shown in FIG. 9, the inquiry information includes a product list of product information including “Argan”, a message for prompting a category change, an operation unit for accepting the category change, and the like.
  • the shop terminal D checks the check box of the product whose category is to be changed in the display screen example shown in FIG. 9 and operates the button displayed as “Re-register”, the product of the checked product is displayed.
  • An answer to the effect of changing the category is returned from the store terminal D to the registration unit 15.
  • the registration part 15 changes the category of the goods to which the check box was attached
  • FIG. The change of the category is realized by rewriting the attribute of the product information of the product stored in the product information storage unit 21. As a result, the products sold by each store can be appropriately reclassified into the newly set category.
  • FIG. 10 is a flowchart showing an example of processing contents of the category name extraction method in the category name extraction apparatus 1 shown in FIG.
  • the specifying unit 11 acquires a plurality of pieces of product information belonging to each of a plurality of categories having a parallel relationship (S1). Next, the specifying unit 11 acquires a phrase that is included in the phrase included in the acquired merchandise information together with a category name of the category to which the merchandise information belongs and a modification or modification (S2).
  • the specifying unit 11 specifies the phrase that is acquired in step S2 and is commonly included in the product information belonging to each of the plurality of categories as the reference phrase (S3).
  • the extraction unit 12 uses, as a category name candidate, a word that is included in the product information belonging to one of a plurality of categories together with a reference word or phrase that has a modification or modification relationship and is not set as a category name. Extract (S4). Then, the output unit 13 outputs the category name candidates extracted by the extraction unit 12 (S5).
  • the category name extraction program 1p includes a main module 10m, a specific module 11m, an extraction module 12m, an output module 13m, a setting module 14m, and a registration module 15m.
  • the main module 10m is a part that comprehensively controls the category name extraction process.
  • the functions realized by executing the identification module 11m, the extraction module 12m, the output module 13m, the setting module 14m, and the registration module 15m are respectively the identification unit 11, the extraction unit 12, and the category name extraction device 1 shown in FIG.
  • the functions of the output unit 13, the setting unit 14, and the registration unit 15 are the same.
  • the category name extraction program 1p is provided by a storage medium 1d such as a CD-ROM or a DVD-ROM or a semiconductor memory, for example.
  • the category name extraction program 1p may be provided via a communication network as a computer data signal superimposed on a carrier wave.
  • the category name to which the product information belongs to the word / phrase included in the product information belonging to a plurality of categories is qualified or covered. Phrases that are included in a modification relationship and that are commonly included in product information of a plurality of different categories are specified as reference phrases. Then, in the product information belonging to a plurality of categories, phrases included in the relationship between the reference phrase and the modification or modification are extracted and output as category name candidates. As a result, the characteristics of the products belonging to the same hierarchy as the plurality of categories are expressed, and words suitable for classifying the products are output, so that it is possible to reduce the time and effort required for maintenance such as setting category names.

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

 カテゴリ名抽出装置は、並列関係にある複数のカテゴリのそれぞれに属する複数のアイテム情報に含まれており、各アイテム情報が属するカテゴリの名称と修飾又は被修飾の関係をもっており、少なくとも複数の異なるカテゴリに属する複数のアイテム情報に共通する語句を、基準語句として特定する特定手段と、複数のカテゴリのいずれかに属するアイテム情報に含まれる語句に基準語句と修飾又は被修飾の関係をもって含まれる語句であって複数のカテゴリの名称ではない語句をカテゴリ名候補として抽出する抽出手段と、抽出手段により抽出されたカテゴリ名候補を出力する出力手段と、を備える。

Description

カテゴリ名抽出装置、カテゴリ名抽出方法及びカテゴリ名抽出プログラム
 本発明の一側面は、カテゴリ名抽出装置、カテゴリ名抽出方法及びカテゴリ名抽出プログラムに関する。
 商品及びサービスを販売する電子商取引サイトでは、商品購入者及び販売者の便宜のために、商品等はカテゴリに分類されることが多い。例えば、複数の階層からなる製品カテゴリに製品を分類する技術が知られている(例えば、特許文献1参照)。
特表2007-505422号公報
 既存のカテゴリに分類すべきではない新たな商品が現れた場合及びカテゴリ名として設定されていた名称より他の名称の方がカテゴリ名として一般的となった場合等において、電子商取引サイトにおけるカテゴリ名をメンテナンスする必要が生じる。従来、このメンテナンスは人手により行われており、手間がかかっていた。なお、カテゴリ名のメンテナンスする必要が生じる場面は電子商取引サイトに限らない。例えば、役務の分類、カテゴリ型検索サイト等、人によってカテゴリ分けが行われたものは、後にメンテナンスする必要が生じる。
 そこで本発明の一側面は、商品等のアイテムに関するアイテム情報を分類するためのカテゴリの名称のメンテナンスにかかる手間を低減することを目的とする。
 上記課題を解決するために、本発明の一側面に係るカテゴリ名抽出装置は、並列関係にある複数のカテゴリのそれぞれに属する複数のアイテム情報に含まれており、各アイテム情報が属するカテゴリの名称と修飾又は被修飾の関係をもっており、少なくとも複数の異なるカテゴリに属する複数のアイテム情報に共通する語句を、基準語句として特定する特定手段と、複数のカテゴリのいずれかに属するアイテム情報に含まれる語句に基準語句と修飾又は被修飾の関係をもって含まれる語句であって複数のカテゴリの名称ではない語句をカテゴリ名候補として抽出する抽出手段と、抽出手段により抽出されたカテゴリ名候補を出力する出力手段と、を備える。
 本発明の一側面に係るカテゴリ名抽出方法は、カテゴリ名抽出装置におけるカテゴリ名抽出方法であって、並列関係にある複数のカテゴリのそれぞれに属する複数のアイテム情報に含まれており、各アイテム情報が属するカテゴリの名称と修飾又は被修飾の関係をもっており、少なくとも複数の異なるカテゴリに属する複数のアイテム情報に共通する語句を、基準語句として特定する特定ステップと、複数のカテゴリのいずれかに属するアイテム情報に含まれる語句に基準語句と修飾又は被修飾の関係をもって含まれる語句であって複数のカテゴリの名称ではない語句をカテゴリ名候補として抽出する抽出ステップと、抽出ステップにおいて抽出されたカテゴリ名候補を出力する出力ステップと、を有する。
 本発明の一側面に係るカテゴリ名抽出プログラムは、コンピュータに、並列関係にある複数のカテゴリのそれぞれに属する複数のアイテム情報に含まれており、各アイテム情報が属するカテゴリの名称と修飾又は被修飾の関係をもっており、少なくとも複数の異なるカテゴリに属する複数のアイテム情報に共通する語句を、基準語句として特定する特定機能と、複数のカテゴリのいずれかに属するアイテム情報に含まれる語句に基準語句と修飾又は被修飾の関係をもって含まれる語句であって複数のカテゴリの名称ではない語句をカテゴリ名候補として抽出する抽出機能と、抽出機能により抽出されたカテゴリ名候補を出力する出力機能と、を実現させる。
 上記側面によれば、複数のカテゴリに属するアイテム情報にアイテム情報が属するカテゴリの名称と修飾又は被修飾の関係をもって含まれる語句であって、複数の異なるカテゴリのアイテム情報に共通して含まれる語句が基準語句として特定される。そして、複数のカテゴリに属するアイテム情報において、基準語句と修飾又は被修飾の関係をもって含まれる語句がカテゴリ名候補として抽出及び出力される。これにより、複数のカテゴリと同じ階層に属するアイテムの特徴を表し、そのアイテムを分類するのに適切な語句が出力されるので、カテゴリ名の設定等のメンテナンスにかかる手間の低減が可能となる。
 別の側面に係るカテゴリ名抽出装置では、抽出手段は、複数のカテゴリに属するアイテム情報に基準語句と修飾又は被修飾の関係をもって含まれる語句であって、複数のカテゴリに属する複数のアイテム情報において所定の頻度以上で含まれる語句をカテゴリ名候補から除外することとしてもよい。
 上記側面によれば、複数のカテゴリに属するアイテム情報において基準語句と修飾又は被修飾の関係をもって含まれる語句であっても、複数のカテゴリに属する複数のアイテム情報において所定の頻度以上で含まれる語句は、そのアイテムに固有の特徴ではなく、複数のカテゴリの全般に共通する特徴を表す語句である蓋然性が高く、カテゴリ名とするには適切ではない。上記側面によれば、そのようなカテゴリ名とするのに適切でない語句がカテゴリ名候補として出力されることを防止できる。
 さらに別の側面に係るカテゴリ名抽出装置は、カテゴリ名候補を複数のカテゴリと並列関係となるカテゴリとして設定する設定手段を更に備えることとしてもよい。
 上記側面によれば、カテゴリ名候補として出力された語句がカテゴリとして設定されるので、カテゴリの設定にかかる手間を低減できる。
 別の側面に係るカテゴリ名抽出装置では、設定手段は、複数のカテゴリに属するアイテム情報における、複数のカテゴリの各カテゴリ名の検索数とカテゴリ名候補の語句の検索数との大小関係が所定条件を満たす場合に、カテゴリ名候補を複数のカテゴリと並列関係となるカテゴリとして設定することとしてもよい。
 この側面によれば、カテゴリ名候補の語句がカテゴリとして設定された場合に、そのカテゴリに属することとなるアイテムの数が所定の条件を満たす場合に、そのカテゴリ名候補がカテゴリとして設定されるので、新たなカテゴリ名として適切な語句によるカテゴリの設定が可能となる。
 さらに別の側面に係るカテゴリ名抽出装置では、設定手段は、複数のカテゴリに属するアイテム情報における、カテゴリ名候補の語句による検索結果の集合に、複数のカテゴリのうちの一のカテゴリのカテゴリ名の語句による検索結果の集合が所定程度以上含まれる場合に、一のカテゴリに代えてカテゴリ名候補をカテゴリとして設定することとしてもよい。
 カテゴリ名候補の語句による検索結果の集合に、既存のカテゴリ名の語句による検索結果の集合が所定程度以上含まれる場合は、既存カテゴリ名よりカテゴリ候補の語句の方が当該カテゴリを表す語句として一般的になっている蓋然性が高い。上記側面によれば、カテゴリを表す語句としてより一般的となっている語句がカテゴリとして設定されるので、アイテムの探索に好適なカテゴリ構成が実現される。
 さらに別の側面に係るカテゴリ名抽出装置では、設定手段は、複数のカテゴリに属するアイテム情報に、複数のカテゴリのうちの一のカテゴリのカテゴリ名とカテゴリ名候補との関係を示す所定の記載が含まれる場合に、一のカテゴリに代えてカテゴリ名候補をカテゴリとして設定することとしてもよい。
 上記側面によれば、既存のカテゴリ名とカテゴリ名候補との関係を示す記載がアイテム情報に含まれる場合にカテゴリ名候補がカテゴリとして設定される。従って、カテゴリ名として適切な語句が新たなカテゴリとして既存のカテゴリに代えて設定される。
 さらに別の側面に係るカテゴリ名抽出装置では、複数のカテゴリは、電子商取引サイトの店舗が提供する商品及び役務の少なくとも1つを分類するためのカテゴリであり、アイテム情報は、商品または役務に関する情報である商品情報であり、設定手段は、複数のカテゴリに属する商品情報における、カテゴリ名候補の語句による検索に基づき商品または役務が購入された回数と複数のカテゴリの各カテゴリ名の検索に基づき商品または役務が購入された回数との大小関係が所定条件を満たす場合に、カテゴリ名候補を複数のカテゴリと並列関係となるカテゴリとして設定することとしてもよい。
 カテゴリ名候補の語句による検索に基づき商品が購入された回数が多い、ということは、その語句に基づき商品が探される頻度が高いことを意味する。上記側面によれば、そのような語句がカテゴリとして設定されることとなるので、商品の探索に好適なカテゴリ構成が実現される。
 さらに別の側面に係るカテゴリ名抽出装置では、複数のカテゴリは、電子商取引サイトの店舗が提供する商品及び役務の少なくとも1つを分類するためのカテゴリであり、アイテム情報は、商品または役務に関する情報である商品情報であり、設定手段は、複数のカテゴリに属する商品または役務を販売している店舗の集合と、カテゴリ名候補の語句を商品情報に含む商品または役務を販売している店舗の集合と、が所定の程度以上一致する場合に、カテゴリ名候補をカテゴリとして設定することとしてもよい。
 上記側面によれば、既存のカテゴリに属する商品を販売している店舗と同様の店舗により販売される商品が分類されるカテゴリ名候補がカテゴリとして設定されるので、既存のカテゴリと並列関係とするカテゴリ又は既存カテゴリに代わるカテゴリとして、適切なカテゴリ名候補をカテゴリとして設定できる。
 さらに別の側面に係るカテゴリ名抽出装置では、複数のカテゴリは、電子商取引サイトの店舗が提供する商品及び役務の少なくとも1つを分類するためのカテゴリであり、アイテム情報は、商品または役務に関する情報である商品情報であり、設定手段は、複数のカテゴリに属する商品または役務を販売している店舗により販売されている商品または役務の集合と、カテゴリ名候補の語句を商品情報に含む商品または役務を販売している店舗により販売されている商品または役務の集合と、が所定の程度以上一致する場合に、カテゴリ名候補をカテゴリとして設定することとしてもよい。
 上記側面によれば、既存のカテゴリに属する商品を販売している店舗が販売している商品と同様の商品を販売している店舗により販売される商品が分類されるカテゴリ名候補がカテゴリとして設定されるので、既存のカテゴリと並列関係とするカテゴリ又は既存カテゴリに代わるカテゴリとして適切なカテゴリ名候補をカテゴリとして設定できる。
 さらに別の側面に係るカテゴリ名抽出装置では、複数のカテゴリは、電子商取引サイトの店舗が提供する商品及び役務の少なくとも1つを分類するためのカテゴリであり、アイテム情報は、商品または役務に関する情報である商品情報であり、設定手段は、複数のカテゴリに属する商品または役務の価格帯と、カテゴリ名候補の語句を商品情報に含む商品または役務の価格帯と、が所定の程度以上一致する場合に、カテゴリ名候補をカテゴリとして設定することとしてもよい。
 上記側面によれば、既存のカテゴリに属する商品の価格帯と同様の価格帯の商品が分類されるカテゴリ名候補がカテゴリとして設定されるので、既存のカテゴリと並列関係とするカテゴリ又は既存カテゴリに代わるカテゴリとして適切なカテゴリ名候補をカテゴリとして設定できる。
 さらに別の側面に係るカテゴリ名抽出装置では、複数のカテゴリは、電子商取引サイトの店舗が提供する商品及び役務の少なくとも1つを分類するためのカテゴリであり、アイテム情報は、商品または役務に関する情報である商品情報であり、設定手段は、カテゴリ名候補の語句を商品情報に含む商品または役務の価格の分散が所定値以下である場合に、カテゴリ名候補をカテゴリとして設定することとしてもよい。
 上記側面によれば、カテゴリとして設定された場合に概して同様の商品が分類されるカテゴリ名候補がカテゴリとして設定されるので、既存のカテゴリと並列関係とするカテゴリ又は既存カテゴリに代わるカテゴリとして適切なカテゴリ名候補をカテゴリとして設定できる。
 さらに別の側面に係るカテゴリ名抽出装置は、複数のカテゴリは、電子商取引サイトの店舗が提供する商品及び役務の少なくとも1つを分類するためのカテゴリであり、アイテム情報は、商品または役務に関する情報である商品情報であり、設定手段によりカテゴリ名候補が新たなカテゴリとして設定される場合に、カテゴリ名候補の語句を商品情報に含む商品または役務を販売している店舗の端末に、該商品または該役務が属するカテゴリを新たに設定されるカテゴリに変更することを促す問合せ情報を送信し、該問合せ情報の送信に対する店舗の端末からの回答に応じて該商品または該役務のカテゴリを変更する登録手段を更に備えることとしてもよい。
 上記側面によれば、新たに設定されるカテゴリに各店舗が販売する商品を適切に再分類できる。
 本発明の一側面によれば、商品等のアイテムに関するアイテム情報を分類するためのカテゴリの名称のメンテナンスにかかる手間を低減することが可能となる。
カテゴリ名抽出装置を含むシステムの構成を示す図である。 カテゴリ名抽出装置の機能構成を示すブロック図である。 カテゴリ名抽出装置のハードウェア構成を示す図である。 商品カテゴリ情報記憶部22に記憶されているカテゴリ情報の例を模式的に示す図である。 商品情報の例を模式的に示す図である。 商品カテゴリ情報記憶部に記憶されているカテゴリ情報であって、図4(a)のカテゴリ情報の変更後を模式的に示す図である。 商品情報の例を模式的に示す図である。 商品カテゴリ情報記憶部に記憶されているカテゴリ情報であって、図4(b)のカテゴリ情報の変更後を模式的に示す図である。 問合せ情報の表示画面例を示す図である。 カテゴリ名抽出方法の処理内容の例を示すフローチャートである。 カテゴリ名抽出プログラムの構成を示す図である。
 以下、添付図面を参照しながら本発明の実施形態を詳細に説明する。なお、図面の説明において同一又は同等の要素には同一の符号を付し、重複する説明を省略する。
 図1は、本実施形態に係るカテゴリ名抽出装置1を含むカテゴリ名抽出システム100の構成を示す図である。図1に示すように、カテゴリ名抽出システム100は、カテゴリ名抽出装置1、ユーザ端末T及び店舗端末Dを含む。カテゴリ名抽出装置1、店舗端末D及びユーザ端末Tは互いにインターネットなどのネットワークNを介して接続されている。店舗端末Dは、電子商取引サイトにおいて商品を販売する店舗が有する端末である。ユーザ端末Tは、電子商取引サイトにおいて商品を購入するユーザが有する端末である。店舗端末D及びユーザ端末Tを構成する装置は限定されず、例えば据置型又は携帯型のパーソナルコンピュータでもよいし、高機能携帯電話機(スマートフォン)や携帯電話機、携帯情報端末(PDA)などの携帯端末でもよい。
 図2は、本実施形態に係るカテゴリ名抽出装置1の機能的構成を示すブロック図である。カテゴリ名抽出装置1は、電子商取引サイトにおいて商品を分類するためのカテゴリ名候補の語句を自動的に抽出及び出力する装置である。本実施形態のカテゴリ名抽出装置1は、図2に示すように、機能的には、特定部11(特定手段)、抽出部12(抽出手段)、出力部13(出力手段)、設定部14(設定手段)及び登録部15(登録手段)を含む。また、カテゴリ名抽出装置1の各機能部は、商品情報記憶部21及び商品カテゴリ情報記憶部22にアクセス可能である。なお、本実施形態では、電子商取引サイトの店舗が提供する商品及び役務等を分類するためのカテゴリのカテゴリ名候補の語句を抽出する場合の例で説明するが、カテゴリ名候補の語句の抽出はこの場合に限定されない。例えば、カテゴリ型検索サイト等におけるカテゴリの名称の候補の抽出の他、人手によってカテゴリ名の設定が行われていたものには、本実施形態のカテゴリ名抽出装置1を適用できる。
 図3は、カテゴリ名抽出装置1のハードウェア構成図である。カテゴリ名抽出装置1は、物理的には、図3に示すように、CPU101、RAM及びROMといったメモリにより構成される主記憶装置102、ハードディスク等で構成される補助記憶装置103、ネットワークカード等で構成される通信制御装置104、入力デバイスであるキーボード、マウス等の入力装置105、ディスプレイ等の出力装置106などを含むコンピュータシステムとして構成されている。
 図2に示した各機能は、図3に示すCPU101、主記憶装置102等のハードウェア上に所定のコンピュータソフトウェア(カテゴリ名抽出プログラム)を読み込ませることにより、CPU101の制御のもとで通信制御装置104、入力装置105、出力装置106を動作させるとともに、主記憶装置102や補助記憶装置103におけるデータの読み出し及び書き込みを行うことで実現される。処理に必要なデータやデータベースは主記憶装置102や補助記憶装置103内に格納される。
 次に、カテゴリ名抽出装置1の機能部の説明に先だって、商品情報記憶部21及び商品カテゴリ情報記憶部22を説明する。商品情報記憶部21は、カテゴリ名抽出装置1が属する電子商取引サイトで販売されている商品(アイテム)の商品情報(アイテム情報)を記憶している記憶手段である。商品情報は、当該商品に関する語句を少なくとも含む。具体的には、商品情報は、商品説明文、商品の属性を示す語句等を含む。また、商品情報は、当該商品が属するカテゴリの情報を属性として含む。
 商品カテゴリ情報記憶部22は、電子商取引サイトの店舗が提供する商品を分類するためのカテゴリに関するカテゴリ情報を記憶している記憶手段である。図4は、商品カテゴリ情報記憶部22に記憶されているカテゴリ情報の例を模式的に示す図である。図4に示すように、カテゴリ情報は、例えば、ツリー構造(又は階層構造)を有する。図4(a)に示す例では、カテゴリ「スキンケア」の下位にカテゴリ「オイル」が設定されている。また、カテゴリ「オイル」の下位階層には、「ホホバ」、「スクワラン」及び「その他」等のカテゴリが設定されている。「ホホバ」、「スクワラン」及び「その他」は、同一階層に属し、並列関係にある。図4(b)に示す例では、カテゴリ「食品」の下位にカテゴリ「米」が設定されている。また、カテゴリ「米」の下位階層には、「コシヒカリ」、「あきたこまち」及び「ちば28号」等のカテゴリが設定されている。「コシヒカリ」、「あきたこまち」及び「ちば28号」は、同一階層に属し、並列関係にある。
 続いて、カテゴリ名抽出装置1の機能部を説明する。特定部11は、カテゴリ名候補の抽出のための基準語句を特定する部分である。具体的には、特定部11は、並列関係にある複数のカテゴリのそれぞれに属する複数の商品情報(アイテム情報)に、各商品情報が属するカテゴリの名称と修飾又は被修飾の関係をもって含まれる語句であって、少なくとも複数の異なるカテゴリに属する複数の商品情報に共通して含まれる語句を基準語句として特定する。
 図5を参照して、基準語句の特定処理をより具体的に説明する。図5は、商品情報の例を模式的に示す図である。図5(a)に示す商品情報Mは、カテゴリ「ホホバ」に属し、「ホホバオイル」、「洗顔オイル」といった語句を含む。図5(b)に示す商品情報Mは、カテゴリ「スクワラン」に属し、「スクワランオイル」、「洗顔オイル」といった語句を含む。図5(c)に示す商品情報Mは、カテゴリ「その他」に属し、「アルガンオイル」といった語句を含む。
 特定部11は、カテゴリ「ホホバ」に属する商品情報Mから、カテゴリ名である「ホホバ」を含む「ホホバオイル」という語句を取得すると共に、カテゴリ「スクワラン」に属する商品情報Mから、カテゴリ名である「スクワラン」を含む「スクワランオイル」という語句を取得する。即ち、特定部11は、複数のカテゴリの各々に属する複数の商品情報に含まれる語句であって当該商品情報が属するカテゴリ名を含む語句として、「ホホバオイル」及び「スクワランオイル」を取得する。なお、商品情報Mには、カテゴリ名である「その他」を含む語句が含まれないので、特定部11は基準語句の特定のための語句を商品情報Mから取得しない。そして、特定部11は、取得した語句「ホホバオイル」及び「スクワランオイル」において「ホホバ」及び「スクワラン」に修飾され共通して含まれる語句である「オイル」を抽出する。そして、特定部11は、抽出した語句「オイル」を基準語句として特定する。
 抽出部12は、複数のカテゴリのいずれかに属する商品情報(アイテム情報)に含まれる語句に基準語句と修飾又は被修飾の関係をもって含まれる語句をカテゴリ名候補として抽出する部分である。図5を参照して、カテゴリ名候補の抽出を具体的に説明する。抽出部12は、商品情報M,M,Mにおいて基準語句「オイル」を修飾する「ホホバ」、「洗顔」、「スクワラン」、「アルガン」といった語句のうち、カテゴリの名称とされていない「洗顔」、「アルガン」をカテゴリ名候補として抽出する。なお、本実施形態では、抽出部12は、特定部11が基準語句の特定のために参照した商品情報記憶部21に記憶された商品情報を参照してカテゴリ名候補を抽出したが、特定部11が参照した商品情報群とは異なる商品情報群を参照してカテゴリ名候補を抽出してもよい。
 ここで、抽出部12は、複数の商品情報M,M,Mにおいて、基準語句と共に所定の頻度以上含まれる語句をカテゴリ名候補から除外することとしてもよい。具体的には、例えば所定の頻度を2である場合には、抽出部12は、商品情報M,M,Mにおいて、語句「洗顔」が2つ抽出されているので、「洗顔」をカテゴリ名候補から除外する。即ち、図5に示す商品情報の例に基づき、抽出部12は、「アルガン」といった語句をカテゴリ名候補として抽出する。これにより、カテゴリ名とするのに適切でない語句がカテゴリ名候補として出力されることを防止できる。
 出力部13は、抽出部12により抽出されたカテゴリ名候補を出力する部分である。具体的には、出力部13は、カテゴリ名候補の語句である「アルガン」を出力する。出力の例としては、商取引管理サイトの管理者への提示のための表示出力、所定の記憶手段への出力等が挙げられる。また、出力部13は、カテゴリとして設定するためにカテゴリ名候補を設定部14に出力してもよい。
 設定部14は、出力部13により出力されたカテゴリ名候補をカテゴリとして設定する部分である。図4(a)及び図6を参照してカテゴリの設定について具体的に説明する。図6は、商品カテゴリ情報記憶部22に記憶されているカテゴリ情報であって、図4(a)のカテゴリ情報の変更後を模式的に示す図である。設定部14は、図6に示すように、「ホホバ」、「スクワラン」と並列関係となる新たなカテゴリ「アルガン」を設定する。なお、設定部14は、本発明に必須の構成ではない。
 図7及び図8を参照して、基準語句の特定処理、カテゴリ名候補の抽出処理及びカテゴリの設定処理の他の例を具体的に説明する。図7は、商品情報の例を模式的に示す図である。図8は、商品カテゴリ情報記憶部22に記憶されているカテゴリ情報であって、図4(b)のカテゴリ情報の変更後を模式的に示す図である。図7に示される各商品情報は、図4(b)に示すカテゴリのいずれかに属するものである。図7(a)に示す商品情報Mは、カテゴリ「コシヒカリ」に属し、「新潟産コシヒカリ」という語句を含む。図7(b)に示す商品情報Mは、カテゴリ「あきたこまち」に属し、「秋田産あきたこまち」という語句を含む。図7(c)に示す商品情報Mは、カテゴリ「ちば28号」に属し、「千葉産ふさこがね」という語句を含む。図7(d)に示す商品情報Mは、カテゴリ「ちば28号」に属し、「ふさこがね(旧名称:ちば28号)」という語句を含む。
 特定部11は、カテゴリ「コシヒカリ」に属する商品情報Mから、カテゴリ名である「コシヒカリ」を含む「新潟産コシヒカリ」という語句を取得すると共に、カテゴリ「あきたこまち」に属する商品情報Mから、カテゴリ名である「あきたこまち」を含む「秋田産あきたこまち」という語句を取得する。即ち、特定部11は、複数のカテゴリの各々に属する複数の商品情報に含まれる語句であって当該商品情報が属するカテゴリ名を含む語句として、「新潟産コシヒカリ」及び「秋田産あきたこまち」を取得する。なお、商品情報Mにはカテゴリ名である「ちば28号」を含む語句が含まれないので、特定部11は基準語句の特定のための語句を商品情報Mから取得しない。また、特定部11は、カテゴリ名である「ちば28号」を含む「ふさこがね(旧名称:ちば28号)」という語句を取得してもよい。そして、特定部11は、取得した語句「新潟産コシヒカリ」、「秋田産あきたこまち」及び「ふさこがね(旧名称:ちば28号)」において、カテゴリ名の語句を修飾する語句である「(地名)産」を抽出する。そして、特定部11は、語句「(地名)産」が複数のカテゴリの商品情報に共通して含まれるので、抽出した語句「(地名)産」を基準語句として特定する。
 抽出部12は、商品情報M,M,Mにおいて基準語句「(地名)産」に修飾される語句「コシヒカリ」、「あきたこまち」、「ふさこがね」のうち、カテゴリ名として既に設定されている語句ではない「ふさこがね」をカテゴリ名候補として抽出する。
 出力部13は、カテゴリ名候補の語句である「ふさこがね」を出力する。出力部13は、カテゴリとして設定するために、これらのカテゴリ名候補を設定部14に出力する。
 設定部14は、複数のカテゴリに属する商品情報に、複数のカテゴリのうちの一のカテゴリのカテゴリ名とカテゴリ名候補との関係を示す所定の記載が含まれる場合に、一のカテゴリに代えてカテゴリ名候補をカテゴリとして設定してもよい。具体的には、既存カテゴリに代えてカテゴリ名候補の語句を新たなカテゴリとして設定するために「(既存カテゴリ名)(旧名称:(カテゴリ名候補))」といったフォーマットが所定記載として予め設定されている場合に、設定部14は、商品情報Mから、「ふさこがね(旧名称:ちば28号)」といった記載を抽出すると、カテゴリ名「ちば28号」に代えて(図4(b)参照)、図8に示すように、カテゴリ名候補の「ふさこがね」を新たなカテゴリとして設定する。これにより、カテゴリ名として適切な語句が新たなカテゴリとして既存のカテゴリに代えて設定される。
 続いて、設定部14によるカテゴリ名候補をカテゴリとして設定する設定処理のバリエーションを説明する。
 設定部14は、基準語句の抽出において参照された商品情報が属する複数のカテゴリに属する商品情報における、複数のカテゴリの各カテゴリ名が検索される検索件数とカテゴリ名候補の語句が検索される検索件数との大小関係が所定条件を満たす場合に、カテゴリ名候補を複数のカテゴリと並列関係となるカテゴリとして設定することとしてもよい。具体的には、例えば、図4(a)のカテゴリ構成において「オイル」配下の商品情報において、「ホホバ」及び「スクワラン」といった語句に基づく検索による検索件数のうち最小の件数より、カテゴリ名候補の「アルガン」といった語句に基づく検索による検索件数が多い場合に所定条件を満たすものとして、設定部14は、「アルガン」を「オイル」配下のカテゴリとして設定する。これにより、新たなカテゴリ名として適切な語句によるカテゴリの設定が可能となる。各カテゴリ名及びカテゴリ名候補の語句が商品情報において検索される検索件数は、例えば、設定部14が、各語句に基づき商品情報記憶部21を参照及び検索することにより取得可能である。
 設定部14は、基準語句の抽出において参照された商品情報が属する複数のカテゴリに属する商品情報における、カテゴリ名候補の語句による検索に基づき商品が購入された回数と複数のカテゴリの各カテゴリ名の検索に基づき商品が購入された回数との大小関係が所定条件を満たす場合に、カテゴリ名候補を複数のカテゴリと並列関係となるカテゴリとして設定することとしてもよい。具体的には、例えば、カテゴリ名抽出装置1が属する電子商取引サイトにおいて、図4(a)のカテゴリ構成において「オイル」配下に設けられたカテゴリを表す「ホホバ」及び「スクワラン」といった語句による検索の結果に基づき商品が購入された回数のうち最小の回数より、カテゴリ名候補の「アルガン」といった語句による検索の結果に基づき商品が購入された回数が多い場合に所定条件を満たすものとして、設定部14は、「アルガン」を「オイル」配下のカテゴリとして設定する。これにより、新たなカテゴリ名として適切な語句によるカテゴリの設定が可能となる。特定の語句による検索結果に基づき商品が購入された回数は、カテゴリ名抽出装置1が属する電子商取引サイトにおける、アクセスログ及び商品購入履歴等を記憶しているデータベースを参照することにより得られる。
 設定部14は、基準語句の抽出において参照された商品情報が属する複数のカテゴリに属する商品情報における、カテゴリ名候補の語句による検索結果の集合に、複数のカテゴリのうちの一のカテゴリのカテゴリ名の語句による検索結果の集合が所定程度以上含まれる場合に、一のカテゴリに代えてカテゴリ名候補をカテゴリとして設定することとしてもよい。具体的には、具体的には、例えば、図4(b)のカテゴリ構成において、出力部13によりカテゴリ名候補「ふさこがね」が出力された場合に、「米」配下の商品情報において、語句「ふさこがね」による検索結果の集合に、語句「ちば28号」による検索結果の集合が例えば80%以上含まれる場合に、設定部14は、「ちば28号」に代えて「ふさこがね」を「米」配下のカテゴリとして設定する。これにより、商品の探索に好適なカテゴリ構成が実現される。
 設定部14は、基準語句の抽出において参照された商品情報が属する複数のカテゴリに属する商品を販売している店舗の集合と、カテゴリ名候補の語句を商品情報に含む商品を販売している店舗の集合と、が所定の程度以上一致する場合に、カテゴリ名候補をカテゴリとして設定することとしてもよい。具体的には、例えば、カテゴリ名抽出装置1が属する電子商取引サイトにおいて、図4(b)のカテゴリ構成において「米」配下に設けられたカテゴリ「コシヒカリ」及び「あきたこまち」に属する商品を販売している店舗のリストと、カテゴリ名候補の「ふさこがね」を商品情報に含む商品を販売している店舗のリストとが所定の程度(例えば80%)以上一致する場合に、設定部14は、「ふさこがね」を「米」配下のカテゴリとして設定する。これにより、新たなカテゴリ名として適切な語句によるカテゴリの設定が可能となる。特定の商品を販売している店舗のリストは、例えば、カテゴリ名抽出装置1が属する電子商取引サイトにおける、各店舗が販売している商品情報を記憶しているデータベース(例えば商品情報記憶部21)を参照することにより得られる。
 設定部14は、基準語句の抽出において参照された商品情報が属する複数のカテゴリに属する商品を販売している店舗により販売されている商品の集合と、カテゴリ名候補の語句を商品情報に含む商品を販売している店舗により販売されている商品の集合と、が所定の程度以上一致する場合に、カテゴリ名候補をカテゴリとして設定することとしてもよい。具体的には、例えば、カテゴリ名抽出装置1が属する電子商取引サイトにおいて、図4(b)のカテゴリ構成において「米」配下に設けられたカテゴリ「コシヒカリ」及び「あきたこまち」に属する商品を販売している店舗が販売している商品の集合と、カテゴリ名候補の「ふさこがね」を商品情報に含む商品を販売している店舗が販売している商品の集合とが所定の程度以上の類似性を有する場合に、設定部14は、「ふさこがね」を「米」配下のカテゴリとして設定する。これにより、新たなカテゴリ名として適切な語句によるカテゴリの設定が可能となる。特定の商品を販売している店舗が販売している商品のリストは、例えば、カテゴリ名抽出装置1が属する電子商取引サイトにおける、各店舗が販売している商品情報を記憶しているデータベース(例えば商品情報記憶部21)を参照することにより得られる。商品集合間の類似性は、周知の解析技術により算出可能である。
 設定部14は、基準語句の抽出において参照された商品情報が属する複数のカテゴリに属する商品の価格帯と、カテゴリ名候補の語句を商品情報に含む商品の価格帯と、が所定の程度以上一致する場合に、カテゴリ名候補をカテゴリとして設定することとしてもよい。具体的には、例えば、カテゴリ名抽出装置1が属する電子商取引サイトにおいて、図4(b)のカテゴリ構成において、「米」配下に設けられたカテゴリ「コシヒカリ」及び「あきたこまち」に属する商品の価格帯と、カテゴリ名候補の「ふさこがね」を商品情報に含む商品の価格帯とが、所定の程度以上一致する場合に、設定部14は、「ふさこがね」を「米」配下のカテゴリとして設定する。特定の商品の価格帯は、例えば、カテゴリ名抽出装置1が属する電子商取引サイトにおける、各店舗が販売している商品情報を記憶しているデータベース(例えば商品情報記憶部21)を参照することにより得られる。価格帯の一致の程度は、周知の解析技術により算出可能である。
 設定部14は、カテゴリ名候補の語句を商品情報に含む商品の価格の分散が所定値以下である場合に、カテゴリ名候補をカテゴリとして設定することとしてもよい。具体的には、例えば、カテゴリ名抽出装置1が属する電子商取引サイトにおいて、カテゴリ名候補の「ふさこがね」を商品情報に含む商品の価格の分散が所定値以下である場合に、設定部14は、「ふさこがね」を「米」配下のカテゴリとして設定する。特定の商品の価格の分散は、カテゴリ名抽出装置1が属する電子商取引サイトにおける、各店舗が販売している商品情報を記憶しているデータベース(例えば商品情報記憶部21)を参照して、周知の統計的手法を用いることにより算出できる。
 再び図2を参照して、登録部15は、設定部14によりカテゴリ名候補が新たなカテゴリとして設定される場合に、カテゴリ名候補の語句を商品情報に含む商品を販売している店舗の店舗端末Dに、その商品が属するカテゴリを新たに設定されるカテゴリに変更することを促す問合せ情報を送信し、問合せ情報の送信に対する店舗端末Dからの回答に応じて商品のカテゴリを変更する部分である。
 具体的には、例えば、設定部14によりカテゴリ名候補「アルガン」が新たなカテゴリとして設定される場合に、登録部15は、「アルガン」を含む商品情報を商品情報記憶部21から抽出する。そして、登録部15は、抽出した商品情報の商品を販売している店舗の店舗端末Dに、その商品が属するカテゴリを新たに設定されるカテゴリに変更することを促す問合せ情報を送信する。図9は、問合せ情報の表示画面例を示す図である。図9に示すように、問合せ情報は、「アルガン」を含む商品情報の商品のリスト、カテゴリの変更を促すメッセージ、カテゴリの変更を受け付けるための操作部等を含む。店舗端末Dのユーザが、図9に示す表示画面例において、カテゴリを変更する商品のチェックボックスにチェックを入れて、「登録し直す」と表示されたボタンを操作すると、チェックを入れた商品のカテゴリを変更する旨の回答が、店舗端末Dから登録部15に返信される。そして、登録部15は、店舗端末Dからの回答においてチェックボックスが付された商品のカテゴリを変更する。カテゴリの変更は、商品情報記憶部21に記憶されている当該商品の商品情報の属性の書き換えにより実現される。これにより、新たに設定されるカテゴリに各店舗が販売する商品を適切に再分類できる。
 次に、図10を参照して、本実施形態のカテゴリ名抽出方法について説明する。図10は、図2に示したカテゴリ名抽出装置1におけるカテゴリ名抽出方法の処理内容の例を示すフローチャートである。
 まず、特定部11は、並列関係にある複数のカテゴリの各々に属する複数の商品情報を取得する(S1)。次に、特定部11は、取得した商品情報に含まれる語句に、当該商品情報が属するカテゴリのカテゴリ名と修飾又は被修飾の関係をもって共に含まれる語句を取得する(S2)。
 続いて、特定部11は、ステップS2において取得した語句であって、複数のカテゴリのそれぞれに属する商品情報において共通して含まれる語句を基準語句として特定する(S3)。
 次に、抽出部12は、複数のカテゴリのいずれかに属する商品情報に含まれる語句に基準語句と修飾又は被修飾の関係をもって共に含まれカテゴリの名称として設定されていない語句をカテゴリ名候補として抽出する(S4)。そして、出力部13は、抽出部12により抽出されたカテゴリ名候補を出力する(S5)。
 次に、図11を参照して、コンピュータをカテゴリ名抽出装置1として機能させるためのカテゴリ名抽出プログラムを説明する。カテゴリ名抽出プログラム1pは、メインモジュール10m、特定モジュール11m、抽出モジュール12m、出力モジュール13m、設定モジュール14m及び登録モジュール15mを備える。
 メインモジュール10mは、カテゴリ名抽出処理を統括的に制御する部分である。特定モジュール11m、抽出モジュール12m、出力モジュール13m、設定モジュール14m及び登録モジュール15mを実行することにより実現される機能はそれぞれ、図2に示されるカテゴリ名抽出装置1の特定部11、抽出部12、出力部13、設定部14及び登録部15、の機能と同様である。
 カテゴリ名抽出プログラム1pは、例えば、CD-ROMやDVD-ROM等の記憶媒体1dまたは半導体メモリによって提供される。また、カテゴリ名抽出プログラム1pは、搬送波に重畳されたコンピュータデータ信号として通信ネットワークを介して提供されてもよい。
 以上説明した本実施形態のカテゴリ名抽出装置1、カテゴリ名抽出方法、カテゴリ名抽出プログラム1pによれば、複数のカテゴリに属する商品情報に含まれる語句に当該商品情報が属するカテゴリ名と修飾又は被修飾の関係をもって含まれる語句であって、複数の異なるカテゴリの商品情報に共通して含まれる語句が基準語句として特定される。そして、複数のカテゴリに属する商品情報において、基準語句と修飾又は被修飾の関係をもって含まれる語句がカテゴリ名候補として抽出及び出力される。これにより、複数のカテゴリと同じ階層に属する商品の特徴を表し、その商品を分類するのに適切な語句が出力されるので、カテゴリ名の設定等のメンテナンスにかかる手間の低減が可能となる。
 以上、本発明をその実施形態に基づいて詳細に説明した。しかし、本発明は上記実施形態に限定されるものではない。本発明は、その要旨を逸脱しない範囲で様々な変形が可能である。
 1…カテゴリ名抽出装置、11…特定部、12…抽出部、13…出力部、14…設定部、15…登録部、21…商品情報記憶部、22…商品カテゴリ情報記憶部、100…カテゴリ名抽出システム、10m…メインモジュール、11m…特定モジュール、12m…抽出モジュール、13m…出力モジュール、14m…設定モジュール、15m…登録モジュール、1d…記憶媒体、1p…カテゴリ名抽出プログラム、D…店舗端末、M,M,M,M,M,M,M…商品情報。

Claims (14)

  1.  並列関係にある複数のカテゴリのそれぞれに属する複数のアイテム情報に含まれており、各アイテム情報が属するカテゴリの名称と修飾又は被修飾の関係をもっており、少なくとも複数の異なるカテゴリに属する複数のアイテム情報に共通する語句を、基準語句として特定する特定手段と、
     前記複数のカテゴリのいずれかに属するアイテム情報に含まれる語句に前記基準語句と修飾又は被修飾の関係をもって含まれる語句であって前記複数のカテゴリの名称ではない語句をカテゴリ名候補として抽出する抽出手段と、
     前記抽出手段により抽出されたカテゴリ名候補を出力する出力手段と、
     を備えるカテゴリ名抽出装置。
  2.  前記抽出手段は、前記複数のカテゴリに属するアイテム情報に前記基準語句と修飾又は被修飾の関係をもって含まれる語句であって、前記複数のカテゴリに属する複数のアイテム情報において所定の頻度以上で含まれる語句をカテゴリ名候補から除外する、
     請求項1に記載のカテゴリ名抽出装置。
  3.  前記カテゴリ名候補を前記複数のカテゴリと並列関係となるカテゴリとして設定する設定手段を更に備える、
     請求項1または2に記載のカテゴリ名抽出装置。
  4.  前記設定手段は、前記複数のカテゴリに属するアイテム情報における、前記複数のカテゴリの各カテゴリ名の検索数と前記カテゴリ名候補の語句の検索数との大小関係が所定条件を満たす場合に、前記カテゴリ名候補を前記複数のカテゴリと並列関係となるカテゴリとして設定する、
     請求項3に記載のカテゴリ名抽出装置。
  5.  前記設定手段は、前記複数のカテゴリに属するアイテム情報における、前記カテゴリ名候補の語句による検索結果の集合に、前記複数のカテゴリのうちの一のカテゴリのカテゴリ名の語句による検索結果の集合が所定程度以上含まれる場合に、前記一のカテゴリに代えて前記カテゴリ名候補をカテゴリとして設定する、
     請求項3または4に記載のカテゴリ名抽出装置。
  6.  前記設定手段は、前記複数のカテゴリに属するアイテム情報に、前記複数のカテゴリのうちの一のカテゴリのカテゴリ名と前記カテゴリ名候補との関係を示す所定の記載が含まれる場合に、前記一のカテゴリに代えて前記カテゴリ名候補をカテゴリとして設定する、
     請求項3~5のいずれか1項に記載のカテゴリ名抽出装置。
  7.  前記複数のカテゴリは、電子商取引サイトの店舗が提供する商品及び役務の少なくとも1つを分類するためのカテゴリであり、
     前記アイテム情報は、商品または役務に関する情報である商品情報であり、
     前記設定手段は、前記複数のカテゴリに属する商品情報における、前記カテゴリ名候補の語句による検索に基づき商品または役務が購入された回数と前記複数のカテゴリの各カテゴリ名の検索に基づき商品または役務が購入された回数との大小関係が所定条件を満たす場合に、前記カテゴリ名候補を前記複数のカテゴリと並列関係となるカテゴリとして設定する、
     請求項3~6のいずれか1項に記載のカテゴリ名抽出装置。
  8.  前記複数のカテゴリは、電子商取引サイトの店舗が提供する商品及び役務の少なくとも1つを分類するためのカテゴリであり、
     前記アイテム情報は、商品または役務に関する情報である商品情報であり、
     前記設定手段は、前記複数のカテゴリに属する商品または役務を販売している店舗の集合と、前記カテゴリ名候補の語句を商品情報に含む商品または役務を販売している店舗の集合と、が所定の程度以上一致する場合に、前記カテゴリ名候補をカテゴリとして設定する、
     請求項3~7のいずれか1項に記載のカテゴリ名抽出装置。
  9.  前記複数のカテゴリは、電子商取引サイトの店舗が提供する商品及び役務の少なくとも1つを分類するためのカテゴリであり、
     前記アイテム情報は、商品または役務に関する情報である商品情報であり、
     前記設定手段は、前記複数のカテゴリに属する商品または役務を販売している店舗により販売されている商品または役務の集合と、前記カテゴリ名候補の語句を商品情報に含む商品または役務を販売している店舗により販売されている商品または役務の集合と、が所定の程度以上一致する場合に、前記カテゴリ名候補をカテゴリとして設定する、
     請求項3~8のいずれか1項に記載のカテゴリ名抽出装置。
  10.  前記複数のカテゴリは、電子商取引サイトの店舗が提供する商品及び役務の少なくとも1つを分類するためのカテゴリであり、
     前記アイテム情報は、商品または役務に関する情報である商品情報であり、
     前記設定手段は、前記複数のカテゴリに属する商品または役務の価格帯と、前記カテゴリ名候補の語句を商品情報に含む商品または役務の価格帯と、が所定の程度以上一致する場合に、前記カテゴリ名候補をカテゴリとして設定する、
     請求項3~9のいずれか1項に記載のカテゴリ名抽出装置。
  11.  前記複数のカテゴリは、電子商取引サイトの店舗が提供する商品及び役務の少なくとも1つを分類するためのカテゴリであり、
     前記アイテム情報は、商品または役務に関する情報である商品情報であり、
     前記設定手段は、前記カテゴリ名候補の語句を商品情報に含む商品または役務の価格の分散が所定値以下である場合に、前記カテゴリ名候補をカテゴリとして設定する、
     請求項3~10のいずれか1項に記載のカテゴリ名抽出装置。
  12.  前記複数のカテゴリは、電子商取引サイトの店舗が提供する商品及び役務の少なくとも1つを分類するためのカテゴリであり、
     前記アイテム情報は、商品または役務に関する情報である商品情報であり、
     前記設定手段により前記カテゴリ名候補が新たなカテゴリとして設定される場合に、前記カテゴリ名候補の語句を商品情報に含む商品または役務を販売している店舗の端末に、該商品または該役務が属するカテゴリを新たに設定されるカテゴリに変更することを促す問合せ情報を送信し、該問合せ情報の送信に対する前記店舗の端末からの回答に応じて該商品または該役務のカテゴリを変更する登録手段を更に備える、
     請求項3~11のいずれか1項に記載のカテゴリ名抽出装置。
  13.  カテゴリ名抽出装置におけるカテゴリ名抽出方法であって、
     並列関係にある複数のカテゴリのそれぞれに属する複数のアイテム情報に含まれており、各アイテム情報が属するカテゴリの名称と修飾又は被修飾の関係をもっており、少なくとも複数の異なるカテゴリに属する複数のアイテム情報に共通する語句を、基準語句として特定する特定ステップと、
     前記複数のカテゴリのいずれかに属するアイテム情報に含まれる語句に前記基準語句と修飾又は被修飾の関係をもって含まれる語句であって前記複数のカテゴリの名称ではない語句をカテゴリ名候補として抽出する抽出ステップと、
     前記抽出ステップにおいて抽出されたカテゴリ名候補を出力する出力ステップと、
     を有するカテゴリ名抽出方法。
  14.  コンピュータに、
     並列関係にある複数のカテゴリのそれぞれに属する複数のアイテム情報に含まれており、各アイテム情報が属するカテゴリの名称と修飾又は被修飾の関係をもっており、少なくとも複数の異なるカテゴリに属する複数のアイテム情報に共通する語句を、基準語句として特定する特定機能と、
     前記複数のカテゴリのいずれかに属するアイテム情報に含まれる語句に前記基準語句と修飾又は被修飾の関係をもって含まれる語句であって前記複数のカテゴリの名称ではない語句をカテゴリ名候補として抽出する抽出機能と、
     前記抽出機能により抽出されたカテゴリ名候補を出力する出力機能と、
     を実現させるカテゴリ名抽出プログラム。
     
     
PCT/JP2013/085166 2013-12-27 2013-12-27 カテゴリ名抽出装置、カテゴリ名抽出方法及びカテゴリ名抽出プログラム WO2015097881A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
PCT/JP2013/085166 WO2015097881A1 (ja) 2013-12-27 2013-12-27 カテゴリ名抽出装置、カテゴリ名抽出方法及びカテゴリ名抽出プログラム
EP13900381.8A EP3089096A4 (en) 2013-12-27 2013-12-27 Category name extraction device, category name extraction method and category name extraction program
JP2014510593A JP5530047B1 (ja) 2013-12-27 2013-12-27 カテゴリ名抽出装置、カテゴリ名抽出方法及びカテゴリ名抽出プログラム
US14/758,318 US10621208B2 (en) 2013-12-27 2013-12-27 Category name extraction device, category name extraction method, and category name extraction program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2013/085166 WO2015097881A1 (ja) 2013-12-27 2013-12-27 カテゴリ名抽出装置、カテゴリ名抽出方法及びカテゴリ名抽出プログラム

Publications (1)

Publication Number Publication Date
WO2015097881A1 true WO2015097881A1 (ja) 2015-07-02

Family

ID=51175834

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/085166 WO2015097881A1 (ja) 2013-12-27 2013-12-27 カテゴリ名抽出装置、カテゴリ名抽出方法及びカテゴリ名抽出プログラム

Country Status (4)

Country Link
US (1) US10621208B2 (ja)
EP (1) EP3089096A4 (ja)
JP (1) JP5530047B1 (ja)
WO (1) WO2015097881A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012116208A2 (en) * 2011-02-23 2012-08-30 New York University Apparatus, method, and computer-accessible medium for explaining classifications of documents
US20170270577A1 (en) * 2016-03-15 2017-09-21 Ebay Inc. Catalogue management
US11588949B1 (en) * 2021-08-16 2023-02-21 Toshiba Tec Kabushiki Kaisha Image forming apparatus and conveyance control method

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005107937A (ja) * 2003-09-30 2005-04-21 Fujitsu Ltd 商品情報管理用プログラム,それを格納したコンピュータ可読媒体,及び、それが取り扱う商品分類マスタデータベースのデータ構造
JP2007505422A (ja) 2003-06-13 2007-03-08 シーエヌイーティ ネットワークス インコーポレイテッド 製品情報を格納するためのカタログ分類装置、該カタログ分類装置を使用するシステム及び方法
JP2008097520A (ja) * 2006-10-16 2008-04-24 Denso Corp 検索装置
JP5308593B2 (ja) * 2011-07-25 2013-10-09 楽天株式会社 ジャンル生成装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6366910B1 (en) * 1998-12-07 2002-04-02 Amazon.Com, Inc. Method and system for generation of hierarchical search results
US8019659B2 (en) 2003-05-02 2011-09-13 Cbs Interactive Inc. Catalog taxonomy for storing product information and system and method using same
CN1629837A (zh) * 2003-12-17 2005-06-22 国际商业机器公司 电子文档的处理、浏览及分类查询的方法、装置及其系统
US7885859B2 (en) * 2006-03-10 2011-02-08 Yahoo! Inc. Assigning into one set of categories information that has been assigned to other sets of categories
KR101049889B1 (ko) * 2007-10-22 2011-07-19 주식회사 이베이지마켓 검색을 통한 행태분석에 기반한 키워드 그룹에 대하여광고를 수주하고 타겟 광고하는 웹 사이트 운영 방법 및온라인 시스템
US8805823B2 (en) * 2009-04-14 2014-08-12 Sri International Content processing systems and methods
US8489523B2 (en) * 2010-03-31 2013-07-16 Alcatel Lucent Categorization automation based on category ontology
CN102541862B (zh) * 2010-12-14 2014-05-07 阿里巴巴集团控股有限公司 跨网站的信息显示方法及系统
US9171088B2 (en) * 2011-04-06 2015-10-27 Google Inc. Mining for product classification structures for internet-based product searching
US9201967B1 (en) * 2012-05-10 2015-12-01 Amazon Technologies, Inc. Rule based product classification

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007505422A (ja) 2003-06-13 2007-03-08 シーエヌイーティ ネットワークス インコーポレイテッド 製品情報を格納するためのカタログ分類装置、該カタログ分類装置を使用するシステム及び方法
JP2005107937A (ja) * 2003-09-30 2005-04-21 Fujitsu Ltd 商品情報管理用プログラム,それを格納したコンピュータ可読媒体,及び、それが取り扱う商品分類マスタデータベースのデータ構造
JP2008097520A (ja) * 2006-10-16 2008-04-24 Denso Corp 検索装置
JP5308593B2 (ja) * 2011-07-25 2013-10-09 楽天株式会社 ジャンル生成装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3089096A4

Also Published As

Publication number Publication date
JPWO2015097881A1 (ja) 2017-03-23
EP3089096A1 (en) 2016-11-02
JP5530047B1 (ja) 2014-06-25
US10621208B2 (en) 2020-04-14
EP3089096A4 (en) 2017-05-10
US20150347564A1 (en) 2015-12-03

Similar Documents

Publication Publication Date Title
CN108346075B (zh) 信息推荐方法和装置
US20150074114A1 (en) Tag management device, tag management method, tag management program, and computer-readable recording medium for storing said program
US20170097940A1 (en) Analytical Search Engine
US20160335693A1 (en) Information providing device, information providing method, program and non-transitory recording medium
US20230089850A1 (en) Real-time product environmental impact scoring
KR20180052489A (ko) 사용자 경험분석 및 환경요인에 기초한 크로스보더 전자상거래 상품 추천 방법
AU2018211215A1 (en) Method and system for modifying a webpage
CN116308684B (zh) 一种网购平台店铺信息推送方法及系统
KR101509393B1 (ko) 상품 정보 제공 장치 및 그 방법
JP5530047B1 (ja) カテゴリ名抽出装置、カテゴリ名抽出方法及びカテゴリ名抽出プログラム
Zhao et al. Anatomy of a web-scale resale market: a data mining approach
JP5567749B2 (ja) 辞書生成装置、辞書生成方法、辞書生成プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体
JP5265414B2 (ja) ネットショッピング管理装置
JP5568195B1 (ja) 検索システム、検索条件設定装置、検索条件設定装置の制御方法、プログラム、及び情報記憶媒体
CN112488854A (zh) 服务经理个性化推荐方法和相关设备
JP5670490B2 (ja) カテゴリ判定装置、検索装置、カテゴリ判定方法、カテゴリ判定プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体
KR20180092053A (ko) 지능형 쇼핑 관리시스템
US11308941B2 (en) Natural language processing apparatus and program
Arnold et al. Semi-automatic identification of counterfeit offers in online shopping platforms
KR102415016B1 (ko) 온라인 매크로 시스템의 동작 방법
JP7260294B2 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP2010122756A (ja) Edi統合処理システム、edi統合処理方法、およびedi統合処理プログラム
TW202418187A (zh) 電商商品搜尋系統及其依照情境搜尋電商商品之方法
CN112907311A (zh) 物品的识别方法及装置、计算机存储介质、电子设备
CN117556474A (zh) 数据处理方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
ENP Entry into the national phase

Ref document number: 2014510593

Country of ref document: JP

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 14758318

Country of ref document: US

REEP Request for entry into the european phase

Ref document number: 2013900381

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 2013900381

Country of ref document: EP

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13900381

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE