JP2013543154A5 - - Google Patents

Download PDF

Info

Publication number
JP2013543154A5
JP2013543154A5 JP2013512600A JP2013512600A JP2013543154A5 JP 2013543154 A5 JP2013543154 A5 JP 2013543154A5 JP 2013512600 A JP2013512600 A JP 2013512600A JP 2013512600 A JP2013512600 A JP 2013512600A JP 2013543154 A5 JP2013543154 A5 JP 2013543154A5
Authority
JP
Japan
Prior art keywords
product information
application example
randomness
product
characteristic attributes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013512600A
Other languages
English (en)
Other versions
JP5714702B2 (ja
JP2013543154A (ja
Filing date
Publication date
Priority claimed from CN201010187445.7A external-priority patent/CN102262765B/zh
Application filed filed Critical
Publication of JP2013543154A publication Critical patent/JP2013543154A/ja
Publication of JP2013543154A5 publication Critical patent/JP2013543154A5/ja
Application granted granted Critical
Publication of JP5714702B2 publication Critical patent/JP5714702B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

上述の実施形態は、理解しやすいようにいくぶん詳しく説明されているが、本発明は、提供された詳細事項に限定されるものではない。本発明を実施する多くの代替方法が存在する。開示された実施形態は、例示であり、限定を意図するものではない。
適用例1:商品情報を解析する方法であって、ユーザによって入力された商品情報を受信し、前記商品情報から1または複数の特性属性に対応する値を取得することを少なくとも含む、前記商品情報の解析を実行し、1または複数の特性属性に対応する前記値は、前記商品情報が乱雑であるか否かを判定するために用いられ、1または複数の特性属性に対応する前記取得された値に少なくとも部分的に基づいて、前記商品情報に関連する乱雑さの信頼水準を決定し、前記商品情報に関連する前記乱雑さの信頼水準が、事前設定された閾値を超えるか否かを判定し、前記乱雑さの信頼水準が前記事前設定された閾値を超えた場合には、前記商品情報の公開を停止する旨の示唆を送信し、前記乱雑さの信頼水準が前記事前設定された閾値を超えていない場合には、前記商品情報の公開を停止する旨の示唆を送信しない、こと、を備える、方法。
適用例2:適用例1に記載の方法であって、前記商品情報は、電子商取引ウェブサイトに関連して受信される、方法。
適用例3:適用例1に記載の方法であって、前記商品情報は、商品タイトル、商品説明情報、商品紹介情報、商品レビュー、および、商品の製品仕様の内の1または複数を含む、方法。
適用例4:適用例1に記載の方法であって、1または複数の特性属性に対応する前記取得された値に少なくとも部分的に基づいて、前記商品情報に関連する乱雑さの信頼水準を決定することは、1または複数の特性属性に対応する前記取得された値を条件付き確率モデルに入力し、1または複数の特性属性に対応する前記取得された値と、前記条件付き確率モデルとを少なくとも用いて、前記商品情報が乱雑である可能性に関連する事後確率を計算すること、を含み、前記乱雑さの信頼水準は、前記事後確率を含む、方法。
適用例5:適用例1に記載の方法であって、前記1または複数の特性属性は、少なくとも1つの形態的特性属性を含む、方法。
適用例6:適用例5に記載の方法であって、前記少なくとも1つの形態的特性属性は、前記商品情報に含まれるコンマの数、前記商品情報の文の長さ、前記商品情報内の総単語数に対する反復単語の除去後の前記商品情報に含まれる単語数の比、前記商品情報における最頻出単語の出現回数、事前設定されたルールに基づいて前記商品情報がセグメントに分割された後に各セグメント内の特定の位置にある単語で構成されたセット内の総単語数に対する反復単語の除去後の単語数の比、事前設定されたルールに基づいて前記商品情報がセグメントに分割された後の各セグメントの分散、の内の1または複数を含む、方法。
適用例7:適用例1に記載の方法であって、前記1または複数の特性属性は、少なくとも1つの構文的特性属性を含む、方法。
適用例8:適用例7に記載の方法であって、前記少なくとも1つの構文的特性属性は、前記商品情報内の単語に対応する品詞の総数に対する反復品詞の除去後の前記商品情報に含まれる単語に対応する品詞の数の比、名詞の総単語数に対する反復単語を除去した後の前記商品情報内の名詞の単語数の比、最頻出品詞の出現回数、事前設定されたルールに基づいて前記商品情報がセグメントに分割された後に各セグメント内の特定の位置にある単語に対応する品詞で構成されたセット内の総品詞数に対する、反復品詞を除去した後の品詞数の比、の内の1または複数を含む、方法。
適用例9:適用例6に記載の方法であって、さらに、事前設定されたルールに基づいて前記商品情報をセグメントに分割することを備え、前記ルールは、前記商品情報内のコンマの位置に基づいて前記商品情報を分割して、前記商品情報に含まれる単語のサブセットを含む1または複数のセグメントを形成すること、および/または、前記商品情報における最頻出単語の位置に基づいて前記商品情報を分割して、1または複数のセグメントを形成することを含む、方法。
適用例10:適用例8に記載の方法であって、さらに、事前設定されたルールに基づいて前記商品情報をセグメントに分割することを備え、前記ルールは、前記商品情報内のコンマの位置に基づいて前記商品情報を分割して、前記商品情報に含まれる単語のサブセットを含む1または複数のセグメントを形成すること、および/または、前記商品情報における最頻出単語の位置に基づいて前記商品情報を分割して、1または複数のセグメントを形成することを含む、方法。
適用例11:適用例1に記載の方法であって、前記乱雑さの信頼水準が前記事前設定された閾値を超えた場合に、前記商品情報が乱雑な商品情報を含むと判定することを備える、方法。
適用例12:適用例11に記載の方法であって、前記乱雑さの信頼水準が前記事前設定された閾値を超えた場合に、前記商品情報に関連する乱雑さを引き起こした可能性のある前記商品情報のキーワードを決定し、前記ユーザによってアクセス可能なインターフェース要素を介して前記キーワードに関する示唆を提示すること、をさらに備える、方法。
適用例13:適用例12に記載の方法であって、さらに、前記インターフェース要素を介して前記商品情報への修正を入力することを前記ユーザに促すことを備える、方法。
適用例14:商品情報を解析するためのシステムであって、プロセッサであって、ユーザによって入力された商品情報を受信し、前記商品情報から1または複数の特性属性に対応する値を取得することを少なくとも含む、前記商品情報の解析を実行し、1または複数の特性属性に対応する前記値は、前記商品情報が乱雑であるか否かを判定するために用いられ、1または複数の特性属性に対応する前記取得された値に少なくとも部分的に基づいて、前記商品情報に関連する乱雑さの信頼水準を決定し、前記商品情報に関連する前記乱雑さの信頼水準が、事前設定された閾値を超えるか否かを判定し、前記乱雑さの信頼水準が前記事前設定された閾値を超えた場合には、前記商品情報の公開を停止する旨の示唆を送信し、前記乱雑さの信頼水準が前記事前設定された閾値を超えていない場合には、前記商品情報の公開を停止する旨の示唆を送信しないように構成されているプロセッサと、前記プロセッサに接続され、前記プロセッサに命令を提供するよう構成されているメモリと、を備える、システム。
適用例15:適用例14に記載のシステムであって、前記商品情報は、電子商取引ウェブサイトに関連して受信される、システム。
適用例16:適用例14に記載のシステムであって、前記商品情報は、商品タイトル、商品説明情報、商品紹介情報、商品レビュー、および、商品の製品仕様の内の1または複数を含む、システム。
適用例17:適用例14に記載のシステムであって、1または複数の特性属性に対応する前記取得された値に少なくとも部分的に基づいて、前記商品情報に関連する乱雑さの信頼水準を決定するように構成されている前記プロセッサは、1または複数の特性属性に対応する前記取得された値を条件付き確率モデルに入力し、1または複数の特性属性に対応する前記取得された値と、前記条件付き確率モデルとを少なくとも用いて、前記商品情報が乱雑である可能性に関連する事後確率を計算するように構成されているプロセッサを含み、前記乱雑さの信頼水準は、前記事後確率を含む、システム。
適用例18:適用例14に記載のシステムであって、前記1または複数の特性属性は、少なくとも1つの形態的特性属性を含む、システム。
適用例19:適用例14に記載のシステムであって、前記1または複数の特性属性は、少なくとも1つの構文的特性属性を含む、システム。
適用例20:適用例14に記載のシステムであって、前記乱雑さの信頼水準が前記事前設定された閾値を超えた場合に、前記プロセッサは、前記商品情報が乱雑な商品情報を含むと判定するように構成されている、システム。
適用例21:適用例20に記載のシステムであって、前記乱雑さの信頼水準が前記事前設定された閾値を超えた場合に、前記プロセッサは、さらに、前記商品情報に関連する乱雑さを引き起こした可能性のある前記商品情報のキーワードを決定し、前記ユーザによってアクセス可能なインターフェース要素を介して前記キーワードに関する示唆を提示するように構成されている、システム。
適用例22:適用例21に記載のシステムであって、前記プロセッサは、さらに、前記インターフェース要素を介して前記商品情報への修正を入力することを前記ユーザに促すように構成されている、システム。
適用例23:商品情報を解析するためのコンピュータプログラム製品であって、前記コンピュータプログラム製品は、コンピュータ読み取り可能な記憶媒体内に具現化され、ユーザによって入力された商品情報を受信するためのコンピュータ命令と、前記商品情報から1または複数の特性属性に対応する値を取得することを少なくとも含む、前記商品情報の解析を実行するためのコンピュータ命令と、1または複数の特性属性に対応する前記値は、前記商品情報が乱雑であるか否かを判定するために用いられ、1または複数の特性属性に対応する前記取得された値に少なくとも部分的に基づいて、前記商品情報に関連する乱雑さの信頼水準を決定するためのコンピュータ命令と、前記商品情報に関連する前記乱雑さの信頼水準が、事前設定された閾値を超えるか否かを判定するためのコンピュータ命令と、前記乱雑さの信頼水準が前記事前設定された閾値を超えた場合に、前記商品情報の公開を停止する旨の示唆を送信し、前記乱雑さの信頼水準が前記事前設定された閾値を超えていない場合に、前記商品情報の公開を停止する旨の示唆を送信しないコンピュータ命令と、を備える、コンピュータプログラム製品。

Claims (1)

  1. 商品情報を解析するためのコンピュータプログラムであって
    ユーザによって入力された商品情報を受信するための機能と、
    前記商品情報から1または複数の特性属性に対応する値を取得することを少なくとも含む、前記商品情報の解析を実行するための機能と、1または複数の特性属性に対応する前記値は、前記商品情報が乱雑であるか否かを判定するために用いられ、
    1または複数の特性属性に対応する前記取得された値に少なくとも部分的に基づいて、前記商品情報に関連する乱雑さの信頼水準を決定するための機能と
    前記商品情報に関連する前記乱雑さの信頼水準が、事前設定された閾値を超えるか否かを判定するための機能と、前記乱雑さの信頼水準が前記事前設定された閾値を超えた場合に、前記商品情報の公開を停止する旨の示唆を送信し、前記乱雑さの信頼水準が前記事前設定された閾値を超えていない場合に、前記商品情報の公開を停止する旨の示唆を送信しない機能と、
    コンピュータによって実現させる、コンピュータプログラ
JP2013512600A 2010-05-27 2011-05-25 商品情報の乱雑さの解析 Expired - Fee Related JP5714702B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN201010187445.7A CN102262765B (zh) 2010-05-27 2010-05-27 一种发布商品信息的方法及装置
CN201010187445.7 2010-05-27
US13/068,976 US20110295650A1 (en) 2010-05-27 2011-05-24 Analyzing merchandise information for messiness
US13/068,976 2011-05-24
PCT/US2011/000932 WO2011149527A1 (en) 2010-05-27 2011-05-25 Analyzing merchandise information for messiness

Publications (3)

Publication Number Publication Date
JP2013543154A JP2013543154A (ja) 2013-11-28
JP2013543154A5 true JP2013543154A5 (ja) 2014-02-13
JP5714702B2 JP5714702B2 (ja) 2015-05-07

Family

ID=45009383

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013512600A Expired - Fee Related JP5714702B2 (ja) 2010-05-27 2011-05-25 商品情報の乱雑さの解析

Country Status (6)

Country Link
US (1) US20110295650A1 (ja)
EP (1) EP2577585A4 (ja)
JP (1) JP5714702B2 (ja)
CN (1) CN102262765B (ja)
HK (1) HK1159830A1 (ja)
WO (1) WO2011149527A1 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103544138B (zh) * 2012-07-11 2016-04-06 阿里巴巴集团控股有限公司 识别异常输入信息的方法与装置
CN103870960B (zh) * 2012-12-10 2019-02-15 腾讯科技(深圳)有限公司 一种商品发布方法、终端、服务器及系统
CN103544264A (zh) * 2013-10-17 2014-01-29 常熟市华安电子工程有限公司 一种商品标题优化工具
CN104715374A (zh) * 2013-12-11 2015-06-17 世纪禾光科技发展(北京)有限公司 一种电子商务平台重复产品的治理方法和系统
CN104714969B (zh) * 2013-12-16 2018-04-27 阿里巴巴集团控股有限公司 一种属性值的检测方法和检测装置
CN104391983A (zh) * 2014-12-10 2015-03-04 郑州悉知信息技术有限公司 一种批量发布产品信息的方法及系统
CN106469184B (zh) * 2015-08-20 2019-12-27 阿里巴巴集团控股有限公司 数据对象标签处理、显示方法及服务器和客户端
US11244349B2 (en) * 2015-12-29 2022-02-08 Ebay Inc. Methods and apparatus for detection of spam publication
US9842096B2 (en) * 2016-05-12 2017-12-12 International Business Machines Corporation Pre-processing for identifying nonsense passages in documents being ingested into a corpus of a natural language processing system
US10585898B2 (en) * 2016-05-12 2020-03-10 International Business Machines Corporation Identifying nonsense passages in a question answering system based on domain specific policy
US10169328B2 (en) * 2016-05-12 2019-01-01 International Business Machines Corporation Post-processing for identifying nonsense passages in a question answering system
CN111429183A (zh) * 2020-03-26 2020-07-17 中国联合网络通信集团有限公司 一种商品分析方法及装置
CN113836904B (zh) * 2021-09-18 2023-11-17 唯品会(广州)软件有限公司 商品信息校验方法
CN116308650B (zh) * 2023-03-13 2024-02-06 北京农夫铺子技术研究院 基于人工智能的智慧社区商品大数据沉浸式团购系统

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0746359B2 (ja) * 1988-03-11 1995-05-17 富士通株式会社 日本語文章処理方式
JPH0721201A (ja) * 1993-06-18 1995-01-24 Ricoh Co Ltd 電子ファイリング装置
US7536374B2 (en) * 1998-05-28 2009-05-19 Qps Tech. Limited Liability Company Method and system for using voice input for performing device functions
US8677505B2 (en) * 2000-11-13 2014-03-18 Digital Doors, Inc. Security system with extraction, reconstruction and secure recovery and storage of data
US20030063779A1 (en) * 2001-03-29 2003-04-03 Jennifer Wrigley System for visual preference determination and predictive product selection
US7689431B1 (en) * 2002-04-17 2010-03-30 Winway Corporation Context specific analysis
AU2003239385A1 (en) * 2002-05-10 2003-11-11 Richard R. Reisman Method and apparatus for browsing using multiple coordinated device
US7035841B2 (en) * 2002-07-18 2006-04-25 Xerox Corporation Method for automatic wrapper repair
US9818136B1 (en) * 2003-02-05 2017-11-14 Steven M. Hoffberg System and method for determining contingent relevance
US7840448B2 (en) * 2003-05-07 2010-11-23 Cbs Interactive Inc. System and method for automatically generating a narrative product summary
US7551780B2 (en) * 2005-08-23 2009-06-23 Ricoh Co., Ltd. System and method for using individualized mixed document
JP5217041B2 (ja) * 2006-10-10 2013-06-19 日立情報通信エンジニアリング株式会社 オンライン商取引システム
US20080215571A1 (en) * 2007-03-01 2008-09-04 Microsoft Corporation Product review search
US20090063247A1 (en) * 2007-08-28 2009-03-05 Yahoo! Inc. Method and system for collecting and classifying opinions on products
US20090083096A1 (en) * 2007-09-20 2009-03-26 Microsoft Corporation Handling product reviews
US8271483B2 (en) * 2008-09-10 2012-09-18 Palo Alto Research Center Incorporated Method and apparatus for detecting sensitive content in a document
KR101550886B1 (ko) * 2009-03-27 2015-09-08 삼성전자 주식회사 동영상 콘텐츠에 대한 부가 정보 생성 장치 및 방법
US20110276513A1 (en) * 2010-05-10 2011-11-10 Avaya Inc. Method of automatic customer satisfaction monitoring through social media

Similar Documents

Publication Publication Date Title
JP2013543154A5 (ja)
JP6150282B2 (ja) ノン・ファクトイド型質問応答システム及びコンピュータプログラム
JP2021523464A5 (ja)
JP2016509711A5 (ja)
JP5714702B2 (ja) 商品情報の乱雑さの解析
JP2017004555A5 (ja)
KR20160058587A (ko) 문서 요약을 위한 디스플레이 장치 및 방법
JP2009545808A5 (ja)
JP2013529805A5 (ja) 検索方法、検索システム及びコンピュータプログラム
JP2011511341A5 (ja)
JP2014507704A5 (ja)
RU2015151699A (ru) Извлечение сущностей из текстов на естественном языке
Campos et al. Gte: A distributional second-order co-occurrence approach to improve the identification of top relevant dates in web snippets
GB2575580A (en) Supporting interactive text mining process with natural language dialog
Oda et al. Ckylark: A more robust PCFG-LA parser
CN104077274B (zh) 一种从文档集中抽取热词短语的方法和装置
Solt et al. Concept, Assertion and Relation Extraction at the 2010 i2b2 Relation Extraction Challenge using parsing information and dictionaries
JP2015194919A (ja) 文書要約装置、文書要約方法、及び、プログラム
KR101706827B1 (ko) 개체 간 사회 관계 추출 장치 및 방법
JP6546703B2 (ja) 自然言語処理装置及び自然言語処理方法
Siddiqi et al. Keyword and keyphrase extraction from single Hindi document using statistical approach
JP5642229B2 (ja) 重要性判定システム、重要性判定方法及びコンピュータプログラム
JP2011076264A5 (ja)
Haggag et al. Keyword Extraction using Clustering and Semantic Analysis
Wardhani et al. Application of the Naïve Bayes Classifier Algorithm to Analyze Sentiment for the Covid-19 Vaccine on Twitter in Jakarta