JP2012525615A - 同義語を識別し、同義語を使用して検索するための方法および装置 - Google Patents
同義語を識別し、同義語を使用して検索するための方法および装置 Download PDFInfo
- Publication number
- JP2012525615A JP2012525615A JP2012506596A JP2012506596A JP2012525615A JP 2012525615 A JP2012525615 A JP 2012525615A JP 2012506596 A JP2012506596 A JP 2012506596A JP 2012506596 A JP2012506596 A JP 2012506596A JP 2012525615 A JP2012525615 A JP 2012525615A
- Authority
- JP
- Japan
- Prior art keywords
- words
- word
- synonyms
- knowledge database
- weight value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3338—Query expansion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/374—Thesaurus
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
Abstract
Description
本出願は、2009年4月27日に提出された、「METHOD AND APPARATUS FOR IDENTIFYING SYNONYMS AND USING SYNONYMS TO SEARCH」と題する中国特許出願第200910137633.6号からの優先権を主張し、当該出願は、参照することによってその全体が本明細書に組み込まれる。
a.識別される任意の2つの中国語の単語を、サーバによって取得することと、
b.2つの中国語の単語間の最短編集距離が、編集距離の閾値以下であることを決定し、次に、ステップcを行うことと、
c.2つの中国語の単語の両方が、事前に設定された知識データベースに存在するか否かを判定し、答えが「はい」である場合は、知識データベース内の各中国語の単語に対して、最も高い重み値を有する最小粒度タイプを検索することと、
d.2つの中国語の単語が、最も高い重み値を有する同一の最小粒度タイプを有する場合は、そのような2つの中国語の単語が同義語であると決定し、またはそうでなければ、同義語ではないことを決定することと、を含む。
e.1つまたは複数の見出されない中国語の単語が、存在する場合は、サーバによってセグメント化し、次に、セグメント化後の中国語の単語のすべてが、知識データベースに存在するか否かを判定して、答えが「はい」である場合は、知識データベース内のそのような中国語の単語のそれぞれに対して、最も高い重み値を有する最小粒度タイプを検索し、以下の動作を行うことをさらに含む。
2つの中国語の単語の任意の変更可能な文字または単語が、事前に設定された通常文字テーブルの変更可能な文字の中にあるか否かをサーバによって判定し、答えが「はい」である場合は、そのような2つの中国語の単語が同義語であると決定し、またはそうでなければ、同義語ではないことを決定することを含む、さらなる動作が存在し得る。
知識データベース内の各中国語の単語に対応する語または概念を検索し、語または概念に対応する少なくとも1つのタイプおよびその重み値に従って、各中国語の単語に対して、最も高い重み値を有する最小粒度タイプを見出すことをさらに含む。
検索エンジンによって、検索される語を含むクエリ要求をユーザから受け取ることと、
検索エンジンによって、事前に設定された同義語データベース内で語を検索し、語の同義語を見出すことと、
検索エンジンによって、その語、およびその語の同義語を使用することにより、検索を行うことと、
検索エンジンによって、その語および同義語の両方を含む結果をユーザに戻すことと、を含む。
識別される任意の2つの中国語の単語を得るように構成される、取得装置と、
2つの中国語の単語が、編集距離の閾値以下であることを決定し、第2の決定装置に通知するように構成される、第1の決定装置と、
2つの中国語の単語の両方が、事前に設定された知識データベースに存在することを決定し、クエリ装置に通知するように構成される、第2の決定装置と、
知識データベース内の各中国語の単語に対して、最も高い重み値を有する最小粒度タイプを見出すように構成される、クエリ装置と、
2つの中国語の単語が、最も高い重み値を有する同一の最小粒度タイプを有する場合は、2つの中国語の単語が同義語であることを決定し、2つの中国語の単語が、最も高い重み値を有する同一の最小粒度タイプを有しない場合は、2つの中国語の単語が同義語ではないことを決定するように構成される、第3の決定装置と、を含む。
検索される語を含むクエリ要求を、ユーザから受け取るように構成される、取得装置と、
同義語データベース内でその語を検索することによって、語の同義語を見出すように構成される、同義語検索装置と、
その語および語の同義語を使用することによって、検索を行うように構成される、検索装置と、
検索結果をユーザに戻すように構成される、リターン装置と、を含む。
Claims (13)
- 同義語を識別するための方法であって、
識別される任意の2つの単語を、サーバによって取得することと、
前記2つの単語間の最短編集距離が、編集距離の閾値以下であることを決定することと、
前記2つの単語の両方が、事前に設定された知識データベースに存在するか否かを判定することと、
前記2つの単語の両方が、前記事前に設定された知識データベースに存在する場合は、前記知識データベースの各単語に対して、最も高い重み値を有する最小粒度タイプを見出すことと、
前記2つの単語が、最も高い重み値を有する同一の最小粒度タイプを有する場合は、前記2つの単語が同義語であると決定することと、
前記2つの単語が、最も高い重み値を有する同一の最小粒度タイプを有しない場合は、前記2つの単語が同義語ではないと決定することと、を含む、方法。 - 前記2つの単語の両方が、前記事前に設定された知識データベースに存在するか否かを判定することは、
1つまたは複数の見出されない単語を、存在する場合は、前記サーバによってセグメント化することを含み、次に、セグメント化後の前記単語のすべてが、前記知識データベースに存在するかどうかを判定することと、
セグメント化後の単語のすべてが、前記知識データベースに存在する場合は、前記知識データベースのそのような単語のそれぞれに対して、最も高い重み値を有する前記最小粒度タイプを検索することと、を含む、請求項1に記載の方法。 - 2つの単語が最も高い重み値を有する同一の最小粒度タイプを有すると決定することは、
前記2つの単語の任意の変更可能な文字または単語が、事前に設定された通常文字テーブルの変更可能な文字の中にあるかどうかを、前記サーバによって判定することと、
前記2つの単語の任意の変更可能な文字または単語が、前記事前に設定された通常文字テーブルの変更可能な文字の中にある場合は、前記2つの単語が同義語であることを決定することと、
前記2つの単語の任意の変更可能な文字または単語が、前記事前に設定された通常文字テーブルの変更可能な文字の中にない場合は、前記2つの単語が同義語ではないことを決定することと、を含む、請求項1に記載の方法。 - 前記知識データベースは、
1つまたは複数の語および概念を含み、各語または概念は、少なくとも1つのタイプに対応し、前記語または概念に対応する各タイプは、それぞれに対する重み値を有する、請求項1に記載の方法。 - 前記知識データベースにおいて、各単語に対して、最も高い重み値を有する最小粒度タイプを見出すことは、
前記知識データベースにおいて各単語に対応する語または概念を検索することと、
前記語または概念に対応する前記少なくとも1つのタイプ、および関連する重み値に従って、各単語の最も高い重みを有する前記最小粒度タイプを見出すことと、を含む、請求項1に記載の方法。 - 前記2つの単語が同義語であると決定する場合は、そのような識別された同義語を同義語データベースに保存することをさらに含む、請求項1に記載の方法。
- 検索されるクエリ語を含む、ユーザからのクエリ要求を検索エンジンによって受け取ることと、
前記同義語データベースの前記クエリ語を、前記検索エンジンによって検索し、前記クエリ語の同義語を見出すことと、
前記クエリ語および前記クエリ語の前記同義語を、前記クエリ語を使用することによって、前記検索エンジンにより検索を行うことと、
前記クエリ語および前記クエリ語の前記同義語の両方を含む結果を、前記検索エンジンによって前記ユーザに戻すことと、をさらに含む、請求項6に記載の方法。 - 同義語を識別するための装置であって、
識別される任意の2つの単語を取得する、取得装置と、
前記2つの単語の間の最短編集距離が、編集距離の閾値以下であることを決定し、第2の決定装置に通知する、第1の決定装置と、
前記2つの単語の両方が、事前に設定された知識データベースに存在することを決定し、クエリ装置に通知する、前記第2の決定装置と、
前記知識データベースの各単語に対して、最も高い重み値を有する最小粒度タイプを見出す、前記クエリ装置と、
前記2つの単語が、最も高い重み値を有する、同一の最小粒度タイプを有する場合は、前記2つの単語が同義語であることを決定し、前記2つの単語が、最も高い重み値を有する同一の最小粒度タイプを有しない場合は、前記2つの単語が同義語ではないことを決定する、第3の決定装置と、を備える、装置。 - 前記知識データベースにある1つまたは複数の見出されない単語をセグメント化し、次に、前記第2の決定装置に通知する、セグメント化装置であって、前記第2の決定装置は、セグメント化後の前記単語のすべてが、前記知識データベースに存在することを決定して、前記クエリ装置に通知し、セグメント後の前記単語のすべてが、前記知識データベースに存在するとは限らないことを決定して、前記セグメント化装置に通知するようにさらに構成される、セグメント化装置をさらに備える、請求項8に記載の装置。
- 前記単語の変更可能な単語または文字が、存在する場合は、事前に設定された通常文字テーブルの変更可能な文字の中にあることを決定して、前記2つの単語が同義語であることを前記第3の決定装置に通知し、前記単語の変更可能な単語または文字が、存在する場合は、前記事前に設定された通常文字テーブルの変更可能な文字の中にないことを決定して、前記2つの単語が同義語ではないことを前記第3の決定装置に通知する、通常文字テーブルクエリ装置をさらに備える、請求項8に記載の装置。
- 前記知識データベースは、1つまたは複数の語を含み、各語または概念は、少なくとも1つのタイプに対応し、前記語または概念に対応する各タイプは、重み値を有する、請求項8に記載の装置。
- 前記装置は、サーバまたは検索エンジンである、請求項8に記載の装置。
- 検索される語を含む、クエリ要求をユーザから受け取る、取得装置と、
同義語データベースにおいて、前記語を検索することによって、前記語の同義語を見出す、同義語検索装置と、
前記語および前記語の前記同義語を使用することによって検索を行う、検索装置と、
検索結果を前記ユーザに戻す、リターン装置と、をさらに備える、請求項7に記載の装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200910137633A CN101872351B (zh) | 2009-04-27 | 2009-04-27 | 识别同义词的方法、装置及利用其进行搜索的方法和装置 |
CN200910137633.6 | 2009-04-27 | ||
PCT/IB2010/001029 WO2010125463A1 (en) | 2009-04-27 | 2010-04-23 | Method and apparatus for identifying synonyms and using synonyms to search |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012525615A true JP2012525615A (ja) | 2012-10-22 |
JP5536875B2 JP5536875B2 (ja) | 2014-07-02 |
Family
ID=42997216
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012506596A Active JP5536875B2 (ja) | 2009-04-27 | 2010-04-23 | 同義語を識別し、同義語を使用して検索するための方法および装置 |
Country Status (6)
Country | Link |
---|---|
US (2) | US8392438B2 (ja) |
EP (1) | EP2425353A4 (ja) |
JP (1) | JP5536875B2 (ja) |
CN (1) | CN101872351B (ja) |
HK (1) | HK1148366A1 (ja) |
WO (1) | WO2010125463A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013020439A (ja) * | 2011-07-11 | 2013-01-31 | Nec Corp | 同義語抽出システム、方法およびプログラム |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010003129A2 (en) * | 2008-07-03 | 2010-01-07 | The Regents Of The University Of California | A method for efficiently supporting interactive, fuzzy search on structured data |
CN101872351B (zh) | 2009-04-27 | 2012-10-10 | 阿里巴巴集团控股有限公司 | 识别同义词的方法、装置及利用其进行搜索的方法和装置 |
CN102737021B (zh) * | 2011-03-31 | 2014-10-22 | 北京百度网讯科技有限公司 | 搜索引擎及其实现方法 |
US9245006B2 (en) * | 2011-09-29 | 2016-01-26 | Sap Se | Data search using context information |
US8635230B2 (en) * | 2012-01-26 | 2014-01-21 | International Business Machines Corporation | Display of information in computing devices |
US8756241B1 (en) * | 2012-08-06 | 2014-06-17 | Google Inc. | Determining rewrite similarity scores |
CN104216892B (zh) * | 2013-05-31 | 2018-01-02 | 亿览在线网络技术(北京)有限公司 | 歌曲搜索中非语义、非词组的切换方法 |
US9311300B2 (en) * | 2013-09-13 | 2016-04-12 | International Business Machines Corporation | Using natural language processing (NLP) to create subject matter synonyms from definitions |
CN105095203B (zh) * | 2014-04-17 | 2018-10-23 | 阿里巴巴集团控股有限公司 | 同义词的确定、搜索方法及服务器 |
US9378204B2 (en) | 2014-05-22 | 2016-06-28 | International Business Machines Corporation | Context based synonym filtering for natural language processing systems |
US10031939B2 (en) | 2014-09-30 | 2018-07-24 | Microsoft Technology Licensing, Llc | Automated supplementation of data model |
CN104298735B (zh) * | 2014-09-30 | 2018-06-05 | 北京金山安全软件有限公司 | 识别应用程序类型的方法和装置 |
TWI550420B (zh) * | 2015-02-12 | 2016-09-21 | 國立雲林科技大學 | 資訊取得系統與方法、以及儲存裝置 |
CN106156597A (zh) * | 2015-04-16 | 2016-11-23 | 深圳市腾讯计算机系统有限公司 | 一种验证码的实现方法,及装置 |
CN106547757B (zh) * | 2015-09-17 | 2021-05-28 | 北京国双科技有限公司 | 匹配关键词与创意内容的方法和装置 |
CN105589967B (zh) * | 2015-12-23 | 2019-08-09 | 北京奇虎科技有限公司 | 多级相关新闻的查找方法及装置 |
CN107748784B (zh) * | 2017-10-26 | 2021-05-25 | 江苏赛睿信息科技股份有限公司 | 一种通过自然语言实现结构化数据搜索的方法 |
JP7172226B2 (ja) * | 2018-07-20 | 2022-11-16 | 株式会社リコー | 検索装置、検索方法及び検索プログラム |
US11182416B2 (en) * | 2018-10-24 | 2021-11-23 | International Business Machines Corporation | Augmentation of a text representation model |
CN111428478B (zh) * | 2020-03-20 | 2023-08-15 | 北京百度网讯科技有限公司 | 一种词条同义判别的寻证方法、装置、设备和存储介质 |
US20220414168A1 (en) * | 2021-06-24 | 2022-12-29 | Kyndryl, Inc. | Semantics based search result optimization |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10232877A (ja) | 1997-02-18 | 1998-09-02 | Dainippon Printing Co Ltd | 文字列の照合装置およびデータベースシステム |
US6144958A (en) * | 1998-07-15 | 2000-11-07 | Amazon.Com, Inc. | System and method for correcting spelling errors in search queries |
US6366910B1 (en) * | 1998-12-07 | 2002-04-02 | Amazon.Com, Inc. | Method and system for generation of hierarchical search results |
US6519585B1 (en) * | 1999-04-27 | 2003-02-11 | Infospace, Inc. | System and method for facilitating presentation of subject categorizations for use in an on-line search query engine |
JP2001256222A (ja) | 2000-03-10 | 2001-09-21 | Omron Corp | 文生成方法及び文生成装置 |
US6687689B1 (en) * | 2000-06-16 | 2004-02-03 | Nusuara Technologies Sdn. Bhd. | System and methods for document retrieval using natural language-based queries |
US6810376B1 (en) * | 2000-07-11 | 2004-10-26 | Nusuara Technologies Sdn Bhd | System and methods for determining semantic similarity of sentences |
EP1300773A1 (en) * | 2001-10-02 | 2003-04-09 | Sun Microsystems, Inc. | Information service using a thesaurus |
US7003511B1 (en) * | 2002-08-02 | 2006-02-21 | Infotame Corporation | Mining and characterization of data |
US20040064447A1 (en) * | 2002-09-27 | 2004-04-01 | Simske Steven J. | System and method for management of synonymic searching |
AU2003290395A1 (en) * | 2003-05-14 | 2004-12-03 | Dharamdas Gautam Goradia | A system of interactive dictionary |
US7617202B2 (en) * | 2003-06-16 | 2009-11-10 | Microsoft Corporation | Systems and methods that employ a distributional analysis on a query log to improve search results |
US20050033568A1 (en) * | 2003-08-08 | 2005-02-10 | Hong Yu | Methods and systems for extracting synonymous gene and protein terms from biological literature |
TW200512602A (en) * | 2003-09-19 | 2005-04-01 | Hon Hai Prec Ind Co Ltd | Method and system of fuzzy searching |
US7493322B2 (en) * | 2003-10-15 | 2009-02-17 | Xerox Corporation | System and method for computing a measure of similarity between documents |
US20070088683A1 (en) * | 2004-08-03 | 2007-04-19 | Gene Feroglia | Method and system for search engine enhancement |
WO2005124599A2 (en) * | 2004-06-12 | 2005-12-29 | Getty Images, Inc. | Content search in complex language, such as japanese |
JP2006178671A (ja) | 2004-12-21 | 2006-07-06 | Nippon Telegr & Teleph Corp <Ntt> | 同義語対抽出方法、同義語対抽出装置、同義語対抽出プログラム、及び同義語対抽出プログラム記録媒体 |
WO2006110684A2 (en) * | 2005-04-11 | 2006-10-19 | Textdigger, Inc. | System and method for searching for a query |
JP4058057B2 (ja) | 2005-04-26 | 2008-03-05 | 株式会社東芝 | 日中機械翻訳装置、日中機械翻訳方法および日中機械翻訳プログラム |
US7797299B2 (en) * | 2005-07-02 | 2010-09-14 | Steven Thrasher | Searching data storage systems and devices |
US7627548B2 (en) * | 2005-11-22 | 2009-12-01 | Google Inc. | Inferring search category synonyms from user logs |
US9165039B2 (en) * | 2005-11-29 | 2015-10-20 | Kang Jo Mgmt, Limited Liability Company | Methods and systems for providing personalized contextual search results |
US8255376B2 (en) * | 2006-04-19 | 2012-08-28 | Google Inc. | Augmenting queries with synonyms from synonyms map |
US7475063B2 (en) * | 2006-04-19 | 2009-01-06 | Google Inc. | Augmenting queries with synonyms selected using language statistics |
US8041730B1 (en) * | 2006-10-24 | 2011-10-18 | Google Inc. | Using geographic data to identify correlated geographic synonyms |
US7840538B2 (en) * | 2006-12-20 | 2010-11-23 | Yahoo! Inc. | Discovering query intent from search queries and concept networks |
US7653618B2 (en) * | 2007-02-02 | 2010-01-26 | International Business Machines Corporation | Method and system for searching and retrieving reusable assets |
CN101339551B (zh) * | 2007-07-05 | 2013-01-30 | 日电(中国)有限公司 | 自然语言查询需求扩展设备及其方法 |
US8001136B1 (en) * | 2007-07-10 | 2011-08-16 | Google Inc. | Longest-common-subsequence detection for common synonyms |
JP2009043156A (ja) * | 2007-08-10 | 2009-02-26 | Toshiba Corp | 番組検索装置および番組検索方法 |
US8380731B2 (en) * | 2007-12-13 | 2013-02-19 | The Boeing Company | Methods and apparatus using sets of semantically similar words for text classification |
CN101872351B (zh) | 2009-04-27 | 2012-10-10 | 阿里巴巴集团控股有限公司 | 识别同义词的方法、装置及利用其进行搜索的方法和装置 |
-
2009
- 2009-04-27 CN CN200910137633A patent/CN101872351B/zh active Active
-
2010
- 2010-04-23 EP EP10769390.5A patent/EP2425353A4/en not_active Withdrawn
- 2010-04-23 WO PCT/IB2010/001029 patent/WO2010125463A1/en active Application Filing
- 2010-04-23 JP JP2012506596A patent/JP5536875B2/ja active Active
- 2010-04-23 US US12/863,501 patent/US8392438B2/en not_active Expired - Fee Related
-
2011
- 2011-03-10 HK HK11102448.1A patent/HK1148366A1/xx not_active IP Right Cessation
-
2013
- 2013-01-18 US US13/745,478 patent/US9239880B2/en active Active
Non-Patent Citations (1)
Title |
---|
CSNG200800575002; 寺田 昭: '同義語辞書作成支援システム' 自然言語処理 第15巻 第2号, 20080410, 39-58ページ, 言語処理学会 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013020439A (ja) * | 2011-07-11 | 2013-01-31 | Nec Corp | 同義語抽出システム、方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN101872351A (zh) | 2010-10-27 |
JP5536875B2 (ja) | 2014-07-02 |
HK1148366A1 (en) | 2011-09-02 |
CN101872351B (zh) | 2012-10-10 |
US20110047138A1 (en) | 2011-02-24 |
US8392438B2 (en) | 2013-03-05 |
WO2010125463A1 (en) | 2010-11-04 |
EP2425353A4 (en) | 2014-05-28 |
US20130132363A1 (en) | 2013-05-23 |
US9239880B2 (en) | 2016-01-19 |
EP2425353A1 (en) | 2012-03-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5536875B2 (ja) | 同義語を識別し、同義語を使用して検索するための方法および装置 | |
US9613166B2 (en) | Search suggestions of related entities based on co-occurrence and/or fuzzy-score matching | |
Kaptein et al. | Exploiting the category structure of Wikipedia for entity ranking | |
JP5078173B2 (ja) | 多義性解消方法とそのシステム | |
US20230177360A1 (en) | Surfacing unique facts for entities | |
KR20160067202A (ko) | 맥락적 통찰 및 탐구 기법 | |
US10152478B2 (en) | Apparatus, system and method for string disambiguation and entity ranking | |
JP5391632B2 (ja) | ワードと文書の深さの決定 | |
Cornolti et al. | A piggyback system for joint entity mention detection and linking in web queries | |
CN108241613A (zh) | 一种提取关键词的方法及设备 | |
Jin et al. | Entity linking at the tail: sparse signals, unknown entities, and phrase models | |
KR101638535B1 (ko) | 사용자 검색어 연관 이슈패턴 검출 방법, 이를 수행하는 이슈패턴 검출 서버 및 이를 저장하는 기록매체 | |
CN108228612B (zh) | 一种提取网络事件关键词以及情绪倾向的方法及装置 | |
Olieman et al. | Entity linking by focusing DBpedia candidate entities | |
US9208204B2 (en) | Search suggestions using fuzzy-score matching and entity co-occurrence | |
Boutari et al. | Evaluating Term Concept Association Mesaures for Short Text Expansion: Two Case Studies of Classification and Clustering. | |
Sahmoudi et al. | A new keyphrases extraction method based on suffix tree data structure for Arabic documents clustering | |
Khanna | Conical Classification For Efficient One-Class Topic Determination | |
Canales et al. | Evaluation of entity recognition algorithms in short texts | |
TWI471739B (zh) | A method for identifying a synonym, a device, and a method and apparatus for searching it | |
Mukhtar et al. | A Combination of Classification and Summarization Techniques for Bug Report Summarization | |
Smith et al. | Generating unambiguous URL clusters from web search | |
Jiménez et al. | WikiIdRank++: extensions and improvements of the WikiIdRank system for entity linking | |
Sreekumar et al. | Comparative analysis of semantic knowledge-based techniques for understanding short texts | |
Kaneishi et al. | Word sense disambiguation using author topic model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130328 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20131122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131203 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140303 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140325 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140424 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5536875 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |