JP2020513128A - トピック構造化方法、検索結果提供方法、コンピュータプログラムおよびトピック構造化システム - Google Patents
トピック構造化方法、検索結果提供方法、コンピュータプログラムおよびトピック構造化システム Download PDFInfo
- Publication number
- JP2020513128A JP2020513128A JP2019554996A JP2019554996A JP2020513128A JP 2020513128 A JP2020513128 A JP 2020513128A JP 2019554996 A JP2019554996 A JP 2019554996A JP 2019554996 A JP2019554996 A JP 2019554996A JP 2020513128 A JP2020513128 A JP 2020513128A
- Authority
- JP
- Japan
- Prior art keywords
- topic
- query
- subject
- search
- subtopics
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2453—Query optimisation
- G06F16/24534—Query rewriting; Transformation
- G06F16/24535—Query rewriting; Transformation of sub-queries or views
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
410:抽出部
420:精製部
430:生成部
440:調整部
Claims (11)
- コンピュータが実現するトピック構造化方法であって、
主題別に前記主題と関連するサブトピックを抽出する段階、
前記サブトピックに対して前記主題の階層情報を利用してトピックツリーを生成する段階、および
検索のためのクエリが与えられると、前記クエリが属する主題のトピックツリーに基づき、前記クエリに対する関連検索語として前記サブトピックを階層形で提供する段階
を含む、トピック構造化方法。 - 前記抽出する段階は、
前記主題を決定する核心オブジェクトと関連する単語を分析して前記サブトピックを抽出すること
を特徴とする、請求項1に記載のトピック構造化方法。 - 前記サブトピックを文書出現頻度と検索頻度のうちの少なくとも1つによってフィルタリングする段階
をさらに含む、請求項1に記載のトピック構造化方法。 - 前記サブトピックを類義語またはサブストリング関係によってクラスタリングして各クラスタの代表を選定する段階
をさらに含む、請求項1に記載のトピック構造化方法。 - 前記生成する段階は、
前記サブトピックを前記階層情報の各クラス名にラベリングして前記トピックツリーを生成すること
を特徴とする、請求項1に記載のトピック構造化方法。 - 前記生成する段階は、
前記サブトピックに対して単語埋め込みデータから類似単語を抽出する段階、
前記類似単語を類義語またはサブストリング関係によってクラスタリングする段階、および
前記クラスタリングされた単語を言語分類学上の各クラスにマッピングすることによってラベリングする段階
を含む、請求項1に記載のトピック構造化方法。 - 前記トピックツリーの幅と深さのうちの少なくとも1つを減らして前記トピックツリーに対するリバランシングを実行する段階
をさらに含む、請求項1に記載のトピック構造化方法。 - 前記提供する段階は、
前記クエリと前記サブトピックの関連性を示す主題点数と、前記サブトピックに対応する文書数、および前記クエリに対する正解性トピックのうちの少なくとも1つの条件によって前記サブトピックをフィルタリングする段階
を含む、請求項1に記載のトピック構造化方法。 - コンピュータが実現する検索結果提供方法であって、
検索のためのクエリが与えられると、前記クエリに対応する検索結果を提供する段階、
前記クエリが属する主題の階層情報に基づき、前記クエリに対する関連検索語として前記主題と関連するサブトピックを複数のデプスを有する階層形で提供する段階、および
前記サブトピックのうちの少なくとも1つの検索語が選択される場合、前記選択された検索語を含んだ前記クエリに対応する検索結果を提供する段階
を含む、検索結果提供方法。 - コンピュータシステムと結合してトピック構造化方法を実行させるためにコンピュータ読み取り可能な記録媒体に記録されたコンピュータプログラムであって、
前記トピック構造化方法は、
主題別に前記主題と関連するサブトピックを抽出する段階、
前記サブトピックに対して前記主題の階層情報を利用してトピックツリーを生成する段階、および
検索のためのクエリが与えられると、前記クエリが属する主題のトピックツリーに基づき、前記クエリに対する関連検索語として前記サブトピックを階層形で提供する段階
を含む、コンピュータプログラム。 - コンピュータが実現するトピック構造化システムであって、
コンピュータ読み取り可能な命令を実行するように実現される少なくとも1つのプロセッサ
を含み、
前記少なくとも1つのプロセッサは、
主題別に前記主題と関連するサブトピックを抽出する抽出部、
前記サブトピックに対して前記主題の階層情報を利用してトピックツリーを生成する生成部、および
検索のためのクエリが与えられると、前記クエリが属する主題のトピックツリーに基づき、前記クエリに対する関連検索語として前記サブトピックを階層形で提供する提供部
を備える、トピック構造化システム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2017-0044683 | 2017-04-06 | ||
KR20170044683 | 2017-04-06 | ||
KR1020170085316A KR101958729B1 (ko) | 2017-04-06 | 2017-07-05 | 주제별 질의의 서브토픽 자동 추출 및 구조화 |
KR10-2017-0085316 | 2017-07-05 | ||
PCT/KR2018/002834 WO2018186599A1 (ko) | 2017-04-06 | 2018-03-09 | 주제별 질의의 서브토픽 자동 추출 및 구조화 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020513128A true JP2020513128A (ja) | 2020-04-30 |
JP6808851B2 JP6808851B2 (ja) | 2021-01-06 |
Family
ID=64132647
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019554996A Active JP6808851B2 (ja) | 2017-04-06 | 2018-03-09 | トピック構造化方法、検索結果提供方法、コンピュータプログラムおよびトピック構造化システム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6808851B2 (ja) |
KR (1) | KR101958729B1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7438272B2 (ja) | 2022-05-02 | 2024-02-26 | ネイバー コーポレーション | 検索インテント単位のブロックを生成する方法、コンピュータ装置、およびコンピュータプログラム |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10789429B2 (en) | 2018-11-21 | 2020-09-29 | Intuit, Inc. | Visualizing comment sentiment |
KR102310963B1 (ko) * | 2019-10-28 | 2021-10-12 | 주식회사 마인즈랩 | 답변 제공 장치 |
KR102483927B1 (ko) * | 2019-11-28 | 2023-01-04 | 한국과학기술원 | 계층적 단어 정보를 이용한 문장 인코딩 방법 및 장치 |
KR102471063B1 (ko) * | 2020-11-19 | 2022-11-25 | 주식회사 마인즈랩 | 답변 제공 장치 |
KR102640369B1 (ko) * | 2021-05-06 | 2024-02-27 | 네이버 주식회사 | 임베딩 유사도에 기반한 상품 검색 방법, 컴퓨터 장치, 및 컴퓨터 프로그램 |
KR102615815B1 (ko) * | 2021-06-04 | 2023-12-20 | 네이버 주식회사 | 검색 질의의 사용자 의도에 기초한 상품 기획전 생성 방법 및 시스템 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009003888A (ja) * | 2007-06-25 | 2009-01-08 | Toshiba Corp | キーワード提示のための装置、方法、及びプログラム |
WO2011013191A1 (ja) * | 2009-07-27 | 2011-02-03 | 株式会社 東芝 | 関連性提示装置、方法およびプログラム |
JP2015041386A (ja) * | 2013-08-23 | 2015-03-02 | ネイバー コーポレーションNAVER Corporation | セマンティックデプス構造基盤の検索語提示システムおよび方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101059557B1 (ko) * | 2008-12-31 | 2011-08-26 | 주식회사 솔트룩스 | 정보 검색 방법 및 이를 수행할 수 있는 프로그램이 수록된컴퓨터로 읽을 수 있는 기록 매체 |
KR101101641B1 (ko) * | 2010-03-02 | 2012-01-02 | 연세대학교 산학협력단 | 이동통신 단말기를 이용한 검색어 추천 방법 및 장치 |
-
2017
- 2017-07-05 KR KR1020170085316A patent/KR101958729B1/ko active IP Right Grant
-
2018
- 2018-03-09 JP JP2019554996A patent/JP6808851B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009003888A (ja) * | 2007-06-25 | 2009-01-08 | Toshiba Corp | キーワード提示のための装置、方法、及びプログラム |
WO2011013191A1 (ja) * | 2009-07-27 | 2011-02-03 | 株式会社 東芝 | 関連性提示装置、方法およびプログラム |
JP2015041386A (ja) * | 2013-08-23 | 2015-03-02 | ネイバー コーポレーションNAVER Corporation | セマンティックデプス構造基盤の検索語提示システムおよび方法 |
Non-Patent Citations (1)
Title |
---|
安川 美智子,外1名: "クエリログから獲得した関連語のクラスタリングに基づくWeb検索", 電子情報通信学会論文誌, vol. 第2号, JPN6020044174, 1 February 2007 (2007-02-01), JP, pages 269 - 280, ISSN: 0004389729 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7438272B2 (ja) | 2022-05-02 | 2024-02-26 | ネイバー コーポレーション | 検索インテント単位のブロックを生成する方法、コンピュータ装置、およびコンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
KR101958729B1 (ko) | 2019-03-18 |
KR20180113438A (ko) | 2018-10-16 |
JP6808851B2 (ja) | 2021-01-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6808851B2 (ja) | トピック構造化方法、検索結果提供方法、コンピュータプログラムおよびトピック構造化システム | |
KR102591421B1 (ko) | 의도 추천 방법, 장치, 기기 및 저장매체 | |
US10558754B2 (en) | Method and system for automating training of named entity recognition in natural language processing | |
Carpineto et al. | A survey of web clustering engines | |
US20180032606A1 (en) | Recommending topic clusters for unstructured text documents | |
JP2022505237A (ja) | コンテンツアイテム推奨をランク付けするための技術 | |
WO2013101490A1 (en) | Knowledge-based entity detection and disambiguation | |
EP3491542A1 (en) | Platform support clusters from computer application metadata | |
Elliott | Survey of author name disambiguation: 2004 to 2010 | |
WO2018186599A1 (ko) | 주제별 질의의 서브토픽 자동 추출 및 구조화 | |
JP2023545945A (ja) | コンテンツ管理システムにおけるコンテンツのスマートなカテゴリ化のためのシステムおよび方法 | |
US9996535B1 (en) | Efficient hierarchical user interface | |
Consoli et al. | A quartet method based on variable neighborhood search for biomedical literature extraction and clustering | |
Prasanth et al. | Effective big data retrieval using deep learning modified neural networks | |
Li et al. | A novel approach for protein-named entity recognition and protein-protein interaction extraction | |
US10339148B2 (en) | Cross-platform computer application query categories | |
Hsieh et al. | Online image search result grouping with MapReduce-based image clustering and graph construction for large-scale photos | |
Huang et al. | Pandasearch: A fine-grained academic search engine for research documents | |
CN116569164A (zh) | 在内容管理系统中对内容进行智能归类的系统和方法 | |
Wang et al. | An efficient refinement algorithm for multi-label image annotation with correlation model | |
CN111782958A (zh) | 推荐词确定方法、装置、电子装置及存储介质 | |
Mahalakshmi et al. | A Relative Study on Search Results Clustering Algorithms-K-means, Suffix Tree and LINGO | |
JP2011018152A (ja) | 情報提示装置、情報提示方法およびプログラム | |
Thangaraj et al. | A context-based technique using tag-tree for an effective retrieval from a digital literature collection | |
Kaabachi et al. | A Topological Data Analysis of Navigation Paths within Digital Libraries |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191004 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191004 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201026 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201209 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6808851 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |