JP2022122231A - トレジャーキーワードの判断及び再分類方法並びにシステム - Google Patents
トレジャーキーワードの判断及び再分類方法並びにシステム Download PDFInfo
- Publication number
- JP2022122231A JP2022122231A JP2021077473A JP2021077473A JP2022122231A JP 2022122231 A JP2022122231 A JP 2022122231A JP 2021077473 A JP2021077473 A JP 2021077473A JP 2021077473 A JP2021077473 A JP 2021077473A JP 2022122231 A JP2022122231 A JP 2022122231A
- Authority
- JP
- Japan
- Prior art keywords
- treasure
- information
- word
- keyword
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
<ワードプロセッシングサーバー11>
<第三者検索システム12>
<データプロバイダーデバイス13>
<テストする情報の入力ステップS1>
<第一モデル比較ステップS2>
<トレジャーキーワードの判断ステップS3>
<第二モデル比較ステップS4>
<トレジャーキーワードの再分類ステップS5>
11 ワードプロセッシングサーバー
111 データ処理モジュール
112 データストレージモジュール
1121 ワード判断データベース
1122 ワード再分類データベース
1123 分類完全データベース
113 データ収集モジュール
114 ワード判断モジュール
115 ワード再分類モジュール
116 補正モジュール
12 第三者検索システム
13 データプロバイダーデバイス
T1 テキスト情報
L1 第一トレジャーキーワード情報
T2 第二トレジャーキーワード情報
L2 分類カテゴリ情報
D1 テストするテキスト情報
D2 テストするトレジャーキーワード情報
D3 分類ラベル情報
S1 テストする情報の入力ステップ
S2 第一モデル比較ステップ
S3 トレジャーキーワードの判断ステップ
S4 第二モデル比較ステップ
S5 トレジャーキーワードの再分類ステップ
S6 抜粋使用ステップ
Claims (9)
- ワードプロセッシングサーバーのデータ収集モジュールが第三者検索システムによりテストするテキスト情報を収集し、前記テストする前記テキスト情報を前記ワードプロセッシングサーバーのワード判断モジュールに伝送する、テストする情報の入力ステップと、
前記ワード判断モジュールは、前記テストする前記テキスト情報を分析及び比較して前記トレジャーキーワードを判断し、前記ワード判断モジュールは前記ワードプロセッシングサーバーのワード判断データベース中のテキスト情報を第一ラーニング入力情報とし、第一トレジャーキーワード情報を第一ラベル情報として第一機械学習を行うと共に学習を完了するモジュールである第一モデル比較ステップと、
前記第一モデル比較ステップを受けて、前記ワード判断モジュールが前記テストする前記テキスト情報から、前記第一機械学習の結果に基づいてテストするトレジャーキーワード情報を抜粋し、前記テストする前記トレジャーキーワード情報を前記ワードプロセッシングサーバーのワード再分類モジュールに伝送するトレジャーキーワードの判断ステップと、
前記ワード再分類モジュールは前記テストする前記トレジャーキーワード情報を分析及び比較し、前記テストする前記トレジャーキーワード情報を分類し、前記ワード再分類モジュールは、前記ワードプロセッシングサーバーのワード再分類データベース中の第二トレジャーキーワード情報を第二ラーニング入力情報とし、分類カテゴリ情報を第二ラベル情報として第二機械学習を行うと共に学習を完了するモジュールである第二モデル比較ステップと、
前記第二モデル比較ステップを受けて、前記ワード再分類モジュールは前記第二機械学習の結果に基づいて前記テストする前記トレジャーキーワード情報に分類ラベル情報を付与し、且つ前記テストする前記トレジャーキーワード情報及び前記分類ラベル情報を前記ワードプロセッシングサーバーの分類完全データベースに保存するトレジャーキーワードの再分類ステップと、を含むことを特徴とするトレジャーキーワードの判断及び再分類方法。 - 前記テキスト情報はネット記事、電子メール広告テキスト、商品説明文、公開文献、ショートテキストのうちの何れか1種類またはそれらの組み合わせ情報であることを特徴とする請求項1に記載のトレジャーキーワードの判断及び再分類方法。
- 前記テキスト情報、前記第一トレジャーキーワード情報、前記第二トレジャーキーワード情報、及び前記分類カテゴリ情報はデータプロバイダーデバイスから提供されていることを特徴とする請求項1に記載のトレジャーキーワードの判断及び再分類方法。
- 前記第一機械学習及び前記第二機械学習は教師あり学習法、半教師あり学習法、及び強化学習法のうちの何れか1種類を主に使用していることを特徴とする請求項1に記載のトレジャーキーワードの判断及び再分類方法。
- 前記トレジャーキーワードの再分類ステップ後にさらに続けて抜粋使用ステップを実行し、使用者側が使用者側装置により前記ワードプロセッシングサーバーから前記トレジャーキーワードを抜粋すると、前記分類ラベル情報も前記ワードプロセッシングサーバーから一緒に抜粋されることを特徴とする請求項1に記載のトレジャーキーワードの判断及び再分類方法。
- 主にデータストレージモジュール、データ収集モジュール、ワード判断モジュール、及びワード再分類モジュールと情報接続しているデータ処理モジュールを含み、前記データ処理モジュールが作動させるワードプロセッシングサーバーと、
テストするテキスト情報を前記ワードプロセッシングサーバーに提供する第三者検索システムと、
前記テキスト情報、第一トレジャーキーワード情報、第二トレジャーキーワード情報、及び分類カテゴリ情報を前記ワードプロセッシングサーバーに提供するデータプロバイダーデバイスと、を備え、
前記データストレージモジュールは主にワード判断データベースと、ワード再分類データベースと、分類完全データベースとを含み、
前記データ収集モジュールは主に前記テストする前記テキスト情報を収集すると共に前記ワード判断モジュールに伝送し、
前記ワード判断モジュールは前記ワード判断データベースに保存しているテキスト情報を第一ラーニング入力情報とし、第一トレジャーキーワード情報を第一ラベル情報として第一機械学習を行い、前記ワード判断モジュールは前記第一機械学習の結果に基づいて前記テストする前記テキスト情報中からテストするトレジャーキーワード情報を判断し、前記テストする前記トレジャーキーワード情報を抜粋すると共に前記ワード再分類モジュールに伝送し、
前記ワード再分類モジュールは前記ワード再分類データベースに保存している第二トレジャーキーワード情報を第二ラーニング入力情報とし、分類カテゴリ情報を第二ラベル情報として第二機械学習を行い、前記ワード再分類モジュールは第二機械学習の結果に基づいて前記テストする前記トレジャーキーワード情報を分類し、且つ分類の結果に基づいて前記テストする前記トレジャーキーワード情報に分類ラベル情報を付与し、前記テストする前記トレジャーキーワード情報及び前記分類ラベル情報を前記分類完全データベースに保存することを特徴とするトレジャーキーワードの判断及び再分類システム。 - 前記テキスト情報はネット記事、電子メール広告テキスト、商品説明文、公開文献、ショートテキストのうちの何れか1種類またはそれらの組み合わせ情報であることを特徴とする請求項6に記載のトレジャーキーワードの判断及び再分類システム。
- 前記第一機械学習及び前記第二機械学習は教師あり学習法、半教師あり学習法、及び強化学習法のうちの何れか1種類を主に使用していることを特徴とする請求項6に記載のトレジャーキーワードの判断及び再分類システム。
- 前記ワードプロセッシングサーバーは、前記データプロバイダーデバイスから提供される補正情報に基づいて前記第一機械学習及び前記第二機械学習の結果を調整するための補正モジュールをさらに備えていることを特徴とする請求項6に記載のトレジャーキーワードの判断及び再分類システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW110105019 | 2021-02-09 | ||
TW110105019A TWI751022B (zh) | 2021-02-09 | 2021-02-09 | 有價字詞判斷及再分類之方法及其系統 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022122231A true JP2022122231A (ja) | 2022-08-22 |
JP7213568B2 JP7213568B2 (ja) | 2023-01-27 |
Family
ID=80681416
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021077473A Active JP7213568B2 (ja) | 2021-02-09 | 2021-04-30 | トレジャーキーワードの判断及び再分類方法並びにシステム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20220253728A1 (ja) |
JP (1) | JP7213568B2 (ja) |
TW (1) | TWI751022B (ja) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010039600A (ja) * | 2008-08-01 | 2010-02-18 | Yahoo Japan Corp | 広告配信装置、広告配信方法、及び広告配信制御プログラム |
JP2020181463A (ja) * | 2019-04-26 | 2020-11-05 | 有限会社アライブ | トレジャーキーワード探索システム |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10606946B2 (en) * | 2015-07-06 | 2020-03-31 | Microsoft Technology Licensing, Llc | Learning word embedding using morphological knowledge |
TWM546531U (zh) * | 2017-05-10 | 2017-08-01 | 曹修源 | 文字探勘衡量系統 |
TWI723868B (zh) * | 2019-06-26 | 2021-04-01 | 義守大學 | 一種抽樣後標記應用在類神經網絡訓練模型之方法 |
CN110826328A (zh) * | 2019-11-06 | 2020-02-21 | 腾讯科技(深圳)有限公司 | 关键词提取方法、装置、存储介质和计算机设备 |
-
2021
- 2021-02-09 TW TW110105019A patent/TWI751022B/zh active
- 2021-04-30 JP JP2021077473A patent/JP7213568B2/ja active Active
- 2021-05-24 US US17/328,061 patent/US20220253728A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010039600A (ja) * | 2008-08-01 | 2010-02-18 | Yahoo Japan Corp | 広告配信装置、広告配信方法、及び広告配信制御プログラム |
JP2020181463A (ja) * | 2019-04-26 | 2020-11-05 | 有限会社アライブ | トレジャーキーワード探索システム |
Non-Patent Citations (1)
Title |
---|
山崎智弘: ""強連結成分分解を利用した電子番組表からの話題抽出"", JOURNAL OF THE DBSJ, vol. 7, no. 1, JPN6022029330, June 2008 (2008-06-01), pages 1 - 6, ISSN: 0004828118 * |
Also Published As
Publication number | Publication date |
---|---|
US20220253728A1 (en) | 2022-08-11 |
JP7213568B2 (ja) | 2023-01-27 |
TW202232343A (zh) | 2022-08-16 |
TWI751022B (zh) | 2021-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10169706B2 (en) | Corpus quality analysis | |
US8676730B2 (en) | Sentiment classifiers based on feature extraction | |
US20190272277A1 (en) | Generating Answer Variants Based on Tables of a Corpus | |
Amancio | Comparing the topological properties of real and artificially generated scientific manuscripts | |
Bravo-Marquez et al. | Building a Twitter opinion lexicon from automatically-annotated tweets | |
Mitra et al. | Helpfulness of online consumer reviews: A multi-perspective approach | |
Diamantini et al. | A negation handling technique for sentiment analysis | |
CN103853824A (zh) | 一种基于深度语义挖掘的内文广告发布方法与系统 | |
CN110750648A (zh) | 一种基于深度学习和特征融合的文本情感分类方法 | |
CN112989208A (zh) | 一种信息推荐方法、装置、电子设备及存储介质 | |
CN112052424A (zh) | 一种内容审核方法及装置 | |
Shahade et al. | Multi-lingual opinion mining for social media discourses: An approach using deep learning based hybrid fine-tuned smith algorithm with adam optimizer | |
Subramanian et al. | Development of multi-lingual models for detecting hope speech texts from social media comments | |
CN106951917A (zh) | 一种淋巴瘤病理类型的智能分类系统和方法 | |
US11599580B2 (en) | Method and system to extract domain concepts to create domain dictionaries and ontologies | |
Suprayogi et al. | Information extraction for mobile application user review | |
JP7213568B2 (ja) | トレジャーキーワードの判断及び再分類方法並びにシステム | |
Zhang et al. | Research on keyword extraction and sentiment orientation analysis of educational texts | |
Chao et al. | A joint framework for identifying the type and arguments of scientific contribution | |
Chen et al. | An opinion mining framework for Cantonese reviews | |
Mai et al. | Scalable disambiguation system capturing individualities of mentions | |
Velammal | Development of knowledge based sentiment analysis system using lexicon approach on twitter data | |
Verma et al. | PREDICTING SENTIMENT FROM MOVIE REVIEWS USINGLEXICONBASED MODEL | |
KR20180059147A (ko) | 소셜 데이터 분류 시스템 및 방법 | |
Mohd Sharef et al. | Content-Based Analysis Method for Sentiment Scoring in Microblogging Mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210608 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220719 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220831 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221227 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230110 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7213568 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |