JP6427466B2 - 同義語ペア獲得装置、方法、及びプログラム - Google Patents
同義語ペア獲得装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP6427466B2 JP6427466B2 JP2015106871A JP2015106871A JP6427466B2 JP 6427466 B2 JP6427466 B2 JP 6427466B2 JP 2015106871 A JP2015106871 A JP 2015106871A JP 2015106871 A JP2015106871 A JP 2015106871A JP 6427466 B2 JP6427466 B2 JP 6427466B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- candidate
- word division
- division
- candidates
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
20 演算部
28 辞書データベース
30 単語分割候補生成部
32 意味ベクトル計算部
34 同義語ペア獲得部
50 出力部
100 同義語ペア獲得装置
Claims (5)
- 文書から、正規表記語である単語分割候補、及び前記正規表記語に対して揺らいだ表記の候補である崩れ表記語である単語分割候補を含む複数の単語分割候補を生成する単語分割候補生成部と、
前記単語分割候補生成部により生成された前記複数の単語分割候補に基づいて、前記複数の単語分割候補の各々について、単語の意味ベクトルを計算する意味ベクトル計算部と、
正規表記語である前記単語分割候補の各々について、前記意味ベクトルに基づいて計算される意味類似度と、単語の読みに基づいて計算される音類似度とに基づいて、前記複数の単語分割候補をフィルタリングし、フィルタリングされた前記複数の単語分割候補から、予め定められた前記正規表記語と同一の表記であって、前記同一の表記の前記正規表記語と同一の品詞である前記単語分割候補を除いて選択し、正規表記語である前記単語分割候補と、選択された前記単語分割候補とのペアを、同義語ペアとして獲得する同義語ペア獲得部と、
を含む同義語ペア獲得装置。 - 前記同義語ペア獲得部は、
選択された前記単語分割候補の各々について、前記意味類似度と前記音類似度とに基づいて、前記複数の単語分割候補をフィルタリングし、フィルタリングされた前記複数の単語分割候補から、予め定められた前記正規表記語と同一の表記であって、前記同一の表記の前記正規表記語と同一の品詞である前記単語分割候補を除いて更に選択し、正規表記語である前記単語分割候補と、更に選択された前記単語分割候補とのペアを、同義語ペアとして獲得する請求項1に記載の同義語ペア獲得装置。 - 単語分割候補生成部が、文書から、正規表記語である単語分割候補、及び前記正規表記語に対して揺らいだ表記の候補である崩れ表記語である単語分割候補を含む複数の単語分割候補を生成するステップと、
意味ベクトル計算部が、前記単語分割候補生成部により生成された前記複数の単語分割候補に基づいて、前記複数の単語分割候補の各々について、単語の意味ベクトルを計算するステップと、
同義語ペア獲得部が、正規表記語である前記単語分割候補の各々について、前記意味ベクトルに基づいて計算される意味類似度と、単語の読みに基づいて計算される音類似度とに基づいて、前記複数の単語分割候補をフィルタリングし、フィルタリングされた前記複数の単語分割候補から、予め定められた前記正規表記語と同一の表記であって、前記同一の表記の前記正規表記語と同一の品詞である前記単語分割候補を除いて選択し、正規表記語である前記単語分割候補と、選択された前記単語分割候補とのペアを、同義語ペアとして獲得するステップと、
を含む同義語ペア獲得方法。 - 前記同義語ペア獲得部が獲得するステップは、
選択された前記単語分割候補の各々について、前記意味類似度と前記音類似度とに基づいて、前記複数の単語分割候補をフィルタリングし、フィルタリングされた前記複数の単語分割候補から、予め定められた前記正規表記語と同一の表記であって、前記同一の表記の前記正規表記語と同一の品詞である前記単語分割候補を除いて更に選択し、正規表記語である前記単語分割候補と、更に選択された前記単語分割候補とのペアを、同義語ペアとして獲得する請求項3に記載の同義語ペア獲得方法。 - コンピュータを、請求項1又は請求項2に記載の同義語ペア獲得装置の各部として機能させるためのプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2015106871A JP6427466B2 (ja) | 2015-05-26 | 2015-05-26 | 同義語ペア獲得装置、方法、及びプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2015106871A JP6427466B2 (ja) | 2015-05-26 | 2015-05-26 | 同義語ペア獲得装置、方法、及びプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2016224482A JP2016224482A (ja) | 2016-12-28 |
| JP6427466B2 true JP6427466B2 (ja) | 2018-11-21 |
Family
ID=57746569
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2015106871A Active JP6427466B2 (ja) | 2015-05-26 | 2015-05-26 | 同義語ペア獲得装置、方法、及びプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6427466B2 (ja) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11256869B2 (en) | 2018-09-06 | 2022-02-22 | Lg Electronics Inc. | Word vector correction method |
| WO2020050706A1 (ko) * | 2018-09-06 | 2020-03-12 | 엘지전자 주식회사 | 워드벡터 보정 방법 |
| JP7323308B2 (ja) | 2019-03-20 | 2023-08-08 | 株式会社Screenホールディングス | 同義語判定方法、同義語判定プログラム、および、同義語判定装置 |
| KR102189688B1 (ko) * | 2019-04-22 | 2020-12-11 | 넷마블 주식회사 | 동의어 추출 방법 |
| JP7457531B2 (ja) | 2020-02-28 | 2024-03-28 | 株式会社Screenホールディングス | 類似度算出装置、類似度算出プログラム、および、類似度算出方法 |
| CN112579794B (zh) * | 2020-12-25 | 2022-11-11 | 清华大学 | 一种为中英文单词对预测义原树的方法及系统 |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000222427A (ja) * | 1999-02-02 | 2000-08-11 | Mitsubishi Electric Corp | 関連語抽出装置、関連語抽出方法及び関連語抽出プログラムが記録された記録媒体 |
| JP2009176148A (ja) * | 2008-01-25 | 2009-08-06 | Nec Corp | 未知語判定システム、方法及びプログラム |
| JP4245078B2 (ja) * | 2008-08-04 | 2009-03-25 | 日本電気株式会社 | 同義語辞書作成支援システム、同義語辞書作成支援方法および同義語辞書作成支援プログラム |
-
2015
- 2015-05-26 JP JP2015106871A patent/JP6427466B2/ja active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2016224482A (ja) | 2016-12-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN101002198B (zh) | 用于非罗马字符和字的拼写校正系统和方法 | |
| JP6427466B2 (ja) | 同義語ペア獲得装置、方法、及びプログラム | |
| CN105095204B (zh) | 同义词的获取方法及装置 | |
| CN114036930A (zh) | 文本纠错方法、装置、设备及计算机可读介质 | |
| CN107341143B (zh) | 一种句子连贯性判断方法及装置和电子设备 | |
| Hamed et al. | Building a first language model for code-switch Arabic-English | |
| KR100999488B1 (ko) | 문서 표절 탐색 방법 및 장치 | |
| Aliero et al. | Systematic review on text normalization techniques and its approach to non-standard words | |
| KR101509727B1 (ko) | 자율학습 정렬 기반의 정렬 코퍼스 생성 장치 및 그 방법과, 정렬 코퍼스를 사용한 파괴 표현 형태소 분석 장치 및 그 형태소 분석 방법 | |
| US20160071511A1 (en) | Method and apparatus of smart text reader for converting web page through text-to-speech | |
| CN107102983B (zh) | 一种基于网络知识源的中文概念的词向量表示方法 | |
| WO2019226406A1 (en) | Dynamic extraction of contextually-coherent text blocks | |
| JP6558863B2 (ja) | モデル作成装置、推定装置、方法、及びプログラム | |
| CN111368547A (zh) | 基于语义解析的实体识别方法、装置、设备和存储介质 | |
| CN103744837B (zh) | 基于关键词抽取的多文本对照方法 | |
| CN105512109A (zh) | 新词汇的发现方法及装置 | |
| Sun et al. | Syntactic parsing of web queries | |
| CN112329478B (zh) | 一种构建因果关系确定模型的方法、装置和设备 | |
| KR101663038B1 (ko) | 개체의 표면형 문자열 용례학습기반에 의한 텍스트에서의 개체 범위 인식 장치 및 그 방법 | |
| CN111259159A (zh) | 数据挖掘方法、装置和计算机可读存储介质 | |
| JP5911931B2 (ja) | 述語項構造抽出装置、方法、プログラム、及びコンピュータ読取り可能な記録媒体 | |
| WO2021221535A1 (ru) | Система и способ аугментации обучающей выборки для алгоритмов машинного обучения | |
| Suci et al. | In-idris: Modification of idris stemming algorithm for indonesian text | |
| CN115099214A (zh) | 一种短文本相似度计算方法、系统及存储介质 | |
| KR20190009061A (ko) | 문자 상표 검색 시스템 및 검색 서비스 제공 방법 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170621 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180514 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180605 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180803 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181023 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181029 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6427466 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |