JP2020123227A - 単語出力方法、単語出力プログラム及び情報処理装置 - Google Patents
単語出力方法、単語出力プログラム及び情報処理装置 Download PDFInfo
- Publication number
- JP2020123227A JP2020123227A JP2019015778A JP2019015778A JP2020123227A JP 2020123227 A JP2020123227 A JP 2020123227A JP 2019015778 A JP2019015778 A JP 2019015778A JP 2019015778 A JP2019015778 A JP 2019015778A JP 2020123227 A JP2020123227 A JP 2020123227A
- Authority
- JP
- Japan
- Prior art keywords
- word
- relationship
- words
- semantic
- semantic relationship
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
Description
条件#1:意味構造において特定の種別のアークでつながった単語列であって種別が「RENGO」のアークを持つ単語を含む単語列
条件#2A:各固まりは1単語のみか、又は、条件#1を満たす単語列
条件#2B:「固まり#n」以外の固まりは、種別が「MIDPOINT」のアークを持つ単語を含む
ここで、「MIDPOINT」は、カタカナ語とカタカナ語の間に中黒があることを示す。
2 文章群
3 クラスタ
11 基本辞書
12 形態素解析部
13 単語記憶部
14 文法情報記憶部
15 意味構造変換辞書
16 意味関係解析部
16a 構文解析部
16b 意味解析部
17 意味構造記憶部
18 専門用語抽出部
18a 抽出部
18b 出力部
19 ベクトル化部
20 類似度計算部
50 コンピュータ
51 メインメモリ
52 CPU
53 LANインタフェース
54 HDD
55 スーパーIO
56 DVI
57 ODD
Claims (7)
- 文字列データを受け付け、
受け付けた前記文字列データより隣り合う第1の単語及び第2の単語を抽出し、
抽出した前記第1の単語及び前記第2の単語の意味の組み合わせと、前記第1の単語及び前記第2の単語間の文法関係と、により前記第1の単語及び前記第2の単語間で特定される意味関係が特定の意味関係である場合、前記第1の単語及び前記第2の単語を含む新たな単語を生成し、
生成した前記単語を出力する、
処理をコンピュータが実行することを特徴とする単語出力方法。 - 前記生成する処理は、前記第1の単語と前記第2の単語の少なくとも一方が連語として使用されることを示す意味関係を持つ場合、前記新たな単語を生成することを特徴とする請求項1に記載の単語出力方法。
- 前記生成する処理は、前記第1の単語と前記第2の単語が中黒で結合され、前記第1の単語は、カタカナ語とカタカナ語の間に中黒があることを示す意味関係を持つ場合、前記第1の単語、前記中黒及び前記第2の単語を含む新たな単語を生成することを特徴とする請求項1又は2に記載の単語出力方法。
- 前記生成する処理は、前記第1の単語及び前記第2の単語間で特定される意味関係が特定の意味関係である場合に前記第1の単語及び前記第2の単語から生成した新たな単語と該新たな単語と隣り合う第3の単語が中黒で結合され、前記第1の単語及び前記第2の単語は、カタカナ語とカタカナ語の間に中黒があることを示す意味関係を持つ場合、該新たな単語、前記中黒及び前記第3の単語を含む新たな単語を生成することを特徴とする請求項1又は2に記載の単語出力方法。
- 前記特定の意味関係は、被修飾概念に対して世界を限定する関係、名詞が形容詞的に限定する関係、前記第1の単語が前記第2の単語の接頭語である関係、前記第1の単語が前記第2の単語の序数詞である関係、前記第1の単語と前記第2の単語が対等である関係を含むことを特徴とする請求項1〜4のいずれか1つに記載の単語出力方法。
- 文字列データを受け付け、
受け付けた前記文字列データより隣り合う第1の単語及び第2の単語を抽出し、
抽出した前記第1の単語及び前記第2の単語の意味の組み合わせと、前記第1の単語及び前記第2の単語間の文法関係と、により前記第1の単語及び前記第2の単語間で特定される意味関係が特定の意味関係である場合、前記第1の単語及び前記第2の単語を含む新たな単語を生成し、
生成した前記単語を出力する、
処理をコンピュータに実行させることを特徴とする単語出力プログラム。 - 文字列データを受け付け、受け付けた前記文字列データより隣り合う第1の単語及び第2の単語を抽出する単語抽出部と、
前記単語抽出部により抽出された前記第1の単語及び前記第2の単語の意味の組み合わせと、前記第1の単語及び前記第2の単語間の文法関係と、により前記第1の単語及び前記第2の単語間で特定される意味関係が特定の意味関係である場合、前記第1の単語及び前記第2の単語を含む新たな単語を生成し、生成した前記単語を出力する単語出力部と
を有することを特徴とする情報処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019015778A JP2020123227A (ja) | 2019-01-31 | 2019-01-31 | 単語出力方法、単語出力プログラム及び情報処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019015778A JP2020123227A (ja) | 2019-01-31 | 2019-01-31 | 単語出力方法、単語出力プログラム及び情報処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2020123227A true JP2020123227A (ja) | 2020-08-13 |
Family
ID=71992773
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019015778A Pending JP2020123227A (ja) | 2019-01-31 | 2019-01-31 | 単語出力方法、単語出力プログラム及び情報処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2020123227A (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07210556A (ja) * | 1994-01-21 | 1995-08-11 | Toshiba Corp | 自然言語処理装置及び自然言語処理方法 |
JPH11167568A (ja) * | 1997-12-04 | 1999-06-22 | Omron Corp | 単語区切り処理装置、単語区切り処理方法、および単語区切り処理プログラム記録媒体 |
JP2014067179A (ja) * | 2012-09-25 | 2014-04-17 | Toshiba Corp | 文書処理装置及び文書処理プログラム |
JP2016009415A (ja) * | 2014-06-26 | 2016-01-18 | 日本電気株式会社 | 用語集作成支援システムおよび方法、プログラム |
JP2017151553A (ja) * | 2016-02-22 | 2017-08-31 | 富士通株式会社 | 機械翻訳装置、機械翻訳方法、及びプログラム |
-
2019
- 2019-01-31 JP JP2019015778A patent/JP2020123227A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07210556A (ja) * | 1994-01-21 | 1995-08-11 | Toshiba Corp | 自然言語処理装置及び自然言語処理方法 |
JPH11167568A (ja) * | 1997-12-04 | 1999-06-22 | Omron Corp | 単語区切り処理装置、単語区切り処理方法、および単語区切り処理プログラム記録媒体 |
JP2014067179A (ja) * | 2012-09-25 | 2014-04-17 | Toshiba Corp | 文書処理装置及び文書処理プログラム |
JP2016009415A (ja) * | 2014-06-26 | 2016-01-18 | 日本電気株式会社 | 用語集作成支援システムおよび方法、プログラム |
JP2017151553A (ja) * | 2016-02-22 | 2017-08-31 | 富士通株式会社 | 機械翻訳装置、機械翻訳方法、及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Qi et al. | Openhownet: An open sememe-based lexical knowledge base | |
Roark et al. | Processing South Asian languages written in the Latin script: the Dakshina dataset | |
US9588958B2 (en) | Cross-language text classification | |
Toraman et al. | Impact of tokenization on language models: An analysis for turkish | |
US9495358B2 (en) | Cross-language text clustering | |
Casalnuovo et al. | Studying the difference between natural and programming language corpora | |
JP2020126493A (ja) | 対訳処理方法および対訳処理プログラム | |
Şahin | To augment or not to augment? A comparative study on text augmentation techniques for low-resource NLP | |
Joshi et al. | Dense semantic graph and its application in single document summarisation | |
US11227119B2 (en) | Cognitive word processing | |
Sameen et al. | Measuring short text reuse for the Urdu language | |
JP2019121139A (ja) | 要約装置、要約方法、及び要約プログラム | |
Wintner | Morphological processing of semitic languages | |
Rizki et al. | Word formation process in novel alice’s adventures in wonderland by Lewis Carroll and movie alice in wonderland by Walt Disney | |
Yeniterzi et al. | Turkish named-entity recognition | |
US11422798B2 (en) | Context-based word embedding for programming artifacts | |
Hailu et al. | Semantic role labeling for Amharic text using multiple embeddings and deep neural network | |
WO2018179729A1 (ja) | インデックス生成プログラム、データ検索プログラム、インデックス生成装置、データ検索装置、インデックス生成方法、及びデータ検索方法 | |
Murauer et al. | Generating cross-domain text classification corpora from social media comments | |
Van Thin et al. | A Systematic Literature Review on Vietnamese Aspect-based Sentiment Analysis | |
JP2020123227A (ja) | 単語出力方法、単語出力プログラム及び情報処理装置 | |
JPWO2009113289A1 (ja) | 新規事例生成装置、新規事例生成方法及び新規事例生成用プログラム | |
JP2007172179A (ja) | 意見抽出装置、意見抽出方法、および意見抽出プログラム | |
Borin et al. | Language technology for digital linguistics: Turning the linguistic survey of India into a rich source of linguistic information | |
Zhang et al. | Generating abbreviations for chinese named entities using recurrent neural network with dynamic dictionary |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211007 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220831 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220927 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230307 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20230905 |