JP7351372B2 - 生成プログラム、生成方法および情報処理装置 - Google Patents
生成プログラム、生成方法および情報処理装置 Download PDFInfo
- Publication number
- JP7351372B2 JP7351372B2 JP2022069412A JP2022069412A JP7351372B2 JP 7351372 B2 JP7351372 B2 JP 7351372B2 JP 2022069412 A JP2022069412 A JP 2022069412A JP 2022069412 A JP2022069412 A JP 2022069412A JP 7351372 B2 JP7351372 B2 JP 7351372B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- text data
- bitmap
- appearance position
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 82
- 230000010365 information processing Effects 0.000 title description 65
- 238000004458 analytical method Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 17
- 238000012986 modification Methods 0.000 description 16
- 230000004048 modification Effects 0.000 description 16
- 235000013351 cheese Nutrition 0.000 description 14
- 230000003203 everyday effect Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 5
- 230000000877 morphologic effect Effects 0.000 description 5
- 230000003068 static effect Effects 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/325—Hash tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
の位置にフラグ「1」を設定する。
テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置を該単語それぞれに対応付けた情報を参照して、指定された前記単語に対応付けられた出現位置を特定し、
前記テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置での属性を該出現位置に対応付ける情報を参照して、特定した前記出現位置に対応付けられた属性を特定する、
処理をコンピュータに実行させることを特徴とする特定プログラム。
テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置での属性を、該出現位置と、該単語とに対応付けて記憶する記憶部を参照して、指定された前記単語の前記テキストデータにおける出現位置での属性を特定する、
処理をコンピュータに実行させることを特徴とする特定プログラム。
受け付けた前記テキストデータを解析することで、前記テキストデータに含まれる第1の単語に対して特定の関係性を有する第2の単語をそれぞれ特定し、
前記テキストデータに含まれる前記第1の単語の出現位置と、前記第1の単語の出現位置を基準とする前記第2の単語の出現位置とを対応付けた情報を生成し、
前記第1の単語と前記第1の単語の出現位置とを対応付けた情報を生成する
処理をコンピュータに実行させることを特徴とする生成プログラム。
単語の指定を受け付け、
テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置を該単語それぞれに対応付けた情報を参照して、指定された前記単語に対応付けられた出現位置を特定し、
前記テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置での属性を該出現位置に対応付ける情報を参照して、特定した前記出現位置に対応付けられた属性を特定する、
処理を実行することを特徴とする特定方法。
テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置での属性を、該出現位置と、該単語とに対応付けて記憶する記憶部を参照して、指定された前記単語の前記テキストデータにおける出現位置での属性を特定する、
処理をコンピュータに実行させることを特徴とする特定方法。
受け付けた前記テキストデータを解析することで、前記テキストデータに含まれる第1の単語に対して特定の関係性を有する第2の単語をそれぞれ特定し、
前記テキストデータに含まれる前記第1の単語の出現位置と、前記第1の単語の出現位置を基準とする前記第2の単語の出現位置とを対応付けた情報を生成し、
前記第1の単語と前記第1の単語の出現位置とを対応付けた情報を生成する
処理をコンピュータに実行させることを特徴とする生成方法。
テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置を該単語それぞれに対応付けた情報を参照して、指定された前記単語に対応付けられた出現位置を特定する第1特定部と、
前記テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置での属性を該出現位置に対応付ける情報を参照して、特定した前記出現位置に対応付けられた属性を特定する第2特定部と
を有することを特徴とする情報処理装置。
テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置を該単語それぞれに対応付けた情報を参照して、指定された前記単語に対応付けられた出現位置を特定する第1特定部と、
前記テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置での属性を該出現位置に対応付ける情報を参照して、特定した前記出現位置に対応付けられた属性を特定する第2特定部と
を有することを特徴とする情報処理装置。
受け付けた前記テキストデータを解析することで、前記テキストデータに含まれる第1の単語に対して特定の関係性を有する第2の単語をそれぞれ特定し、前記テキストデータに含まれる前記第1の単語の出現位置と、前記第1の単語の出現位置を基準とする前記第2の単語の出現位置とを対応付けた情報を生成し、前記第1の単語と前記第1の単語の出現位置とを対応付けた情報を生成する生成部と
を有することを特徴とする情報処理装置。
110 通信部
120 入力部
130 表示部
140 記憶部
140a テキストデータ
140b 辞書情報
140c 第1インデックス
140d 第2インデックス
140e 圧縮データ
150 制御部
150a 受付部
150b 生成部
150c 第1特定部
150d 第2特定部
150e 通知部
Claims (5)
- テキストデータを受け付け、
受け付けた前記テキストデータを解析することで、前記テキストデータに含まれる主語になる単語と、前記主語となる単語の動詞となる単語と、前記動詞となる単語の目的語となる単語を特定し、
前記特定した単語のうち、前記主語となる単語を第1の単語として特定し、前記目的語となる単語を第2の単語として特定し、
前記テキストデータに含まれる前記第1の単語の出現位置と、前記第1の単語の品詞と、前記第1の単語に対する文の要素と、前記第1の単語の出現位置を基準とする前記第2の単語の出現位置とを対応付けた情報を生成し、
前記第1の単語と前記第1の単語の出現位置とを対応付けた情報を生成する
処理をコンピュータに実行させることを特徴とする生成プログラム。 - 前記テキストデータに含まれる前記第1の単語の出現位置と、前記第1の単語の出現位置を基準とする前記第2の単語の出現位置とを対応付けた情報は、0および1が並ぶビットマップであり、前記ビットマップを、所定の素数を基にしてハッシュ化する処理を更に実行することを特徴とする請求項1に記載の生成プログラム。
- 前記第1の単語と前記第1の単語の出現位置とを対応付けた情報は、0および1が並ぶビットマップであり、前記ビットマップを、所定の素数を基にしてハッシュ化する処理を更に実行することを特徴とする請求項1に記載の生成プログラム。
- コンピュータが実行する生成方法であって、
テキストデータを受け付け、
受け付けた前記テキストデータを解析することで、前記テキストデータに含まれる主語になる単語と、前記主語となる単語の動詞となる単語と、前記動詞となる単語の目的語となる単語を特定し、
前記特定した単語のうち、前記主語となる単語を第1の単語として特定し、前記目的語となる単語を第2の単語として特定し、
前記テキストデータに含まれる前記第1の単語の出現位置と、前記第1の単語の品詞と、前記第1の単語に対する文の要素と、前記第1の単語の出現位置を基準とする前記第2の単語の出現位置とを対応付けた情報を生成し、
前記第1の単語と前記第1の単語の出現位置とを対応付けた情報を生成する
処理を実行することを特徴とする生成方法。 - テキストデータを受け付ける受付部と、
受け付けた前記テキストデータを解析することで、前記テキストデータに含まれる主語になる単語と、前記主語となる単語の動詞となる単語と、前記動詞となる単語の目的語となる単語を特定し、前記特定した単語のうち、前記主語となる単語を第1の単語として特定し、前記目的語となる単語を第2の単語として特定し、前記テキストデータに含まれる前記第1の単語の出現位置と、前記第1の単語の品詞と、前記第1の単語に対する文の要素と、前記第1の単語の出現位置を基準とする前記第2の単語の出現位置とを対応付けた情報を生成し、前記第1の単語と前記第1の単語の出現位置とを対応付けた情報を生成する生成部と
を有することを特徴とする情報処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022069412A JP7351372B2 (ja) | 2018-04-12 | 2022-04-20 | 生成プログラム、生成方法および情報処理装置 |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018077144A JP7135399B2 (ja) | 2018-04-12 | 2018-04-12 | 特定プログラム、特定方法および情報処理装置 |
JP2022069412A JP7351372B2 (ja) | 2018-04-12 | 2022-04-20 | 生成プログラム、生成方法および情報処理装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018077144A Division JP7135399B2 (ja) | 2018-04-12 | 2018-04-12 | 特定プログラム、特定方法および情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022095952A JP2022095952A (ja) | 2022-06-28 |
JP7351372B2 true JP7351372B2 (ja) | 2023-09-27 |
Family
ID=68161808
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018077144A Active JP7135399B2 (ja) | 2018-04-12 | 2018-04-12 | 特定プログラム、特定方法および情報処理装置 |
JP2022069412A Active JP7351372B2 (ja) | 2018-04-12 | 2022-04-20 | 生成プログラム、生成方法および情報処理装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018077144A Active JP7135399B2 (ja) | 2018-04-12 | 2018-04-12 | 特定プログラム、特定方法および情報処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11120222B2 (ja) |
JP (2) | JP7135399B2 (ja) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001513243A (ja) | 1997-03-07 | 2001-08-28 | マイクロソフト コーポレイション | テキストの意味論的表現を利用した情報の検索 |
JP2006244298A (ja) | 2005-03-04 | 2006-09-14 | Mitsubishi Electric Corp | テキストマイング方法及びテキストマイニング装置 |
JP2007287134A (ja) | 2006-03-20 | 2007-11-01 | Ricoh Co Ltd | 情報抽出装置、及び情報抽出方法 |
JP2008021270A (ja) | 2006-07-14 | 2008-01-31 | Univ Of Tokyo | データ変換装置および方法、データベース管理装置および方法、ならびにデータベース検索システムおよび方法 |
JP2011113536A (ja) | 2009-11-30 | 2011-06-09 | Fuji Xerox Co Ltd | 情報検索プログラム及び情報検索装置 |
JP2017194762A (ja) | 2016-04-18 | 2017-10-26 | 富士通株式会社 | インデックス生成プログラム、インデックス生成装置、インデックス生成方法、検索プログラム、検索装置および検索方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4959769A (en) * | 1983-10-03 | 1990-09-25 | Wang Laboratories, Inc. | Structures and methods for representing and processing documents |
JP3419483B2 (ja) * | 1993-01-25 | 2003-06-23 | 株式会社東芝 | 自然言語処理装置及びその方法 |
JPH09212523A (ja) | 1996-01-30 | 1997-08-15 | Oki Electric Ind Co Ltd | 全文検索方法 |
US6279017B1 (en) * | 1996-08-07 | 2001-08-21 | Randall C. Walker | Method and apparatus for displaying text based upon attributes found within the text |
US20050210056A1 (en) * | 2004-01-31 | 2005-09-22 | Itzhak Pomerantz | Workstation information-flow capture and characterization for auditing and data mining |
CA2698054C (en) | 2007-08-31 | 2015-12-22 | Microsoft Corporation | Coreference resolution in an ambiguity-sensitive natural language processing system |
US8301633B2 (en) | 2007-10-01 | 2012-10-30 | Palo Alto Research Center Incorporated | System and method for semantic search |
US8229929B2 (en) * | 2010-01-06 | 2012-07-24 | International Business Machines Corporation | Cross-domain clusterability evaluation for cross-guided data clustering based on alignment between data domains |
WO2015141101A1 (ja) * | 2014-03-20 | 2015-09-24 | 日本電気株式会社 | 情報処理装置、情報処理方法および情報処理プログラム |
JP6125138B2 (ja) * | 2015-03-18 | 2017-05-10 | 三菱電機株式会社 | 情報提供システム |
US10652248B2 (en) * | 2016-07-28 | 2020-05-12 | Molecula Corp. | Systems and methods of managing data rights and selective data sharing |
JP7103763B2 (ja) * | 2017-07-20 | 2022-07-20 | 株式会社日立製作所 | 情報処理システムおよび情報処理方法 |
-
2018
- 2018-04-12 JP JP2018077144A patent/JP7135399B2/ja active Active
-
2019
- 2019-03-26 US US16/364,486 patent/US11120222B2/en active Active
-
2022
- 2022-04-20 JP JP2022069412A patent/JP7351372B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001513243A (ja) | 1997-03-07 | 2001-08-28 | マイクロソフト コーポレイション | テキストの意味論的表現を利用した情報の検索 |
JP2006244298A (ja) | 2005-03-04 | 2006-09-14 | Mitsubishi Electric Corp | テキストマイング方法及びテキストマイニング装置 |
JP2007287134A (ja) | 2006-03-20 | 2007-11-01 | Ricoh Co Ltd | 情報抽出装置、及び情報抽出方法 |
JP2008021270A (ja) | 2006-07-14 | 2008-01-31 | Univ Of Tokyo | データ変換装置および方法、データベース管理装置および方法、ならびにデータベース検索システムおよび方法 |
JP2011113536A (ja) | 2009-11-30 | 2011-06-09 | Fuji Xerox Co Ltd | 情報検索プログラム及び情報検索装置 |
JP2017194762A (ja) | 2016-04-18 | 2017-10-26 | 富士通株式会社 | インデックス生成プログラム、インデックス生成装置、インデックス生成方法、検索プログラム、検索装置および検索方法 |
Non-Patent Citations (1)
Title |
---|
立石 健二,係り受け情報を利用したWeb上の日本語テキスト検索システム,情報処理学会研究報告,社団法人情報処理学会,1998年07月17日,第98巻, 第59号,pp.47~54 |
Also Published As
Publication number | Publication date |
---|---|
US11120222B2 (en) | 2021-09-14 |
JP2019185491A (ja) | 2019-10-24 |
JP7135399B2 (ja) | 2022-09-13 |
JP2022095952A (ja) | 2022-06-28 |
US20190317990A1 (en) | 2019-10-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9633063B2 (en) | Methods and apparatus for automated redaction of content in a document | |
GB2401972A (en) | Identifying special word usage in a document | |
US20180082680A1 (en) | Syntactic re-ranking of potential transcriptions during automatic speech recognition | |
JP2005128873A (ja) | 質問応答型文書検索システム及び質問応答型文書検索プログラム | |
KR20180105546A (ko) | 클레임 요소 명사의 요소 명사 참조 번호를 획득하기 위한 요소 명사 참조 번호 획득방법 | |
US20110046940A1 (en) | Machine translation device, machine translation method, and program | |
JP2024023870A (ja) | 次元圧縮方法、表示方法および情報処理装置 | |
WO2003027895A2 (en) | Character string conversion | |
US20220083579A1 (en) | Method and system for performing summarization of text | |
CN114303152A (zh) | 对资源数据的有效存储和取回 | |
CN113743090B (zh) | 一种关键词提取方法及装置 | |
JP2009169689A (ja) | データ分類方法およびデータ処理装置 | |
JP7351372B2 (ja) | 生成プログラム、生成方法および情報処理装置 | |
JP2019211959A (ja) | 検索方法、検索プログラムおよび検索装置 | |
CN109766539B (zh) | 标准词库分词方法、装置、设备及计算机可读存储介质 | |
JP6972711B2 (ja) | 語義ベクトル生成プログラム、語義ベクトル生成方法および語義ベクトル生成装置 | |
JP6972788B2 (ja) | 特定プログラム、特定方法および情報処理装置 | |
US20140181065A1 (en) | Creating Meaningful Selectable Strings From Media Titles | |
EP4357937A1 (en) | Information processing program, information processing method, and information processing device | |
JP2009258887A (ja) | 機械翻訳装置及び機械翻訳プログラム | |
CN110297825B (zh) | 数据处理方法、装置、计算机设备以及存储介质 | |
JP4139805B2 (ja) | 字句をデータに変換する装置、方法及びプログラム | |
JP2001067375A (ja) | 名称検索装置、キーボード及び名称検索プログラムを記録した記録媒体 | |
CN114968265A (zh) | 反混淆安卓应用源码的方法、设备和计算机可读存储介质 | |
JPH1139334A (ja) | 文書処理装置及び方法、及びそのプログラムを記憶した記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220420 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230329 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230404 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230512 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230815 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230828 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7351372 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |