JP2019185491A - 特定プログラム、生成プログラム、特定方法、生成方法および情報処理装置 - Google Patents
特定プログラム、生成プログラム、特定方法、生成方法および情報処理装置 Download PDFInfo
- Publication number
- JP2019185491A JP2019185491A JP2018077144A JP2018077144A JP2019185491A JP 2019185491 A JP2019185491 A JP 2019185491A JP 2018077144 A JP2018077144 A JP 2018077144A JP 2018077144 A JP2018077144 A JP 2018077144A JP 2019185491 A JP2019185491 A JP 2019185491A
- Authority
- JP
- Japan
- Prior art keywords
- word
- text data
- appearance position
- information
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
- G06F16/325—Hash tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/268—Morphological analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Abstract
Description
の位置にフラグ「1」を設定する。
テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置を該単語それぞれに対応付けた情報を参照して、指定された前記単語に対応付けられた出現位置を特定し、
前記テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置での属性を該出現位置に対応付ける情報を参照して、特定した前記出現位置に対応付けられた属性を特定する、
処理をコンピュータに実行させることを特徴とする特定プログラム。
テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置での属性を、該出現位置と、該単語とに対応付けて記憶する記憶部を参照して、指定された前記単語の前記テキストデータにおける出現位置での属性を特定する、
処理をコンピュータに実行させることを特徴とする特定プログラム。
受け付けた前記テキストデータを解析することで、前記テキストデータに含まれる第1の単語に対して特定の関係性を有する第2の単語をそれぞれ特定し、
前記テキストデータに含まれる前記第1の単語の出現位置と、前記第1の単語の出現位置を基準とする前記第2の単語の出現位置とを対応付けた情報を生成し、
前記第1の単語と前記第1の単語の出現位置とを対応付けた情報を生成する
処理をコンピュータに実行させることを特徴とする生成プログラム。
単語の指定を受け付け、
テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置を該単語それぞれに対応付けた情報を参照して、指定された前記単語に対応付けられた出現位置を特定し、
前記テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置での属性を該出現位置に対応付ける情報を参照して、特定した前記出現位置に対応付けられた属性を特定する、
処理を実行することを特徴とする特定方法。
テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置での属性を、該出現位置と、該単語とに対応付けて記憶する記憶部を参照して、指定された前記単語の前記テキストデータにおける出現位置での属性を特定する、
処理をコンピュータに実行させることを特徴とする特定方法。
受け付けた前記テキストデータを解析することで、前記テキストデータに含まれる第1の単語に対して特定の関係性を有する第2の単語をそれぞれ特定し、
前記テキストデータに含まれる前記第1の単語の出現位置と、前記第1の単語の出現位置を基準とする前記第2の単語の出現位置とを対応付けた情報を生成し、
前記第1の単語と前記第1の単語の出現位置とを対応付けた情報を生成する
処理をコンピュータに実行させることを特徴とする生成方法。
テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置を該単語それぞれに対応付けた情報を参照して、指定された前記単語に対応付けられた出現位置を特定する第1特定部と、
前記テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置での属性を該出現位置に対応付ける情報を参照して、特定した前記出現位置に対応付けられた属性を特定する第2特定部と
を有することを特徴とする情報処理装置。
テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置を該単語それぞれに対応付けた情報を参照して、指定された前記単語に対応付けられた出現位置を特定する第1特定部と、
前記テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置での属性を該出現位置に対応付ける情報を参照して、特定した前記出現位置に対応付けられた属性を特定する第2特定部と
を有することを特徴とする情報処理装置。
受け付けた前記テキストデータを解析することで、前記テキストデータに含まれる第1の単語に対して特定の関係性を有する第2の単語をそれぞれ特定し、前記テキストデータに含まれる前記第1の単語の出現位置と、前記第1の単語の出現位置を基準とする前記第2の単語の出現位置とを対応付けた情報を生成し、前記第1の単語と前記第1の単語の出現位置とを対応付けた情報を生成する生成部と
を有することを特徴とする情報処理装置。
110 通信部
120 入力部
130 表示部
140 記憶部
140a テキストデータ
140b 辞書情報
140c 第1インデックス
140d 第2インデックス
140e 圧縮データ
150 制御部
150a 受付部
150b 生成部
150c 第1特定部
150d 第2特定部
150e 通知部
Claims (15)
- 単語の指定を受け付け、
テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置を該単語それぞれに対応付けた情報を参照して、指定された前記単語に対応付けられた出現位置を特定し、
前記テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置での属性を該出現位置に対応付ける情報を参照して、特定した前記出現位置に対応付けられた属性を特定する、
処理をコンピュータに実行させることを特徴とする特定プログラム。 - 前記属性は、前記テキストデータに含まれる単語のうち、指定された前記単語に対して特定の関係を有する他の単語の出現位置であることを特徴とする請求項1に記載の特定プログラム。
- 前記関係は、係り受けの関係であることを特徴とする請求項2に記載の特定プログラム。
- 前記属性は、前記単語の品詞であることを特徴とする請求項1に記載の特定プログラム。
- 前記属性は、前記テキストデータに含まれる文の要素のうち、いずれの要素に対応するかを示す情報であることを特徴とする請求項1に記載の特定プログラム。
- 単語の指定を受け付け、
テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置での属性を、該出現位置と、該単語とに対応付けて記憶する記憶部を参照して、指定された前記単語の前記テキストデータにおける出現位置での属性を特定する、
処理をコンピュータに実行させることを特徴とする特定プログラム。 - テキストデータを受け付け、
受け付けた前記テキストデータを解析することで、前記テキストデータに含まれる第1の単語に対して特定の関係性を有する第2の単語をそれぞれ特定し、
前記テキストデータに含まれる前記第1の単語の出現位置と、前記第1の単語の出現位置を基準とする前記第2の単語の出現位置とを対応付けた情報を生成し、
前記第1の単語と前記第1の単語の出現位置とを対応付けた情報を生成する
処理をコンピュータに実行させることを特徴とする生成プログラム。 - 前記テキストデータに含まれる前記第1の単語の出現位置と、前記第1の単語の出現位置を基準とする前記第2の単語の出現位置とを対応付けた情報を生成する処理は、前記第1の単語の出現位置と、前記第1の単語の品詞と、前記第1の単語に対応する文の要素とを更に対応付けることを特徴とする請求項7に記載の生成プログラム。
- 前記テキストデータに含まれる前記第1の単語の出現位置と、前記第1の単語の出現位置を基準とする前記第2の単語の出現位置とを対応付けた情報は、0および1が並ぶビットマップであり、前記ビットマップを、所定の素数を基にしてハッシュ化する処理を更に実行することを特徴とする請求項7に記載の生成プログラム。
- 前記第1の単語と前記第1の単語の出現位置とを対応付けた情報は、0および1が並ぶビットマップであり、前記ビットマップを、所定の素数を基にしてハッシュ化する処理を更に実行することを特徴とする請求項7に記載の生成プログラム。
- コンピュータが実行する特定方法であって、
単語の指定を受け付け、
テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置を該単語それぞれに対応付けた情報を参照して、指定された前記単語に対応付けられた出現位置を特定し、
前記テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置での属性を該出現位置に対応付ける情報を参照して、特定した前記出現位置に対応付けられた属性を特定する、
処理を実行することを特徴とする特定方法。 - コンピュータが実行する特定方法であって、
単語の指定を受け付け、
テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置での属性を、該出現位置と、該単語とに対応付けて記憶する記憶部を参照して、指定された前記単語の前記テキストデータにおける出現位置での属性を特定する、
処理を実行することを特徴とする特定方法。 - コンピュータが実行する生成方法であって、
テキストデータを受け付け、
受け付けた前記テキストデータを解析することで、前記テキストデータに含まれる第1の単語に対して特定の関係性を有する第2の単語をそれぞれ特定し、
前記テキストデータに含まれる前記第1の単語の出現位置と、前記第1の単語の出現位置を基準とする前記第2の単語の出現位置とを対応付けた情報を生成し、
前記第1の単語と前記第1の単語の出現位置とを対応付けた情報を生成する
処理を実行することを特徴とする生成方法。 - 単語の指定を受け付ける受付部と、
テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置を該単語それぞれに対応付けた情報を参照して、指定された前記単語に対応付けられた出現位置を特定する第1特定部と、
前記テキストデータに含まれる単語それぞれの前記テキストデータにおける出現位置での属性を該出現位置に対応付ける情報を参照して、特定した前記出現位置に対応付けられた属性を特定する第2特定部と
を有することを特徴とする情報処理装置。 - テキストデータを受け付ける受付部と、
受け付けた前記テキストデータを解析することで、前記テキストデータに含まれる第1の単語に対して特定の関係性を有する第2の単語をそれぞれ特定し、前記テキストデータに含まれる前記第1の単語の出現位置と、前記第1の単語の出現位置を基準とする前記第2の単語の出現位置とを対応付けた情報を生成し、前記第1の単語と前記第1の単語の出現位置とを対応付けた情報を生成する生成部と
を有することを特徴とする情報処理装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018077144A JP7135399B2 (ja) | 2018-04-12 | 2018-04-12 | 特定プログラム、特定方法および情報処理装置 |
US16/364,486 US11120222B2 (en) | 2018-04-12 | 2019-03-26 | Non-transitory computer readable recording medium, identification method, generation method, and information processing device |
JP2022069412A JP7351372B2 (ja) | 2018-04-12 | 2022-04-20 | 生成プログラム、生成方法および情報処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018077144A JP7135399B2 (ja) | 2018-04-12 | 2018-04-12 | 特定プログラム、特定方法および情報処理装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022069412A Division JP7351372B2 (ja) | 2018-04-12 | 2022-04-20 | 生成プログラム、生成方法および情報処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019185491A true JP2019185491A (ja) | 2019-10-24 |
JP7135399B2 JP7135399B2 (ja) | 2022-09-13 |
Family
ID=68161808
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018077144A Active JP7135399B2 (ja) | 2018-04-12 | 2018-04-12 | 特定プログラム、特定方法および情報処理装置 |
JP2022069412A Active JP7351372B2 (ja) | 2018-04-12 | 2022-04-20 | 生成プログラム、生成方法および情報処理装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022069412A Active JP7351372B2 (ja) | 2018-04-12 | 2022-04-20 | 生成プログラム、生成方法および情報処理装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11120222B2 (ja) |
JP (2) | JP7135399B2 (ja) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006244298A (ja) * | 2005-03-04 | 2006-09-14 | Mitsubishi Electric Corp | テキストマイング方法及びテキストマイニング装置 |
JP2014238865A (ja) * | 2007-08-31 | 2014-12-18 | マイクロソフト コーポレーション | 曖昧感応自然言語処理システムにおける同一指示解決 |
JP2017194762A (ja) * | 2016-04-18 | 2017-10-26 | 富士通株式会社 | インデックス生成プログラム、インデックス生成装置、インデックス生成方法、検索プログラム、検索装置および検索方法 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4959769A (en) * | 1983-10-03 | 1990-09-25 | Wang Laboratories, Inc. | Structures and methods for representing and processing documents |
JP3419483B2 (ja) * | 1993-01-25 | 2003-06-23 | 株式会社東芝 | 自然言語処理装置及びその方法 |
JPH09212523A (ja) | 1996-01-30 | 1997-08-15 | Oki Electric Ind Co Ltd | 全文検索方法 |
US6279017B1 (en) * | 1996-08-07 | 2001-08-21 | Randall C. Walker | Method and apparatus for displaying text based upon attributes found within the text |
US6076051A (en) | 1997-03-07 | 2000-06-13 | Microsoft Corporation | Information retrieval utilizing semantic representation of text |
US20050210056A1 (en) * | 2004-01-31 | 2005-09-22 | Itzhak Pomerantz | Workstation information-flow capture and characterization for auditing and data mining |
JP2007287134A (ja) * | 2006-03-20 | 2007-11-01 | Ricoh Co Ltd | 情報抽出装置、及び情報抽出方法 |
JP2008021270A (ja) | 2006-07-14 | 2008-01-31 | Univ Of Tokyo | データ変換装置および方法、データベース管理装置および方法、ならびにデータベース検索システムおよび方法 |
US8301633B2 (en) | 2007-10-01 | 2012-10-30 | Palo Alto Research Center Incorporated | System and method for semantic search |
JP5493779B2 (ja) * | 2009-11-30 | 2014-05-14 | 富士ゼロックス株式会社 | 情報検索プログラム及び情報検索装置 |
US8229929B2 (en) * | 2010-01-06 | 2012-07-24 | International Business Machines Corporation | Cross-domain clusterability evaluation for cross-guided data clustering based on alignment between data domains |
CN106104520B (zh) * | 2014-03-20 | 2019-04-26 | 日本电气株式会社 | 信息处理设备、信息处理方法和存储介质 |
CN107408118A (zh) * | 2015-03-18 | 2017-11-28 | 三菱电机株式会社 | 信息提供系统 |
US10652248B2 (en) * | 2016-07-28 | 2020-05-12 | Molecula Corp. | Systems and methods of managing data rights and selective data sharing |
JP7103763B2 (ja) * | 2017-07-20 | 2022-07-20 | 株式会社日立製作所 | 情報処理システムおよび情報処理方法 |
-
2018
- 2018-04-12 JP JP2018077144A patent/JP7135399B2/ja active Active
-
2019
- 2019-03-26 US US16/364,486 patent/US11120222B2/en active Active
-
2022
- 2022-04-20 JP JP2022069412A patent/JP7351372B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006244298A (ja) * | 2005-03-04 | 2006-09-14 | Mitsubishi Electric Corp | テキストマイング方法及びテキストマイニング装置 |
JP2014238865A (ja) * | 2007-08-31 | 2014-12-18 | マイクロソフト コーポレーション | 曖昧感応自然言語処理システムにおける同一指示解決 |
JP2017194762A (ja) * | 2016-04-18 | 2017-10-26 | 富士通株式会社 | インデックス生成プログラム、インデックス生成装置、インデックス生成方法、検索プログラム、検索装置および検索方法 |
Non-Patent Citations (1)
Title |
---|
立石 健二 外3名: "係り受け情報を利用したWeb上の日本語テキスト検索システム", 情報処理学会研究報告, vol. 第98巻第59号, JPN6014023196, 17 July 1998 (1998-07-17), JP, pages 47 - 54, ISSN: 0004715528 * |
Also Published As
Publication number | Publication date |
---|---|
US11120222B2 (en) | 2021-09-14 |
US20190317990A1 (en) | 2019-10-17 |
JP7135399B2 (ja) | 2022-09-13 |
JP2022095952A (ja) | 2022-06-28 |
JP7351372B2 (ja) | 2023-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8515984B2 (en) | Extensible search term suggestion engine | |
GB2401972A (en) | Identifying special word usage in a document | |
JP6122800B2 (ja) | 電子機器、文字列表示方法、および文字列表示プログラム | |
JP2024023870A (ja) | 次元圧縮方法、表示方法および情報処理装置 | |
US20030061031A1 (en) | Japanese virtual dictionary | |
Chinnakotla et al. | Transliteration for resource-scarce languages | |
CN114303152A (zh) | 对资源数据的有效存储和取回 | |
US20220083579A1 (en) | Method and system for performing summarization of text | |
JP2009169689A (ja) | データ分類方法およびデータ処理装置 | |
JP7351372B2 (ja) | 生成プログラム、生成方法および情報処理装置 | |
KR100942123B1 (ko) | 키스트로크 식별을 위한 컴퓨터 구현 방법, 컴퓨터 판독가능 저장 매체 및 시스템 | |
US9613019B2 (en) | Techniques for automatically generating test data | |
US11704090B2 (en) | Audio interactive display system and method of interacting with audio interactive display system | |
JP2019211959A (ja) | 検索方法、検索プログラムおよび検索装置 | |
US10430503B2 (en) | Electronic display content fitting | |
CN109145084B (zh) | 数据处理方法、数据处理装置和服务器 | |
JP2010250389A (ja) | 情報検索システム、方法及びプログラム、索引作成システム、方法及びプログラム、 | |
WO2019003517A1 (ja) | 語義ベクトル生成プログラム、語義ベクトル生成方法および語義ベクトル生成装置 | |
JPWO2020021609A1 (ja) | 生成方法、生成プログラムおよび情報処理装置 | |
JP2019215660A (ja) | 処理プログラム、処理方法および情報処理装置 | |
WO2022264216A1 (ja) | 情報処理プログラム、情報処理方法および情報処理装置 | |
JP7458543B1 (ja) | 情報処理装置、情報処理方法、プログラム、及び記録媒体 | |
JP2001067375A (ja) | 名称検索装置、キーボード及び名称検索プログラムを記録した記録媒体 | |
TW202109349A (zh) | 通訊伺服器裝置、通訊裝置及其操作方法 | |
JP4922252B2 (ja) | 効果表現提示装置及びその方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220301 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220420 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220802 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220815 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7135399 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |