JP2018180808A - 解析プログラム、解析方法および解析装置 - Google Patents
解析プログラム、解析方法および解析装置 Download PDFInfo
- Publication number
- JP2018180808A JP2018180808A JP2017077561A JP2017077561A JP2018180808A JP 2018180808 A JP2018180808 A JP 2018180808A JP 2017077561 A JP2017077561 A JP 2017077561A JP 2017077561 A JP2017077561 A JP 2017077561A JP 2018180808 A JP2018180808 A JP 2018180808A
- Authority
- JP
- Japan
- Prior art keywords
- index
- bit map
- data
- bitmap
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
単語またはフレーズが登録された、複数の登録項目を有する辞書を基にして、前記複数の登録項目それぞれに関するインデックスを生成し、
前記インデックスに、前記複数の登録項目それぞれについて、各項目の先頭と末尾とを判別可能なフラグを設定し、
前記インデックスを用いて、入力された文字データから複数の分割可能な単語またはフレーズを抽出する
処理を実行させる解析プログラム。
単語またはフレーズが登録された、複数の登録項目を有する辞書を基にして、前記複数の登録項目それぞれに関するインデックスを生成し、
前記インデックスに、前記複数の登録項目それぞれについて、各項目の先頭と末尾とを判別可能なフラグを設定し、
前記インデックスを用いて、入力された文字データから複数の分割可能な単語またはフレーズを抽出する
処理を実行する解析方法。
前記インデックスを用いて、入力された文字データから複数の分割可能な単語またはフレーズを抽出する抽出部と
を有することを特徴とする解析装置。
110 通信部
120 入力部
130 表示部
140 記憶部
140a 文字列データ
140b 辞書データ
140c 配列データ
140d インデックス
140e 抽出結果
145 インデックスデータ
150 制御部
150a 設定部
150b 抽出部
Claims (6)
- コンピュータに、
単語またはフレーズが登録された、複数の登録項目を有する辞書を基にして、前記複数の登録項目それぞれに関するインデックスを生成し、
前記インデックスに、前記複数の登録項目それぞれについて、各項目の先頭と末尾とを判別可能なフラグを設定し、
前記インデックスを用いて、入力された文字データから複数の分割可能な単語またはフレーズを抽出する
処理を実行させる解析プログラム。 - 前記辞書に登録されたフレーズそれぞれは、複数の単語で構成され、かつ、独立した意味を持つ請求項1に記載の解析プログラム。
- 前記フラグを設定する処理は、前記文字データについて、前記複数の登録項目それぞれの存否を示すインデックスを生成する請求項1または2に記載の解析プログラム。
- 前記インデックスは、前記複数の登録項目それぞれについて、前記文字データ中の位置に関する情報を含む請求項1、2または3に記載の解析プログラム。
- コンピュータが実行する解析方法であって、
単語またはフレーズが登録された、複数の登録項目を有する辞書を基にして、前記複数の登録項目それぞれに関するインデックスを生成し、
前記インデックスに、前記複数の登録項目それぞれについて、各項目の先頭と末尾とを判別可能なフラグを設定し、
前記インデックスを用いて、入力された文字データから複数の分割可能な単語またはフレーズを抽出する
処理を実行する解析方法。 - 単語またはフレーズが登録された、複数の登録項目を有する辞書を基にして、前記複数の登録項目それぞれに関するインデックスを生成し、前記インデックスに、前記複数の登録項目それぞれについて、各項目の先頭と末尾とを判別可能なフラグを設定する設定部と、
前記インデックスを用いて、入力された文字データから複数の分割可能な単語またはフレーズを抽出する抽出部と
を有する解析装置。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017077561A JP6880956B2 (ja) | 2017-04-10 | 2017-04-10 | 解析プログラム、解析方法および解析装置 |
US15/940,220 US10936816B2 (en) | 2017-04-10 | 2018-03-29 | Non-transitory computer-readable storage medium, analysis method, and analysis device |
CN201810310516.4A CN108694229B (zh) | 2017-04-10 | 2018-04-03 | 串数据分析装置以及串数据分析方法 |
KR1020180039951A KR20180114513A (ko) | 2017-04-10 | 2018-04-05 | 해석 프로그램, 해석 방법 및 해석 장치 |
EP18165856.8A EP3388953A3 (en) | 2017-04-10 | 2018-04-05 | Non-transitory computer-readable storage medium, string data analysis method, and string data analysis device |
KR1020200187563A KR102355731B1 (ko) | 2017-04-10 | 2020-12-30 | 해석 프로그램, 해석 방법 및 해석 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017077561A JP6880956B2 (ja) | 2017-04-10 | 2017-04-10 | 解析プログラム、解析方法および解析装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018180808A true JP2018180808A (ja) | 2018-11-15 |
JP6880956B2 JP6880956B2 (ja) | 2021-06-02 |
Family
ID=62044474
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017077561A Active JP6880956B2 (ja) | 2017-04-10 | 2017-04-10 | 解析プログラム、解析方法および解析装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10936816B2 (ja) |
EP (1) | EP3388953A3 (ja) |
JP (1) | JP6880956B2 (ja) |
KR (2) | KR20180114513A (ja) |
CN (1) | CN108694229B (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102655250B1 (ko) * | 2023-10-12 | 2024-04-08 | 로지시스템(주) | 이기종 감시제어가 가능한 자동제어시스템을 이용한 감시제어방법 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000231563A (ja) * | 1999-02-09 | 2000-08-22 | Hitachi Ltd | 文書検索方法及び文書検索システム及び文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0724055B2 (ja) * | 1984-07-31 | 1995-03-15 | 株式会社日立製作所 | 単語分割処理方法 |
US4807181A (en) * | 1986-06-02 | 1989-02-21 | Smith Corona Corporation | Dictionary memory with visual scanning from a selectable starting point |
US4868750A (en) * | 1987-10-07 | 1989-09-19 | Houghton Mifflin Company | Collocational grammar system |
JP2833580B2 (ja) * | 1996-04-19 | 1998-12-09 | 日本電気株式会社 | 全文インデックス作成装置および全文データベース検索装置 |
JP3143079B2 (ja) * | 1997-05-30 | 2001-03-07 | 松下電器産業株式会社 | 辞書索引作成装置と文書検索装置 |
JP3636941B2 (ja) | 1999-07-19 | 2005-04-06 | 松下電器産業株式会社 | 情報検索方法と情報検索装置 |
JP2001043221A (ja) * | 1999-07-29 | 2001-02-16 | Matsushita Electric Ind Co Ltd | 中国語単語分割装置 |
JP3318834B2 (ja) * | 1999-07-30 | 2002-08-26 | 三菱電機株式会社 | データファイルシステム及びデータ検索方法 |
WO2004044887A1 (ja) * | 2002-11-11 | 2004-05-27 | Matsushita Electric Industrial Co., Ltd. | 音声認識用辞書作成装置および音声認識装置 |
US7536408B2 (en) | 2004-07-26 | 2009-05-19 | Google Inc. | Phrase-based indexing in an information retrieval system |
US8131758B2 (en) * | 2007-12-26 | 2012-03-06 | Novell, Inc. | Techniques for recognizing multiple patterns within a string |
JP5204244B2 (ja) * | 2008-11-27 | 2013-06-05 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 誤訳の検出を支援する装置及び方法 |
US9026538B2 (en) * | 2009-10-13 | 2015-05-05 | Open Text S.A. | Method for performing transactions on data and a transactional database |
US20130262486A1 (en) * | 2009-11-07 | 2013-10-03 | Robert B. O'Dell | Encoding and Decoding of Small Amounts of Text |
CN101714172B (zh) * | 2009-11-13 | 2012-03-21 | 华中科技大学 | 一种支持访问控制的索引结构的检索方法 |
CN102169495B (zh) * | 2011-04-11 | 2014-04-02 | 趣拿开曼群岛有限公司 | 行业词典生成方法及装置 |
KR101247346B1 (ko) | 2012-03-09 | 2013-03-26 | 윤기오 | 사전 검색 서비스 시스템 및 방법 |
US20140129543A1 (en) * | 2012-11-02 | 2014-05-08 | Microsoft Corporation | Search service including indexing text containing numbers in part using one or more number index structures |
CN103544309B (zh) * | 2013-11-04 | 2017-03-15 | 北京中搜网络技术股份有限公司 | 一种中文垂直搜索的检索串拆分方法 |
CN104572994B (zh) * | 2015-01-06 | 2018-12-14 | 华为技术有限公司 | 用于搜索数据的方法和装置 |
CN105404677B (zh) * | 2015-11-20 | 2018-12-18 | 四川神琥科技有限公司 | 一种基于树形结构的检索方法 |
-
2017
- 2017-04-10 JP JP2017077561A patent/JP6880956B2/ja active Active
-
2018
- 2018-03-29 US US15/940,220 patent/US10936816B2/en active Active
- 2018-04-03 CN CN201810310516.4A patent/CN108694229B/zh active Active
- 2018-04-05 EP EP18165856.8A patent/EP3388953A3/en not_active Ceased
- 2018-04-05 KR KR1020180039951A patent/KR20180114513A/ko active Application Filing
-
2020
- 2020-12-30 KR KR1020200187563A patent/KR102355731B1/ko active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000231563A (ja) * | 1999-02-09 | 2000-08-22 | Hitachi Ltd | 文書検索方法及び文書検索システム及び文書検索プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US20030200211A1 (en) * | 1999-02-09 | 2003-10-23 | Katsumi Tada | Document retrieval method and document retrieval system |
Also Published As
Publication number | Publication date |
---|---|
KR102355731B1 (ko) | 2022-01-25 |
JP6880956B2 (ja) | 2021-06-02 |
CN108694229B (zh) | 2022-06-03 |
US10936816B2 (en) | 2021-03-02 |
US20180293225A1 (en) | 2018-10-11 |
EP3388953A3 (en) | 2018-12-12 |
CN108694229A (zh) | 2018-10-23 |
EP3388953A2 (en) | 2018-10-17 |
KR20180114513A (ko) | 2018-10-18 |
KR20210002435A (ko) | 2021-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2011018330A (ja) | 統計的な方法を用いて漢字を自国語の発音列に変換するシステムおよび方法 | |
JP6753401B2 (ja) | 符号化プログラム、符号化装置、及び符号化方法 | |
JP2018010514A (ja) | 対訳辞書作成装置、対訳辞書作成方法、及び対訳辞書作成プログラム | |
US7941311B2 (en) | System and method for linguistic collation | |
JP2022121456A (ja) | 処理プログラム、処理方法および情報処理装置 | |
JP2002117027A (ja) | 感情情報抽出方法および感情情報抽出プログラムの記録媒体 | |
JP5930228B2 (ja) | 情報処理装置、方法及びプログラム | |
JPWO2020213158A1 (ja) | 特定方法、生成方法、次元圧縮方法、表示方法および情報処理装置 | |
KR102355731B1 (ko) | 해석 프로그램, 해석 방법 및 해석 장치 | |
US8135573B2 (en) | Apparatus, method, and computer program product for creating data for learning word translation | |
EP4220474A1 (en) | Information processing program, information processing method, and information processing device | |
JP7102710B2 (ja) | 情報生成プログラム、単語抽出プログラム、情報処理装置、情報生成方法及び単語抽出方法 | |
JP2019211959A (ja) | 検索方法、検索プログラムおよび検索装置 | |
JP6648421B2 (ja) | 文書を処理する情報処理装置、情報処理方法、およびプログラム | |
WO2022091359A1 (ja) | 情報処理プログラム、情報処理方法および情報処理装置 | |
JP6972653B2 (ja) | 解析プログラム、解析方法および解析装置 | |
JP3952964B2 (ja) | 読み情報決定方法及び装置及びプログラム | |
JP5870744B2 (ja) | 情報処理装置及びプログラム | |
JP5184987B2 (ja) | 索引情報作成装置、索引情報作成方法及びプログラム | |
WO2011118428A1 (ja) | 要求獲得システム、要求獲得方法、及び要求獲得用プログラム | |
JP2019159118A (ja) | 出力プログラム、情報処理装置及び出力制御方法 | |
JP7095264B2 (ja) | 情報生成プログラム、単語抽出プログラム、情報処理装置、情報生成方法及び単語抽出方法 | |
CN117355826A (zh) | 信息处理程序、信息处理方法以及信息处理装置 | |
JP2006134051A (ja) | 翻訳装置、翻訳方法およびプログラム | |
JP2006099668A (ja) | 字句をデータに変換する装置、方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200925 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201006 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210406 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210419 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6880956 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |