JP4721344B2 - 単語検索装置、単語検索方法及びプログラム - Google Patents
単語検索装置、単語検索方法及びプログラム Download PDFInfo
- Publication number
- JP4721344B2 JP4721344B2 JP2005372859A JP2005372859A JP4721344B2 JP 4721344 B2 JP4721344 B2 JP 4721344B2 JP 2005372859 A JP2005372859 A JP 2005372859A JP 2005372859 A JP2005372859 A JP 2005372859A JP 4721344 B2 JP4721344 B2 JP 4721344B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- character
- words
- evaluation value
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
請求項2の発明は、請求項1に記載の単語検索装置において、前記単語記憶部に記憶される前記複数の単語は、該単語毎に単語IDが対応して記憶され、前記単語索引部に記憶される文字に関連付けられた単語は、前記単語IDを用いて関連付けられることを特徴とする単語検索装置である。
請求項3の発明は、請求項1または2に記載の単語検索装置において、前記文字評価値算出部は、文字頻度が小さい程高い評価値を与えることを特徴とする単語検索装置である。
請求項4の発明は、請求項1乃至3のいずれか一項に記載の単語検索装置において、前記文字評価値算出部は、前記文字頻度および前記単語記憶部に記憶された単語の総数に基づいて評価値を算出することを特徴とする単語検索装置である。
請求項5の発明は、請求項1乃至4のいずれか一項に記載の単語検索装置において、前記検索対象である単語を入力する単語入力部をさらに備えることを特徴とする単語検索装置である。
請求項6の発明は、複数の単語を記憶する単語記憶部と、複数の文字と、該文字毎に、前記複数の単語のうち前記文字を含む単語を関連付けて記憶する単語索引部とを備えた単語検索装置における単語検索方法であって、入力された検索対象である単語中の文字毎に、該文字に関連付けられた単語の数を、前記単語索引部を参照することで文字頻度として算出する文字頻度算出工程と、該算出された文字頻度に応じて該文字の評価値を算出する文字評価値算出工程と、該算出された評価値を用いて、前記入力された単語中の文字を含む前記単語記憶部に記憶される単語の類似度を算出する単語類似度算出工程と、を備えたことを特徴とする単語検索方法である。
請求項7の発明は、複数の単語を記憶する単語記憶部と、複数の文字と、該文字毎に、前記複数の単語のうち前記文字を含む単語を関連付けて記憶する単語索引部とを備えた単語検索装置のコンピュータを、入力された検索対象である単語中の文字毎に、該文字に関連付けられた単語の数を、前記単語索引部を参照することで文字頻度として算出する文字頻度算出部と、該算出された文字頻度に応じて該文字の評価値を算出する文字評価値算出部と、該算出された評価値を用いて、前記入力された単語中の文字を含む前記単語記憶部に記憶される単語の類似度を算出する単語類似度算出部と、して機能させるためのプログラムである。
図1は、本発明の実施形態の単語検索装置の構成を示すブロック図である。この単語検索装置1は、制御装置2と、それぞれ制御装置2に接続された操作装置3、表示装置4、及び記憶装置5からなる。
まず、入力部13に検索対象の単語が入力され、記憶される(ステップST1)。ここでは、検索対象として、単語「文書検索」が入力されたものとする。単語「文書検索」が記憶されると、検索部14は、単語「文書検索」に含まれている文字である「文」、「書」、「検」、「索」を順次取り出す(ステップST2)。
S=log(N/F+1)・・・式[1]
Claims (7)
- 複数の単語を記憶する単語記憶部と、
複数の文字と、該文字毎に、前記複数の単語のうち前記文字を含む単語を関連付けて記憶する単語索引部と、
入力された検索対象である単語中の文字毎に、該文字に関連付けられた単語の数を、前記単語索引部を参照することで文字頻度として算出する文字頻度算出部と、
該算出された文字頻度に応じて該文字の評価値を算出する文字評価値算出部と、
該算出された評価値を用いて、前記入力された単語中の文字を含む前記単語記憶部に記憶される単語の類似度を算出する単語類似度算出部と、
を備えたことを特徴とする単語検索装置。 - 請求項1に記載の単語検索装置において、
前記単語記憶部に記憶される前記複数の単語は、該単語毎に単語IDが対応して記憶され、前記単語索引部に記憶される文字に関連付けられた単語は、前記単語IDを用いて関連付けられることを特徴とする単語検索装置。 - 請求項1または2に記載の単語検索装置において、
前記文字評価値算出部は、文字頻度が小さい程高い評価値を与えることを特徴とする単語検索装置。 - 請求項1乃至3のいずれか一項に記載の単語検索装置において、
前記文字評価値算出部は、前記文字頻度および前記単語記憶部に記憶された単語の総数に基づいて評価値を算出することを特徴とする単語検索装置。 - 請求項1乃至4のいずれか一項に記載の単語検索装置において、
前記検索対象である単語を入力する単語入力部をさらに備えることを特徴とする単語検索装置。 - 複数の単語を記憶する単語記憶部と、複数の文字と、該文字毎に、前記複数の単語のうち前記文字を含む単語を関連付けて記憶する単語索引部とを備えた単語検索装置における単語検索方法であって、
入力された検索対象である単語中の文字毎に、該文字に関連付けられた単語の数を、前記単語索引部を参照することで文字頻度として算出する文字頻度算出工程と、
該算出された文字頻度に応じて該文字の評価値を算出する文字評価値算出工程と、
該算出された評価値を用いて、前記入力された単語中の文字を含む前記単語記憶部に記憶される単語の類似度を算出する単語類似度算出工程と、
を備えたことを特徴とする単語検索方法。 - 複数の単語を記憶する単語記憶部と、複数の文字と、該文字毎に、前記複数の単語のうち前記文字を含む単語を関連付けて記憶する単語索引部とを備えた単語検索装置のコンピュータを、
入力された検索対象である単語中の文字毎に、該文字に関連付けられた単語の数を、前記単語索引部を参照することで文字頻度として算出する文字頻度算出部と、
該算出された文字頻度に応じて該文字の評価値を算出する文字評価値算出部と、
該算出された評価値を用いて、前記入力された単語中の文字を含む前記単語記憶部に記憶される単語の類似度を算出する単語類似度算出部と、
して機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005372859A JP4721344B2 (ja) | 2005-12-26 | 2005-12-26 | 単語検索装置、単語検索方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005372859A JP4721344B2 (ja) | 2005-12-26 | 2005-12-26 | 単語検索装置、単語検索方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007172539A JP2007172539A (ja) | 2007-07-05 |
JP4721344B2 true JP4721344B2 (ja) | 2011-07-13 |
Family
ID=38298979
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005372859A Active JP4721344B2 (ja) | 2005-12-26 | 2005-12-26 | 単語検索装置、単語検索方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4721344B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5560105B2 (ja) * | 2010-06-08 | 2014-07-23 | 株式会社エヌ・ティ・ティ・データ | 文字列選択装置、文字列選択方法およびプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06274701A (ja) * | 1993-03-22 | 1994-09-30 | N T T Data Tsushin Kk | 単語照合装置 |
JPH1185776A (ja) * | 1997-09-02 | 1999-03-30 | Canon Inc | 情報処理装置及びその方法、記憶媒体 |
-
2005
- 2005-12-26 JP JP2005372859A patent/JP4721344B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06274701A (ja) * | 1993-03-22 | 1994-09-30 | N T T Data Tsushin Kk | 単語照合装置 |
JPH1185776A (ja) * | 1997-09-02 | 1999-03-30 | Canon Inc | 情報処理装置及びその方法、記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP2007172539A (ja) | 2007-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9842110B2 (en) | Content based similarity detection | |
US9477703B1 (en) | Item version similarity scoring system | |
CN107122400A (zh) | 用户查询结果的视觉提示细化 | |
US11531693B2 (en) | Information processing apparatus, method and non-transitory computer readable medium | |
JP6180470B2 (ja) | 文章候補提示端末、文章候補提示システム、文章候補提示方法、及びプログラム | |
CN113449187A (zh) | 基于双画像的产品推荐方法、装置、设备及存储介质 | |
JP2008198132A (ja) | 固有表現抽出プログラム、固有表現抽出方法および固有表現抽出装置 | |
CN109284497B (zh) | 用于识别自然语言的医疗文本中的医疗实体的方法和装置 | |
JP5687312B2 (ja) | デジタル情報分析システム、デジタル情報分析方法、及びデジタル情報分析プログラム | |
JP4721344B2 (ja) | 単語検索装置、単語検索方法及びプログラム | |
CN107908724B (zh) | 一种数据模型匹配方法、装置、设备及存储介质 | |
JP2019061522A (ja) | 文書推薦システム、文書推薦方法および文書推薦プログラム | |
CN111949767A (zh) | 一种文本关键词的查找方法、装置、设备和存储介质 | |
JP4972271B2 (ja) | 検索結果提示装置 | |
JP2010250389A (ja) | 情報検索システム、方法及びプログラム、索引作成システム、方法及びプログラム、 | |
JP6181890B2 (ja) | 文献解析装置、文献解析方法およびプログラム | |
KR20170085736A (ko) | 전자 출판물에 대한 정보를 생성하는 장치 및 방법 | |
JP5400688B2 (ja) | 提案仕様書作成支援方法、プログラムおよび提案仕様書作成支援装置 | |
US7933853B2 (en) | Computer-readable recording medium, apparatus and method for calculating scale-parameter | |
JP7131518B2 (ja) | 電子機器、発音学習方法、サーバ装置、発音学習処理システムおよびプログラム | |
JP4574186B2 (ja) | 重要言語識別方法、重要言語識別プログラム、重要言語識別装置、文書検索装置およびキーワード抽出装置 | |
Mealand | Hellenistic Greek and the New Testament: A Stylometric Perspective | |
JP7295463B2 (ja) | 業務フロー作成支援装置、業務フロー作成支援方法、および、業務フロー作成支援プログラム | |
TWI716153B (zh) | 檢索系統及其運作方法 | |
JP2017097451A (ja) | 情報処理方法、情報処理プログラムおよび情報処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081024 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20101228 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110117 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110315 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110401 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110401 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140415 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4721344 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |