JP6511874B2 - コンピュータプログラム、検索装置及び検索方法 - Google Patents
コンピュータプログラム、検索装置及び検索方法 Download PDFInfo
- Publication number
- JP6511874B2 JP6511874B2 JP2015046062A JP2015046062A JP6511874B2 JP 6511874 B2 JP6511874 B2 JP 6511874B2 JP 2015046062 A JP2015046062 A JP 2015046062A JP 2015046062 A JP2015046062 A JP 2015046062A JP 6511874 B2 JP6511874 B2 JP 6511874B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- sentence
- string
- character string
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
以下、実施の形態を、図面を参照して説明する。図1はテキスト入力支援システムの構成例を示す説明図である。テキスト入力支援システムはテキスト入力支援装置(検索装置)1、文例データベース2を含む。各装置はネットワークNより接続されている。
sk1=(*を削除したsk)+次の文字+*
sk2=sk+◆+次の文字+*
実施の形態2では、入力部15を介して、入力キーワードを一文字ずつ読み込み、読み込む毎に検索を行う、インクリメンタルサーチを行う。実施の形態2において、テキスト入力支援装置1及び文例データベース2の構成は、実施の形態1と同様であるので、説明を省略する。図7は入力支援処理の手順を示すフローチャートである。テキスト入力支援装置1のCPU11は、入力部15を介して、入力キーワードを一文字、読み込む(ステップS31)。次に、CPU11は、内部検索キー更新処理を行う(ステップS32)。この内部検索キー更新処理は、図5を参照して説明した処理と同様である。CPU11は、内部検索キー領域から内部検索キーを1つ読み込む(ステップS33)。CPU11は、読み込んだ内部検索キーにより、文例検索を行う(ステップS34)。CPU11は、検索によりヒット文例があるか否かを判定する(ステップS35)。CPU11は、検索にヒットする文例があると判定した場合(ステップS35でYES)、処理をステップS37に進める。CPU11は、検索により文例がヒットしなかったと判定した場合(ステップS35でNO)、内部検索キーを内部検索キー領域から削除する(ステップS36)。CPU11は内部検索キー領域に未処理の他の内部検索キーがあるか否かを判定する(ステップS37)。CPU11は内部検索キー領域に未処理の他の内部検索キーがあると判定した場合(ステップS37でYES)、処理をステップS33へ戻す。
実施の形態3では、検索結果を表示する際に、入力キーワードにマッチした部分をハイライト、アンダーライン、太字など、他の部分とは視覚的に区別がつくようにする。実施の形態3において、テキスト入力支援装置1及び文例データベース2の構成は、実施の形態2と同様であるので、説明を省略する。また、テキスト入力支援装置1で行われる処理についても、同様であるので、説明を省略する。
次に、文例データベース作成処理について説明する。上述の説明においては、文例データベース2は既存のものであるとして説明したが、テキスト入力支援装置1により、作成・更新されても良い。図11は文例データベース作成処理の手順を示すフローチャートである。CPU11は、文例を一行読み込む(ステップS51)。処理対象となる新たな文例は、大容量記憶装置14等に記憶されているものとする。CPU11は、読み込んだ一行の形態素解析を行う(ステップS52)。CPU11は、形態素解析を元に、文節合成を行う(ステップS53)。なお、形態素解析及び文節合成は、従来技術と同様であるので、説明を省略する。CPU11は、文節間に区切り記号(◆)を挿入する(ステップS54)。CPU11は、文節合成し区切り記号を挿入した文例を読みに変換する(ステップS55)。CPU11は、ステップS51で読み込んだ文例と、ステップS55で得た変換文を対応付けて、文例データベース2に記憶する(ステップS56)。CPU11は、未処理の文例があるか否かを判定する(ステップS57)。CPU11は、未処理の文例があると判定した場合(ステップS57でYES)、処理をステップS51に戻す。CPU11は、未処理の文例がないと判定した場合(ステップS57でNO)、処理を終了する。
実施の形態4は、テキスト入力支援システムをクライアントサーバシステムとする形態である。図12はテキスト入力支援システムの構成例を示す説明図である。テキスト入力支援システムは、テキスト入力支援装置1、文例データベース2、クライアント4を含む。各装置はネットワークNより接続されている。テキスト入力支援装置1、文例データベース2の構成は、実施の形態1と同様であるので、説明を省略する。
取得部11aは、文字列を取得する。生成部11bは、取得した文字列から区切り記号を挿入した検索文字列を生成する。検索部11cは、文例を文節単位に分割した文節文字列の組合せにより構成した複数の検索対象文例から、前記区切り記号で区切られる各部分文字列を、文節文字列の先頭文字列として含むものを検索する。出力部11dは、検索にヒットした検索対象文例に対応する文例を出力する。
今回開示された実施の形態はすべての点で例示であって、制限的なものでは無いと考えられるべきである。本発明の範囲は、上記した意味では無く、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。
文字列を取得し、
取得した文字列から区切り記号を挿入した検索文字列を生成し、
文例を文節単位に分割した文節文字列を組み合わせた複数の検索対象文例を記憶する記憶部から、前記区切り記号で区切られる検索文字列の各部分文字列が文節文字列の先頭に含まれる前記検索対象文例を検索し、
検索にヒットした検索対象文例に対応する文例を出力する
処理をコンピュータに行わせるコンピュータプログラム。
前記取得した文字列より一文字ずつ切り出し、
先に生成し残っている検索文字列に、区切り記号及び切り出した文字を結合した検索文字列と、切り出した文字のみを結合する検索文字列とを生成し、
生成した2つの検索文字列により前記検索対象文例を検索し、検索にヒットする検索文字列を残す処理を繰り返し、
前記取得した文字列より切り出す文字がなくなった場合に、検索を終了し、文例を出力する
付記1に記載のコンピュータプログラム。
前記文字列を構成する文字を取得するたびに、先に生成し残っている検索文字列に、区切り記号及び取得した文字を結合した検索文字列と、取得した文字のみを結合する検索文字列とを生成し、
生成した2つの検索文字列により前記検索対象文例を検索し、
検索にヒットする検索文字列を残し、
残した検索文字列による検索にヒットした検索対象文例に対応する文例を出力する
付記1に記載のコンピュータプログラム。
前記検索対象文例は前記文例に含まれる漢字を読みに変換したものであり、
読みを文字列として取得する
付記1から付記3のいずれか1つに記載のコンピュータプログラム。
検索にヒットした部分を明示した文例を出力する
付記1から付記4のいずれか1つに記載のコンピュータプログラム。
文字列を取得する取得部と、
取得した文字列から区切り記号を挿入した検索文字列を生成する生成部と、
文例を文節単位に分割した文節文字列を組み合わせた複数の検索対象文例を記憶する記憶部から、前記区切り記号で区切られる検索文字列の各部分文字列が文節文字列の先頭に含まれる前記検索対象文例を検索する検索部と、
検索にヒットした検索対象文例に対応する文例を出力する出力部と
を備える検索装置。
文字列を取得し、
取得した文字列から区切り記号を挿入した検索文字列を生成し、
文例を文節単位に分割した文節文字列を組み合わせた複数の検索対象文例を記憶する記憶部から、前記区切り記号で区切られる検索文字列の各部分文字列が文節文字列の先頭に含まれる前記検索対象文例を検索し、
検索にヒットした検索対象文例に対応する文例を出力する
処理をコンピュータにより行う検索方法。
11 CPU
11a 取得部
11b 生成部
11c 検索部
11d 出力部
12 RAM
13 ROM
14 大容量記憶装置
15 入力部
16 出力部
17 通信部
18 読み取り部
1a 可搬型記憶媒体
1b 半導体メモリ
1P 制御プログラム
2 文例データベース
3 オフセットテーブル
4 クライアント
N ネットワーク
Claims (6)
- 文字列を取得し、
取得した文字列から区切り記号を挿入した検索文字列を生成し、
文例を文節単位に分割した文節文字列を組み合わせた複数の検索対象文例を記憶する記憶部から、前記区切り記号で区切られる検索文字列の各部分文字列が文節文字列の先頭に含まれる前記検索対象文例を検索し、
検索にヒットした検索対象文例に対応する文例を出力する
処理をコンピュータに行わせるコンピュータプログラム。 - 前記取得した文字列より一文字ずつ切り出し、
先に生成し残っている検索文字列に、区切り記号及び切り出した文字を結合した検索文字列と、切り出した文字のみを結合する検索文字列とを生成し、
生成した2つの検索文字列により前記検索対象文例を検索し、検索にヒットする検索文字列を残す処理を繰り返し、
前記取得した文字列より切り出す文字がなくなった場合に、検索を終了し、文例を出力する
請求項1に記載のコンピュータプログラム。 - 前記文字列を構成する文字を取得するたびに、先に生成し残っている検索文字列に、区切り記号及び取得した文字を結合した検索文字列と、取得した文字のみを結合する検索文字列とを生成し、
生成した2つの検索文字列により前記検索対象文例を検索し、
検索にヒットする検索文字列を残し、
残した検索文字列による検索にヒットした検索対象文例に対応する文例を出力する
請求項1に記載のコンピュータプログラム。 - 取得した前記文字列が漢字を含む文字列である場合に、前記文字列に含まれる漢字を読み仮名に変換して前記検索文字列を生成する、
処理をさらにコンピュータに行わせる請求項1に記載のコンピュータプログラム。 - 文字列を取得する取得部と、
取得した文字列から区切り記号を挿入した検索文字列を生成する生成部と、
文例を文節単位に分割した文節文字列を組み合わせた複数の検索対象文例を記憶する記憶部から、前記区切り記号で区切られる検索文字列の各部分文字列が文節文字列の先頭に含まれる前記検索対象文例を検索する検索部と、
検索にヒットした検索対象文例に対応する文例を出力する出力部と
を備える検索装置。 - 文字列を取得し、
取得した文字列から区切り記号を挿入した検索文字列を生成し、
文例を文節単位に分割した文節文字列を組み合わせた複数の検索対象文例を記憶する記憶部から、前記区切り記号で区切られる検索文字列の各部分文字列が文節文字列の先頭に含まれる前記検索対象文例を検索し、
検索にヒットした検索対象文例に対応する文例を出力する
処理をコンピュータにより行う検索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015046062A JP6511874B2 (ja) | 2015-03-09 | 2015-03-09 | コンピュータプログラム、検索装置及び検索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015046062A JP6511874B2 (ja) | 2015-03-09 | 2015-03-09 | コンピュータプログラム、検索装置及び検索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016167135A JP2016167135A (ja) | 2016-09-15 |
JP6511874B2 true JP6511874B2 (ja) | 2019-05-15 |
Family
ID=56898498
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015046062A Active JP6511874B2 (ja) | 2015-03-09 | 2015-03-09 | コンピュータプログラム、検索装置及び検索方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6511874B2 (ja) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH04259067A (ja) * | 1991-02-14 | 1992-09-14 | Canon Inc | 文書処理装置 |
JP2002056026A (ja) * | 2000-08-09 | 2002-02-20 | Ishida Co Ltd | 商品情報検索装置および記憶媒体 |
US7756859B2 (en) * | 2005-12-19 | 2010-07-13 | Intentional Software Corporation | Multi-segment string search |
-
2015
- 2015-03-09 JP JP2015046062A patent/JP6511874B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016167135A (ja) | 2016-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7979268B2 (en) | String matching method and system and computer-readable recording medium storing the string matching method | |
JP2007004633A (ja) | 言語モデル作成装置およびそれにより作成された言語モデルを使用する言語処理装置 | |
US20050267734A1 (en) | Translation support program and word association program | |
JP2007328654A (ja) | 検索装置、検索プログラムおよび検索方法 | |
JP2013196358A (ja) | 検索支援装置および検索支援方法 | |
JP2020140503A (ja) | 文書検索装置及び文書検索方法 | |
CN112765976A (zh) | 文本相似度计算方法、装置、设备及存储介质 | |
JP4845523B2 (ja) | 文字処理装置、方法、プログラムおよび記録媒体 | |
JP5112027B2 (ja) | 文書群提示装置および文書群提示プログラム | |
KR101835994B1 (ko) | 키워드 맵을 이용한 전자책 검색 서비스 제공 방법 및 장치 | |
JP6511874B2 (ja) | コンピュータプログラム、検索装置及び検索方法 | |
JP2012141681A (ja) | クエリセグメント位置決定装置 | |
JP5851130B2 (ja) | 日本語のための音声キー | |
JP6619932B2 (ja) | 形態素解析装置およびプログラム | |
JP5903171B2 (ja) | データ加工システムおよびデータ加工方法 | |
JP2010009237A (ja) | 多言語間類似文書検索装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 | |
JP6805927B2 (ja) | インデックス生成プログラム、データ検索プログラム、インデックス生成装置、データ検索装置、インデックス生成方法、及びデータ検索方法 | |
JP2010146061A (ja) | 例文表示装置、例文表示方法および例文表示プログラム | |
JP6753190B2 (ja) | 文書検索装置及びプログラム | |
JP2010250389A (ja) | 情報検索システム、方法及びプログラム、索引作成システム、方法及びプログラム、 | |
JP2019008477A (ja) | 判別プログラム、判別装置及び判別方法 | |
JP2004334690A (ja) | 文字データ入出力装置、文字データ入出力方法、文字データ入出力プログラム、およびコンピュータ読み取り可能な記録媒体 | |
JP5262190B2 (ja) | 入力補完装置、及び入力補完プログラム | |
JP5998779B2 (ja) | 検索装置、検索方法、及びプログラム | |
US20230409620A1 (en) | Non-transitory computer-readable recording medium storing information processing program, information processing method, information processing device, and information processing system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20181120 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20181121 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190118 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190312 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190325 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6511874 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |