JP2008234099A - 文字列検索装置及び文字列検索方法 - Google Patents
文字列検索装置及び文字列検索方法 Download PDFInfo
- Publication number
- JP2008234099A JP2008234099A JP2007069925A JP2007069925A JP2008234099A JP 2008234099 A JP2008234099 A JP 2008234099A JP 2007069925 A JP2007069925 A JP 2007069925A JP 2007069925 A JP2007069925 A JP 2007069925A JP 2008234099 A JP2008234099 A JP 2008234099A
- Authority
- JP
- Japan
- Prior art keywords
- search
- character string
- expression
- numeric
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】数字表現された文字を検索することを指定するための特定文字を含む数字表現された文字を検索するための検索式を入力する検索式入力手段と、検索対象のテキストの中から数字表現された文字列を検出する数字表現検出手段と、検索式入力手段により入力された検索式に基づいて、数字表現検出手段により検出された数字表現された文字列を含む検索式と一致する文字列を検索対象のテキストの中から検索し、検索結果として出力する検索手段とを具備することを特徴とする。
【選択図】 図1
Description
次に、ステップS33の判定で、形態素が数字表現と判定された場合、数字属性の付与、正規化を行う(S34)。
解析前:私は二十四日に四日市に行きました。
解析前:I am twenty-four years old.
形態素解析後:I/am/twenty-four/years/old.
数字属性付与・正規化後:I/am/si(24)/years/old.
(例文3)
解析前:They sleep more than two-thirds of the day.
形態素解析後:They/sleep/more/than/two-thirds/of/the day.
数字属性付与・正規化後:They/sleep/more/than/sf(2/3)/of/the day.
(例文4)
解析前:三分の二の会員が賛成しています。
解析前:ドル円の相場が116.76です。
検索文字列:#日
検索対象文:私は二十四日に四日市に行きました
オプション:なし
例1では、オプションが「なし」であるので、数字表現はアラビア数字の検索という条件となる。この条件で照合すると何も一致しない。
検索文字列:#日
検索対象文:私は二十四日に四日市に行きました
オプション:漢数字を含む
例2では、オプションが「漢数字を含む」であるので、数字表現はアラビア数字及び漢数字の検索という条件となる。この条件で照合すると「二十四日」が一致し検索結果となる。
検索文字列:#
検索対象文:Part I How to Install TTP System.
オプション:ローマ数字を含む
例3では、オプションが「ローマ数字を含む」であるので、数字表現はアラビア数字及びローマ数字の検索という条件となる。この条件で照合すると「I」が一致し検索結果となる。
検索文字列:#
検索対象文:売り上げが5億6千万円です。
例4では、オプションが「漢数字を含む」であるので、数字表現はアラビア数字及び漢数字の検索という条件となる。この条件で照合すると「5億6千万」が一致し検索結果となる。
検索文字列:#
検索対象文:生産高は昨年の1.5倍になった
オプション:小数を含む
例5では、オプションが「小数を含む」であるので、数字表現はアラビア数字及び小数の検索という条件となる。この条件で照合すると「1.5」 が一致し検索結果となる。
検索文字列:#
検索対象文:私は二十四日に四日市に行きました
オプション:漢数字を含む
例6では、オプションが「漢数字を含む」であるので、数字表現はアラビア数字及び漢数字の検索という条件となる。この条件で照合すると「二十四」が一致し検索結果となる。「四日市」の「四」は数字表現でないと判断される。
検索文字列:24
検索対象文:私は十四日と二十四日に四日市に行きました
オプション:漢数字を含む
例7では、オプションが「漢数字を含む」であるので、数字表現はアラビア数字及び漢数字の検索という条件となる。この条件で検索を行うと「十四」と「二十四」が一致し検索結果となる。「四日市」の「四」は数字表現でないと判断される。
Claims (6)
- テキストの中から数字表現された文字列を含む文字列を検索するための文字列検索装置であって、
数字表現された文字を検索することを指定するための特定文字を含む数字表現された文字を検索するための検索式を入力する検索式入力手段と、
検索対象のテキストの中から数字表現された文字列を検出する数字表現検出手段と、
前記検索式入力手段により入力された前記検索式に基づいて、前記数字表現検出手段により検出された数字表現された文字列を含む前記検索式と一致する文字列を前記検索対象のテキストの中から検索し、検索結果として出力する検索手段とを具備することを特徴とする文字列検索装置。 - テキストの中から数字表現された文字列を含む文字列を検索するための文字列検索装置であって、
数字表現された文字を検索することを指定するための特定文字を含む数字表現された文字列を検索するための検索式と、複数種の数字表現の中からどの種類の数字表現された文字列を検索対象とするかの指定情報とを入力する検索式入力手段と、
検索対象のテキストの中から複数種の数字表現された文字列を検出し、この検出した複数種の数字表現された文字列を統一された数字表現に変換する数字表現検出手段と、
前記検索式入力手段により入力された前記検索式に基づいて、前記指定情報で指定された種類の数字表現された文字列を含む前記検索式と一致する文字列を前記検索対象のテキストの中から検索し検索結果として出力する検索手段とを具備することを特徴とする文字列検索装置。 - 前記数字表現検出手段は、検索対象のテキストから抽出した元となる数字表現された文字列を特定種類の数字表現された数字文字列と、前記元となる数字表現された文字列における数字表現の種類を特定する属性情報とから構成される統一された数字表現に変換することを特徴とする請求項2記載の文字列検索装置。
- テキストの中から数字表現された文字列を含む文字列を検索するための文字列検索方法であって、
数字表現された文字を検索することを指定するための特定文字を含む数字表現された文字を検索するための検索式を入力する検索式入力ステップと、
検索対象のテキストの中から数字表現された文字列を検出する数字表現検出ステップと、
前記検索式入力ステップで入力された前記検索式に基づいて、前記数字表現検出ステップで検出された数字表現された文字列を含む前記検索式と一致する文字列を前記検索対象のテキストの中から検索し、検索結果として出力する検索ステップとを具備することを特徴とする文字列検索方法。 - テキストの中から数字表現された文字列を含む文字列を検索するための文字列検索方法であって、
数字表現された文字を検索することを指定するための特定文字を含む数字表現された文字列を検索するための検索式と、複数種の数字表現の中からどの種類の数字表現された文字列を検索対象とするかの指定情報とを入力する検索式入力ステップと、
検索対象のテキストの中から複数種の数字表現された文字列を検出し、この検出した複数種の数字表現された文字列を統一された数字表現に変換する数字表現検出ステップと、
前記検索式入力ステップで入力された前記検索式に基づいて、前記指定情報で指定された種類の数字表現された文字列を含む前記検索式と一致する文字列を前記検索対象のテキストの中から検索し検索結果として出力する検索ステップとを具備することを特徴とする文字列検索方法。 - 前記数字表現検出ステップは、検索対象のテキストから抽出した元となる数字表現された文字列を特定種類の数字表現された数字文字列と、前記元となる数字表現された文字列における数字表現の種類を特定する属性情報とから構成される統一された数字表現に変換することを特徴とする請求項5記載の文字列検索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007069925A JP4922030B2 (ja) | 2007-03-19 | 2007-03-19 | 文字列検索装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007069925A JP4922030B2 (ja) | 2007-03-19 | 2007-03-19 | 文字列検索装置、方法及びプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010095987A Division JP2010186486A (ja) | 2010-04-19 | 2010-04-19 | 文字列検索装置及び文字列検索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008234099A true JP2008234099A (ja) | 2008-10-02 |
JP4922030B2 JP4922030B2 (ja) | 2012-04-25 |
Family
ID=39906823
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007069925A Active JP4922030B2 (ja) | 2007-03-19 | 2007-03-19 | 文字列検索装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4922030B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210056814A (ko) * | 2019-11-11 | 2021-05-20 | 한림대학교 산학협력단 | 연구문헌 내 전자기장 주파수 대역 정보 추출 장치, 방법 및 프로그램 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6373423A (ja) * | 1986-09-17 | 1988-04-04 | Matsushita Electric Ind Co Ltd | 情報の登録、検索装置 |
-
2007
- 2007-03-19 JP JP2007069925A patent/JP4922030B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6373423A (ja) * | 1986-09-17 | 1988-04-04 | Matsushita Electric Ind Co Ltd | 情報の登録、検索装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210056814A (ko) * | 2019-11-11 | 2021-05-20 | 한림대학교 산학협력단 | 연구문헌 내 전자기장 주파수 대역 정보 추출 장치, 방법 및 프로그램 |
KR102339714B1 (ko) * | 2019-11-11 | 2021-12-14 | 한림대학교 산학협력단 | 연구문헌 내 전자기장 주파수 대역 정보 추출 장치, 방법 및 프로그램 |
Also Published As
Publication number | Publication date |
---|---|
JP4922030B2 (ja) | 2012-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI470450B (zh) | 多合一中文輸入方法及其電子裝置 | |
JP5241828B2 (ja) | 辞書の単語及び熟語の判定 | |
US9639518B1 (en) | Identifying entities in a digital work | |
KR20140012883A (ko) | 입력 지원 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체, 입력 지원 방법 및 입력 지원 장치 | |
JP2006099428A (ja) | 文書要約作成システム、方法、及びプログラム | |
JP2013016036A (ja) | 文書部品生成方法及び計算機システム | |
JP4922030B2 (ja) | 文字列検索装置、方法及びプログラム | |
JP2008059389A (ja) | 語彙候補出力システム、語彙候補出力方法及び語彙候補出力プログラム | |
JP3803253B2 (ja) | 漢字入力のための方法および装置 | |
JP2010186486A (ja) | 文字列検索装置及び文字列検索方法 | |
JPH06195371A (ja) | 未登録語獲得方式 | |
JP4535186B2 (ja) | 辞書機能を備えた電子装置およびプログラム | |
JP4004060B1 (ja) | 文字検索方法 | |
JPH06266769A (ja) | 同義語情報作成装置 | |
US20140111438A1 (en) | System, method and apparatus for the transcription of data using human optical character matching (hocm) | |
JPH08115330A (ja) | 類似文書検索方法および装置 | |
JP5233424B2 (ja) | 検索装置およびプログラム | |
JP3266755B2 (ja) | 中国語情報処理装置 | |
JPH0944521A (ja) | インデックス作成装置および文書検索装置 | |
JP2009181524A (ja) | 文書検索システム及び文書検索方法 | |
JP2016207036A (ja) | 支援装置、支援方法及び支援プログラム | |
JP2024017326A (ja) | 検索装置、検索方法およびプログラム | |
JP5741298B2 (ja) | 辞書作成装置、辞書作成方法、およびプログラム | |
JP5610019B2 (ja) | 検索装置およびプログラム | |
JPH0950442A (ja) | 多言語文書登録検索装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091027 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091215 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20100119 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7426 Effective date: 20100408 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100419 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20100408 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20100507 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20100604 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111207 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120203 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4922030 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150210 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |