JP2008541272A - 署名生成および関連性を有するマッチングエンジン - Google Patents
署名生成および関連性を有するマッチングエンジン Download PDFInfo
- Publication number
- JP2008541272A JP2008541272A JP2008511259A JP2008511259A JP2008541272A JP 2008541272 A JP2008541272 A JP 2008541272A JP 2008511259 A JP2008511259 A JP 2008511259A JP 2008511259 A JP2008511259 A JP 2008511259A JP 2008541272 A JP2008541272 A JP 2008541272A
- Authority
- JP
- Japan
- Prior art keywords
- document
- processor
- list
- text
- characters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
Abstract
【選択図】図1
Description
図3は、本発明における署名生成処理の第1実施形態を示す。本実施形態は、ASCIIコードでエンコードされた英語ドキュメントから署名を生成することを示す。その処理は、ドキュメントを入力することにより開始する(ステップ305)。その処理は、1以上のトークン(トークンリスト)の最初のリストを生成(作成)するために、そのドキュメントを解析する(ステップ310)。一実施形態では、トークンは、予め定められた文字特性により分けられたドキュメントのテキストを含む。予め定められた文字特性の例は、デリミタ(区切り文字)を含む。トークンが分けられると、ステミング、ストップワークまたは小文字の分析等の機能が適用可能である。
L1=(t1,t2,...,tn)
L2=(T1,T2,...,Tm)
ここで、発生の位置をマークするために、Ti〜<P(i,1),P(i,2),...,P(i,Si)>を示す(i=1,...,mであり、S1+S2+...+Sm=nである)。
スコア(Tj)={P(j,Sj)−P(j,1)}×Sj×重み付け(Tj)/Sqrt(Dj)
ここで、Dj={P(j,2)−P(j,1)]2+{P(j,3)−P(j,2)}2...+{P(J,Sj)−P(j,Sj-1)}2である。
さらに、スコア関数は、頻度および割り当てられた重み付けによってテキスト内のあるトークンの重要性を測定する。なお、重み付け()は、予め定義された関数であればよい。一実施形態では、その値は「1」であるが、トークンが「−」、「_」および「@」のような特別な文字を含むならば、代わりの実施形態では、予め割り当てられたある数字、例えば、6.8であってもよい。スコア関数は、Sj×重み付け(Tj)により決定されればよい。スコア関数は、より良いスコアを得るために、ドキュメント全体にトークンを均等に分配するために用いられてもよい。これは、{P(j,Sj)−P(j,1)}/Sqrt(Dj)により決定される。
各kε{P(j,1),P(j,2),....,P(j,Si)}のために、L1における隣接した2番目のトークンを取り出し、tk-d+...+tk-1+tk+tk+1+...+tk+dのストリングを形成するために、それらを鎖状につなぐ。
このストリングのエンコードは、署名Fj,kを我々に与える。
スコア(c)=Sqrt(n)×{P(n,c)−P(1,c)}/Sqrt(D)
ここで、D={P(2,c)−P(1,c)}2+{P(3,c)−P(2,c)}2+...+{P(n,c)−P(n−1,c)}2である。スコア関数は、その頻度によってテキスト内の文字の重要性を測定する。また、スコア関数は、ドキュメント全体に均等に分布した文字がより良いスコアを得ることを確実にする。これを達成する計算は、以下を含む。
{P(n,c)−P(1,c)}/Sqrt(D)
また、本発明におけるシステムは、関連性検出の機会を含んでもよい。関連性検出に対して、各ドキュメントは、アルファベットの文字(ASCII、ユニコードなど)のストリングとして考慮され得る。したがって、2つのドキュメントの関連性は、2つのストリングの類似性に強く関連する。2つのストリングの類似性を定義するための従来のアプローチがある。1つのアプローチは、2つのストリングの最も大きい共通の部分列を得ることである。第2のアプローチは、2つのストリングの最も大きい共通の部分文字列を抽出することである。しかしながら、これらのアプローチの両方は、しばしばその使用を不十分にする制限を有する。最も大きい共通のストリングのアプローチは、他の類似の共通の部分文字列を含まず、そのため、正確ではない。最も大きい共通の部分列のアプローチは、コンテンツ交換(スワッピング)を取り扱うことができず、そのため、また不正確である。
関数SIMが対称ではない、すなわち、SIM(str1,str2)≠SIM(str2,str1)であることを知らせる。例えば、str1=「AAAAACCCCCCCCBBBBBBDDDDDDAAAAAALLLLLLL」およびstr2=「CCCCCCCCCZZZZZAAAAAAABBBBTTTTLLL」を考慮する。部分文字列の長さの要求される最小値は、例えば、M=4として設定されればよい。そして、S=(「AAAAAA」,「CCCCCCCC」,「BBBB」)であり、str2の部分文字列は、類似性を計算する必要があるものである。
SIM(str2,str1)=18/27=67%
int searchMaxMatchLen (intIDX, int start, int end, char *str, int len,
char *str2, int len2) {
int i, j;
if(end-start < 2) {
i = getMaxMatchSize(str+IDX[start], len -IDX[start], str2, len2);
j = getMaxMatchSize(str+IDX[end], len -IDX[end], str2, len2);
if(i >j)
return i;
else
return j; }
i = start+(end-start)/2;
if(strncmp(str+IDX[i], str2, minimum(len-IDX[i], len2)) < 0)
return searchMaxMatchLen (IDX, i, end, str, len, str2, len2);
else
return searchMaxMatchLen (IDX, i, start, str, len, str2, len2); }
int getMaxMatchSize(char *str, int len, char *str2, int len2) {
int i;
for(i = 0; (i < len) && (i < len2); i++)
if(str[i] != str2[i]) break;
return i; }
Claims (38)
- ドキュメントに関連した複数の署名を生成する方法であって、
テキストを含むドキュメントを受信するステップと、
それぞれが予め定められた文字特性によって分けられる前記ドキュメントのテキストに対応する複数のトークンを含むトークンセットを生成するために、前記ドキュメントを解析するステップと、
前記ドキュメント内の前記テキストの頻度および分布に基づいて、前記トークンセット内の各トークンのためのスコアを計算するステップと、
前記計算されたスコアに基づいて、前記トークンセット内の各トークンをランク付けするステップと、
前記ランク付けされたトークンからランク付けされたトークンのサブセットを選択するステップと、
前記選択されたトークンの各発生のための署名を生成するステップと、
を含むことを特徴とする方法。 - 前記予め定められた文字特性はデリミタを含むことを特徴とする請求項1に記載の方法。
- 前記ランク付けされたトークンから前記ランク付けされたトークンのサブセットを選択するステップは、トップにランク付けされたトークンの所定数を選択するステップをさらに含むことを特徴とする請求項1に記載の方法。
- 前記署名の選択されたリストを出力するステップは、あるリスト内のトップの署名の所定数を出力するステップをさらに含むことを特徴とする請求項1に記載の方法。
- 前記ドキュメントはASCIIドキュメントであることを特徴とする請求項1に記載の方法。
- 前記生成された署名のリストを出力するステップをさらに有することを特徴とする請求項1に記載の方法。
- ドキュメントに関連した複数の署名を生成する方法であって、
複数の文字を含むドキュメントを受信するステップと、
前記複数の文字から有益でない文字を取り除くために、前記ドキュメントを標準化するステップと、
前記ドキュメントの発生頻度および分布に基づいて、前記複数の文字の各有益な文字のスコアを計算するステップと、
前記計算されたスコアに基づいて、前記複数の文字の各有益な文字をランク付けするステップと、
前記ランク付けされた有益な文字から文字発生を選択するステップと、
各選択された文字発生のための署名を生成するステップと、
を有することを特徴とする方法。 - 前記文字発生を選択するステップは、ハッシュ値を生成するために、各文字発生の回りのバイトをハッシングするステップと、予め定められたランク付けに前記ハッシュ値をソートするステップとをさらに含むことを特徴とする請求項7に記載の方法。
- 前記署名を生成するステップは、前記選択された文字発生の回りの文字を用いて、前記署名を生成するステップをさらに含むことを特徴とする請求項7に記載の方法。
- 前記文字はUTF−8文字であることを特徴とする請求項7に記載の方法。
- 前記有益でない文字は、余分な空白、制御文字、その組み合わせからなるグループからの一つを含むことを特徴とする請求項7に記載の方法。
- 前記生成された署名のリストを出力するステップをさらに有することを特徴とする請求項7に記載の方法。
- プロセッサに実行可能な指示を格納するよう構成されるコンピュータに読み取り可能な媒体であって、前記指示は、実行されるとき、
テキストを含むドキュメントを受信するステップと、
それぞれが予め定められた文字特性によって分けられる前記ドキュメントのテキストに対応する複数のトークンを含むトークンセットを生成するために、前記ドキュメントを解析するステップと、
前記ドキュメント内の前記テキストの頻度および分布に基づいて、前記トークンセット内の各トークンのためのスコアを計算するステップと、
前記計算されたスコアに基づいて、前記トークンセット内の各トークンをランク付けするステップと、
前記ランク付けされたトークンからランク付けされたトークンのサブセットを選択するステップと、
前記選択されたトークンの各発生のための署名を生成するステップと、
を前記プロセッサに実行させることを特徴とするコンピュータに読み取り可能な媒体。 - 前記予め定められた文字特性はデリミタを含むことを特徴とする請求項13に記載のコンピュータに読み取り可能な媒体。
- 前記ランク付けされたトークンから前記ランク付けされたトークンのサブセットを前記プロセッサに選択させる指示は、トップにランク付けされたトークンの所定数を該プロセッサに選択させる指示をさらに含むことを特徴とする請求項13に記載のコンピュータに読み取り可能な媒体。
- 前記署名の選択されたリストを前記プロセッサに出力させる指示は、あるリスト内のトップの署名の所定数を該プロセッサに出力させる指示をさらに含むことを特徴とする請求項13に記載のコンピュータに読み取り可能な媒体。
- 前記ドキュメントはASCIIドキュメントであることを特徴とする請求項13に記載のコンピュータに読み取り可能な媒体。
- 前記プロセッサに実行されるときの前記指示は、さらに、前記生成された署名のリストを該プロセッサに出力させることを特徴とする請求項13に記載のコンピュータに読み取り可能な媒体。
- プロセッサに実行可能な指示を格納するよう構成されるコンピュータに読み取り可能な媒体であって、前記指示は、実行されるとき、
複数の文字を含むドキュメントを受信するステップと、
前記複数の文字から有益でない文字を取り除くために、前記ドキュメントを標準化するステップと、
前記ドキュメントの発生頻度および分布に基づいて、前記複数の文字の各有益な文字のスコアを計算するステップと、
前記計算されたスコアに基づいて、前記複数の文字の各有益な文字をランク付けするステップと、
前記ランク付けされた有益な文字から文字発生を選択するステップと、
各選択された文字発生のための署名を生成するステップと、
を前記プロセッサに実行させることを特徴とするコンピュータに読み取り可能な媒体。 - 前記文字発生を前記プロセッサに選択させる指示は、該プロセッサにより実行されるとき、ハッシュ値を生成するために、各文字発生の回りのバイトを該プロセッサにハッシングさせる指示と、該プロセッサに予め定められたランク付けに前記ハッシュ値をソートさせる指示とをさらに含むことを特徴とする請求項19に記載のコンピュータに読み取り可能な媒体。
- 前記プロセッサに前記署名を生成させる指示は、前記選択された文字発生の回りの文字を用いて、該プロセッサに前記署名を生成させる指示をさらに含むことを特徴とする請求項19に記載のコンピュータに読み取り可能な媒体。
- 前記文字はUTF−8文字であることを特徴とする請求項19に記載のコンピュータに読み取り可能な媒体。
- 前記有益でない文字は、余分な空白、制御文字、リターン、その組み合わせからなるグループからの一つを含むことを特徴とする請求項22に記載のコンピュータに読み取り可能な媒体。
- 前記プロセッサにより実行されるときの前記指示は、前記生成された署名のリストを前記プロセッサに出力させることを特徴とする請求項19に記載のコンピュータに読み取り可能な媒体。
- 所定の関連性を有するドキュメントの出力を生成する方法であって、
テキストを含む最初のドキュメントを受信するステップと、
マッチングのために、それぞれがテキストを含む複数のドキュメントのリストを受信するステップと、
最小部分文字列の適合長を受信するステップと、
前記ドキュメントのリストにおける該ドキュメントの前記テキストを標準化するステップと、
前記最初のドキュメントの前記テキストと前記ドキュメントのリストにおける各ドキュメントの前記テキストとの間の共通の部分文字列をサーチするステップと、
前記サーチされた共通の部分文字列に基づいて、適合パーセンテージを計算するステップと、
所定の値に対応する適合パーセンテージを有するドキュメントを出力するステップと、
を有することを特徴とする方法。 - 前記サーチステップの前に、前記最初のドキュメントの前記テキストをソートするステップをさらに有することを特徴とする請求項25に記載の方法。
- 前記サーチステップの前に、前記最初のドキュメントの前記テキストの部分文字列に対するハッシュ値を生成するステップをさらに有することを特徴とする請求項25に記載の方法。
- 前記サーチステップは、二分サーチ技術を用いてサーチするステップをさらに含むことを特徴とする請求項25に記載の方法。
- 前記計算ステップは、相似関数に基づいて、適合パーセンテージを計算するステップをさらに含むことを特徴とする請求項25に記載の方法。
- 前記所定の値は、第1の所定の値と第2の所定の値との間の範囲であることを特徴とする請求項25に記載の方法。
- 前記ドキュメントのリストは複数のドキュメントを含むことを特徴とする請求項25に記載の方法。
- プロセッサに実行可能な指示を格納するよう構成されるコンピュータに読み取り可能な媒体であって、前記指示は、実行されるとき、
テキストを含む最初のドキュメントを受信するステップと、
マッチングのために、それぞれがテキストを含む複数のドキュメントのリストを受信するステップと、
最小部分文字列の適合長を受信するステップと、
前記ドキュメントのリストにおける該ドキュメントの前記テキストを標準化するステップと、
前記最初のドキュメントの前記テキストと前記ドキュメントのリストにおける各ドキュメントの前記テキストとの間の共通の部分文字列をサーチするステップと、
前記サーチされた共通の部分文字列に基づいて、適合パーセンテージを計算するステップと、
所定の値に対応する適合パーセンテージを有するドキュメントを出力するステップと、
を前記プロセッサに実行させることを特徴とするコンピュータに読み取り可能な媒体。 - 前記サーチステップの前に、前記プロセッサに前記最初のドキュメントの前記テキストをソートさせる指示をさらに含むことを特徴とする請求項32に記載のコンピュータに読み取り可能な媒体。
- 前記サーチステップの前に、前記最初のドキュメントの前記テキストの部分文字列に対するハッシュ値を前記プロセッサに生成させる指示をさらに含むを特徴とする請求項32に記載のコンピュータに読み取り可能な媒体。
- 前記プロセッサにサーチさせる指示は、前記プロセッサに二分サーチ技術を用いてサーチさせる指示をさらに含むことを特徴とする請求項32に記載のコンピュータに読み取り可能な媒体。
- 前記プロセッサに計算させる指示は、相似関数に基づいて、前記プロセッサに適合パーセンテージを計算させる指示をさらに含むことを特徴とする請求項32に記載のコンピュータに読み取り可能な媒体。
- 前記所定の値は、第1の所定の値と第2の所定の値との間の範囲であることを特徴とする請求項32に記載のコンピュータに読み取り可能な媒体。
- 前記ドキュメントのリストは複数のドキュメントを含むことを特徴とする請求項32に記載のコンピュータに読み取り可能な媒体。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US67931405P | 2005-05-09 | 2005-05-09 | |
US60/679,314 | 2005-05-09 | ||
US11/361,340 | 2006-02-24 | ||
US11/361,447 | 2006-02-24 | ||
US11/361,340 US7516130B2 (en) | 2005-05-09 | 2006-02-24 | Matching engine with signature generation |
US11/361,447 US7747642B2 (en) | 2005-05-09 | 2006-02-24 | Matching engine for querying relevant documents |
PCT/US2006/017846 WO2006122086A2 (en) | 2005-05-09 | 2006-05-08 | Matching engine with signature generation and relevance detection |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2008541272A true JP2008541272A (ja) | 2008-11-20 |
JP2008541272A5 JP2008541272A5 (ja) | 2012-03-15 |
JP5072832B2 JP5072832B2 (ja) | 2012-11-14 |
Family
ID=37397221
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008511259A Active JP5072832B2 (ja) | 2005-05-09 | 2006-05-08 | 署名生成および関連性を有するマッチングエンジン |
Country Status (3)
Country | Link |
---|---|
JP (1) | JP5072832B2 (ja) |
CN (1) | CN101248433B (ja) |
WO (1) | WO2006122086A2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010518531A (ja) * | 2007-02-14 | 2010-05-27 | プロヴィラ インコーポレイテッド | 非対称署名生成を使用するドキュメント照合エンジン |
JP2012168678A (ja) * | 2011-02-14 | 2012-09-06 | Nec Corp | 文書間類似度算出装置、文書間類似度算出方法、及び、文書間類似度算出プログラム |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7516130B2 (en) * | 2005-05-09 | 2009-04-07 | Trend Micro, Inc. | Matching engine with signature generation |
JP5372853B2 (ja) | 2010-07-08 | 2013-12-18 | 株式会社日立製作所 | デジタルシーケンス特徴量算出方法及びデジタルシーケンス特徴量算出装置 |
CN107798637A (zh) * | 2016-08-30 | 2018-03-13 | 北京国双科技有限公司 | 同案异判文书的获取方法及装置 |
CN112580108B (zh) * | 2020-12-10 | 2024-04-19 | 深圳证券信息有限公司 | 签名和印章完整性验证方法及计算机设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07244671A (ja) * | 1994-03-02 | 1995-09-19 | Ricoh Co Ltd | 文書検索装置 |
JPH09293079A (ja) * | 1996-04-18 | 1997-11-11 | Internatl Business Mach Corp <Ibm> | 情報検索方法、情報検索装置及び情報検索プログラムを格納する記憶媒体 |
JP2000057172A (ja) * | 1998-05-29 | 2000-02-25 | Xerox Corp | 問合せに対する応答を得る方法 |
JP2002269116A (ja) * | 2001-03-13 | 2002-09-20 | Ricoh Co Ltd | 文書検索システム及びプログラム |
US6493709B1 (en) * | 1998-07-31 | 2002-12-10 | The Regents Of The University Of California | Method and apparatus for digitally shredding similar documents within large document sets in a data processing environment |
JP2003091557A (ja) * | 2001-07-12 | 2003-03-28 | Matsushita Electric Ind Co Ltd | 文書照合装置 |
US6584470B2 (en) * | 2001-03-01 | 2003-06-24 | Intelliseek, Inc. | Multi-layered semiotic mechanism for answering natural language questions using document retrieval combined with information extraction |
US20030172066A1 (en) * | 2002-01-22 | 2003-09-11 | International Business Machines Corporation | System and method for detecting duplicate and similar documents |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5325091A (en) * | 1992-08-13 | 1994-06-28 | Xerox Corporation | Text-compression technique using frequency-ordered array of word-number mappers |
CN1369839A (zh) * | 2001-02-16 | 2002-09-18 | 意蓝科技股份有限公司 | 文件关联性判定系统与方法 |
-
2006
- 2006-05-08 JP JP2008511259A patent/JP5072832B2/ja active Active
- 2006-05-08 CN CN2006800227288A patent/CN101248433B/zh active Active
- 2006-05-08 WO PCT/US2006/017846 patent/WO2006122086A2/en active Application Filing
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07244671A (ja) * | 1994-03-02 | 1995-09-19 | Ricoh Co Ltd | 文書検索装置 |
JPH09293079A (ja) * | 1996-04-18 | 1997-11-11 | Internatl Business Mach Corp <Ibm> | 情報検索方法、情報検索装置及び情報検索プログラムを格納する記憶媒体 |
JP2000057172A (ja) * | 1998-05-29 | 2000-02-25 | Xerox Corp | 問合せに対する応答を得る方法 |
US6493709B1 (en) * | 1998-07-31 | 2002-12-10 | The Regents Of The University Of California | Method and apparatus for digitally shredding similar documents within large document sets in a data processing environment |
US6584470B2 (en) * | 2001-03-01 | 2003-06-24 | Intelliseek, Inc. | Multi-layered semiotic mechanism for answering natural language questions using document retrieval combined with information extraction |
JP2002269116A (ja) * | 2001-03-13 | 2002-09-20 | Ricoh Co Ltd | 文書検索システム及びプログラム |
JP2003091557A (ja) * | 2001-07-12 | 2003-03-28 | Matsushita Electric Ind Co Ltd | 文書照合装置 |
US20030172066A1 (en) * | 2002-01-22 | 2003-09-11 | International Business Machines Corporation | System and method for detecting duplicate and similar documents |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010518531A (ja) * | 2007-02-14 | 2010-05-27 | プロヴィラ インコーポレイテッド | 非対称署名生成を使用するドキュメント照合エンジン |
JP2012168678A (ja) * | 2011-02-14 | 2012-09-06 | Nec Corp | 文書間類似度算出装置、文書間類似度算出方法、及び、文書間類似度算出プログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2006122086A2 (en) | 2006-11-16 |
WO2006122086A3 (en) | 2007-03-29 |
CN101248433B (zh) | 2010-09-01 |
JP5072832B2 (ja) | 2012-11-14 |
CN101248433A (zh) | 2008-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7747642B2 (en) | Matching engine for querying relevant documents | |
US7516130B2 (en) | Matching engine with signature generation | |
US7860853B2 (en) | Document matching engine using asymmetric signature generation | |
US8781817B2 (en) | Phrase based document clustering with automatic phrase extraction | |
KR101157693B1 (ko) | 토큰스페이스 저장소와 함께 사용하기 위한 멀티-스테이지질의 처리 시스템 및 방법 | |
JP5615476B2 (ja) | 対訳語句提示プログラム、対訳語句提示方法および対訳語句提示装置 | |
US8055498B2 (en) | Systems and methods for building an electronic dictionary of multi-word names and for performing fuzzy searches in the dictionary | |
JP3566111B2 (ja) | 記号辞書作成方法及び記号辞書検索方法 | |
US8266150B1 (en) | Scalable document signature search engine | |
US20070027856A1 (en) | Product searching system and method using search logic according to each category | |
US20090089278A1 (en) | Techniques for keyword extraction from urls using statistical analysis | |
US20060206306A1 (en) | Text mining apparatus and associated methods | |
US8122022B1 (en) | Abbreviation detection for common synonym generation | |
JP5072832B2 (ja) | 署名生成および関連性を有するマッチングエンジン | |
JP2008090401A (ja) | 文書検索装置、文書検索方法および文書検索プログラム | |
JP4114600B2 (ja) | 可変長文字列検索装置及び可変長文字列検索方法並びにプログラム | |
US8862586B2 (en) | Document analysis system | |
JP2006227823A (ja) | 情報処理装置及びその制御方法 | |
KR100659370B1 (ko) | 시소러스 매칭에 의한 문서 db 형성 방법 및 정보검색방법 | |
JP4360167B2 (ja) | キーワード抽出装置、およびキーワード抽出方法、並びにコンピュータ・プログラム | |
Shang et al. | Event extraction from unstructured text data | |
CN116401334A (zh) | 数据指标管理方法、装置、电子设备和可读存储介质 | |
JPH07325837A (ja) | 抽象単語による通信文検索装置及び抽象単語による通信文検索方法 | |
JP3314720B2 (ja) | 文字列検索装置 | |
JP3333186B2 (ja) | 文書検索システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090410 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090623 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110726 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111026 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111102 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111128 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20111205 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20111226 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120126 |
|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A524 Effective date: 20120126 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20120302 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20120303 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120619 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120705 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120731 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120821 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5072832 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150831 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |