CN1173676A - 文件检索方法及系统 - Google Patents
文件检索方法及系统 Download PDFInfo
- Publication number
- CN1173676A CN1173676A CN97114619A CN97114619A CN1173676A CN 1173676 A CN1173676 A CN 1173676A CN 97114619 A CN97114619 A CN 97114619A CN 97114619 A CN97114619 A CN 97114619A CN 1173676 A CN1173676 A CN 1173676A
- Authority
- CN
- China
- Prior art keywords
- mentioned
- user
- text
- search
- search terms
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99934—Query formulation, input preparation, or translation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/99931—Database or file accessing
- Y10S707/99933—Query processing, i.e. searching
- Y10S707/99935—Query augmenting and refining, e.g. inexact access
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Digital Computer Display Output (AREA)
Abstract
分解检索条件式,在检索项数计数表(以下,称表A)中存储包含在检索条件式中的检索项(以下,称项)数,生成用于核对全部项的有限自动机,生成存储了项是属于哪个用户的用户识别符表,用有限自动机扫描对象正文,核对项,参照用户识别符表,对每个用户分别算出在正文中出现了与项一致的部分字符串的项数,存储在表A算出的项数用存储区域内,比较表A内算出的项数和检测条件式中的项数,在比较结果一致时,对该用户发送该正文。即使在用户数增加时,也可以实现不受用户数影响的高速正文检索发送功能。
Description
本发明涉及根据用户预先登记的检索条件式,检索用电子邮件和信息收集自动装置等从通讯社和报社等多种信息来源得到的电子化文件,对于条件成立的用户发送该电子化文件的文件检索发送系统,特别涉及即使用户数增加也可以用一次扫描电子化文件,就结束全部用户检索的具有即时性高的正文检索发送功能的文件检索发送系统。
近年,通过电子邮件和电子新闻等,大量的电子化文件(以下,称正文(text))一刻不停地向用户端传送。另外,由于通过互连网络提供信息的信息源激增,因而使用信息收集自动装置等从这些信息源收集的正文量也增大。因此,对检索这些正文,立即向需要该正文的用户发送的文件发送系统的应用需求增加。
作为用于实现该文件检索发送系统的核心,使用文件检索。有关该文件检索,具体地记载于A.V.Aho,etal,“Efficient StringMatching:An Aid to Bibliographic,Communications of theACM”,June 1975,Vol.18 No.6,pp.333-340。
这是从多个需要核对的检索字符串(以下,称检索项)中,生成被称为模式匹配器的一种有限自动机,由此,只用一次扫描正文,就可以同时核对多个检索项的方式。
但是,在对于多个用户的检索条件式进行正文检索的情况下,会发生以下的问题。
(1)用户识别问题
通过用包含在多个用户检索条件式中的全部检索项,生成一台有限自动机,可以通过一次扫描下文而核对全部检索项。但是,因为不能判别和正文中的部分字符串一致的检索项包含在哪个用户的检索条件式中,所以分不清哪个用户的检索条件式成立。
(2)处理时间的问题
如果对每个用户检索条件中分别用包含在该检索条件式中的检索项生成有限自动机,则可以判别哪个用户的检索条件式成立。但是,由于必须按有限自动机的数(即,用户数)扫描正文,所以如果用户数增加,则检索需要的时间相应增加。
本发明的目的在于提供:根据用户预先登录的检索条件式,通过一次扫描来判别哪个用户的检索条件成立,对条件成立的用户发送从多种信息源得到的有关信息的文件检索发送系统。
本发明的另一目的在于提供:即使在用户增加的情况下,也可以进行不受用户数影响的高速实时的正文检索发送的文件检索发送系统。
根据本发明的用于输入检索项和文件的文件检索系统的文件检索方法具有:
存储涉及具有多个用户分别指定的1个以上的检索项的多个项的多个检索条件式的步骤;
对每个用户分别准备具有包含在该多个检索条件式中的检索条件的数量的、检索项数计数表的步骤;
为了准备收集与多个项分别对应的用户的用户列表18,扫描输入到该文件检索系统中的文件的正文数据以包含与多个用户指定的重复的一个项对应的多个用户的步骤;
根据上述用户列表,对每个用户分别准备收集在该文件的该正文数据中发现的项类型数的项类型数计数表16的步骤;
比较该项数计数表的检索项数和该项类型数计数表的数,并查找两者一致的用户的步骤。
该文件被发送给该检索项数和该项类型数一致的用户。
在该发送步骤前进行的扫描正文数据的次数是1次。
在登录多个用户指定的检索条件的检索条件式步骤和在得到正文时,判断与该正文对应的上述检索条件式是否成立,对检索条件成立的用户,发送该正文的正文检索发送步骤的文件检索发送方法中,上述正文检索发送步骤通过以更少的次数扫描上述正文,就可以判断上述多个检索条件式对该正文是否成立。
进而,上述检索条件式登录步骤具有:
从上述检索条件式中抽出全部的检索项的检索条件式分解步骤;
检索项数计数表制作步骤,用于制作检索项数计数表存储对每个用户包含用户从该用户的检索条件式中抽出的全部检索项的数的管理信息;
多重字符串核对表生成步骤,用于生成在通过只扫描正文一次就能核对从上述检索条件中抽出的全部检索项时所参照的多重字符串核对表;以及
用户列表生成步骤,用于将与从检索条件式中抽出的各检索项对应的检索条件式的用户的用户识别符作为列表生成链接的用户列表,
上述正文检索发送步骤具有:
在判断与该正文相对的上述检索条件式是否成立时,通过参照上述多重字符串核对表扫描该正文,核对由上述检索条件式分解步骤抽出的全部的检索项的正文扫描步骤;以及
通过核对已由上述正文扫描步骤核对的检索项和上述用户列表以及上述检索项数计数表,判断与该正文相对应的上述检索条件式是否成立的检索条件式是否成立判断步骤。
进而,作为上述多重字符串核对表,要使用有限自动机。
再有,上述检索条件式是否成立判断步骤具有:
参照上述用户列表,对每个用户算出由上述正文扫描步骤核对后的检索项的个数的检索项核对数计算步骤;以及
比较在上述检索项核对数计算步骤中算出的检索项的个数和存储在上述检索项数计数表中的检索项的个数,在一致的的情况下,认为包含该检索项的检索条件式成立的检索项数比较步骤。
另外,在将从一个以上的信息源得到的文件信息的正文数据作为对象、
登录包含一个以上的检索项的一个以上的用户指定的检索条件式的检索条件式登录步骤,和在得到正文时,判断相对于该正文的检索条件式是否成立,对于检索条件式成立的用户,发送该正文的、正文检索发送步骤的文件检索发送方法中,具有:
登录包含记录由一个以上的用户或系统管理者指定的正文发送条件的发送条件设定式的发送条件设定式登录步骤,
上述正文检索发送步骤具有:
通过只一次扫描上述正文,即可判断上述多个检索条件式对该正文是否成立的正文检索步骤;以及对于由上述正文检索步骤检索后上述检索条件式成立的用户,在由上述发送条件设定式登录步骤登录的上述发送条件成立时,发送上述正文的正文发送控制步骤。
进而,上述发送条件设定式登录步骤具有:
从上述发送条件设定式中抽出要设定发送条件的用户的识别符和发送条件的发送条件设定式分解步骤;以及
生成存储了在上述发送条件设定式分解步骤中从上述发送条件设定式中抽出的用户的识别符和发送条件的发送条件管理表的发送条件管理表制作步骤,
上述正文发送控制步骤具有:
参照上述发送条件管理表,判断上述发送条件是否成立的发送条件是否成立判断步骤,以及
在由上述发送条件是否成立判断步骤判断上述发送条件成立时,对用户发送上述正文的正文发送步骤。
进而,作为上述发送条件,使用发送的时间、发送的件数或从正文检索到发送的延迟时间。
另外,在将从一个以上的信息源得到的文件信息的正文数据作为对象,登录包含一个以上的检索项的一个以上的用户指定的检索条件式的检索条件式登录步骤,和在得到正文时,判断相对于该正文的检索条件式是否成立,对于检索条件式成立的用户,发送该正文的正文检索发送步骤的文件检索发送方法中,具有:
在已指定删除上述检索条件式的情况下,删除该检索条件式的检索条件式删除步骤。
进而,上述检索条件式登录步骤具有:
从上述检索条件式抽出全部检索项的检索条件式分解步骤;
对每个用户分别存储用户和从用户的检索条件式中抽出的包含全部检索项的数的管理信息的、检索项数计数表制作步骤;
生成在仅用一次扫描正文,来核对从上述检索条件式中抽出的全部检索项时所参照的多重字符串核对表的多重字符串核对表生成步骤;以及
将对应于从检索条件式抽出的各检索项指定该检索条件式的用户识别符作为列表,生成链接的用户列表的用户列表生成步骤。上述检索条件式删除步骤具有:从上述检索项数计数表以及上述用户列表中,删除与指定删除的上述检索条件式有关的信息的检索条件式管理表删除步骤。
进而,上述检索条件式登录步骤还具有:制作用于存储由上述检索条件式分解步骤抽出的检索项的检索项管理表的检索项管理表制作步骤,
上述检索条件式管理表删除步骤具有:
参照上述检索项管理表,从上述用户列表中,删除与已指定了的包含在被指定删除的上述检索条件式中的上述检索项对应的该检索条件式的用户识别符的用户列表删除步骤;以及
从上述检索项数计数表中删除与被指定删除的上述检索条件式相关的用户管理信息的检索项数计数表删除步骤。
另外,在包括将从一个以上的信息源得到的文件信息的正文数据作为对象,具有登录包含一个以上的检索项的一个以上的用户所指定的检索条件式的检索条件式登录装置,和在得到正文时,判断相对于该正文的上述检索条件式是否成立,对于检索条件式成立的用户,发送该正文的正文检索发送装置的文件检索发送装置中,包括:
上述正文检索发送装置具有正文检索装置,该正文检索装置只要对上述正文扫描一次,即可断判出上述多个检索条件式对该正文是否成立。
进而,上述检索条件式登录装置具有:
从上述检索条件式中抽出全部的检索项的检索条件式分解装置;
对每个用户分别存储包含用户和从该用户的检索条件式中抽出的全部检索项的数的管理信息的检索项数计数表制作装置;
用于生成在通过只扫描正文一次即可核对从上述检索条件抽出的全部检索项时所参照的多重字符串核对表的多重字符串核对表生成装置;
将指定与从检索条件式中抽出的各检索项对应的该检索条件式的用户的用户识别符作为列表生成链接的用户列表的用户列表生成装置;
上述正文检索发送装置具有:
在判断对于该正文的上述检索条件式是否成立时,通过参照上述多重字符串核对表扫描该正文,核对由上述检索条件式分解方法抽出的全部检索项的正文扫描装置;
通过核对由上述正文扫描装置核对后的检索项和上述用户列表和上述检索项数计数表,判断对于该正文的上述检索条件式是否成立的检索条件是否成立判断装置。
进而,作为上述多重字符串核对表,要使用有限自动机。
再有,上述检索条件式是否成立的判断装置具有:
参照上述用户列表,对每个用户算出由上述正文扫描装置核对后的检索项数的检索项核对数计算装置;
比较在上述检索项核对数计算装置中算出的检索项的个数和存储在上述检索项数计数表中的检索项的个数,在一致的情况下,看作是包含该检索项的检索条件式成立的检索项数比较装置。
另外,在包括将从一个以上的信息源得到的文件信息的正文数据作为对象,用于登录包含一个以上的检索项的一个以上的用户指定的检索条件式的检索条件式登录装置,和在得到正文时,判断相对于该正文的上述检索条件式是否成立,对于检索条件式成立的用户,发送该正文的正文检索发送装置的文件检索发送装置中,包括:
登录包含记录有一个以上的用户或系统管理者所指定的系统发送的条件在内的发送条件设定式的发送条件设定式登录装置,
上述正文检索发送装置具有:
仅通过一次扫描上述正文,即可判断上述的检索条件式对该正文是否成立的正文检索装置;以及
对于通过上述正文检索装置,检索到的上述检索条件式成立的用户,在由上述发送条件设定式登录装置所登录的上述发送条件成立时,发送上述正文的正文发送控制装置。
进而,上述发送条件设定登录装置具有:
从上述发送条件设定式中抽出需要设定发送条件的用户的识别符和发送条件的发送条件设定式分解装置;以及
制作存储有在上述发送条件设定式分解装置中从上述发送条件设定式中抽出的用户识别符和发送条件的发送条件管理表的发送条件管理表制作装置,
上述正文发送控制装置具有:
参照上述发送条件管理表来判断上述发送条件是否成立的发送条件是否成立判断装置;以及
在由上述发送条件是否成立判断装置来判断上述发送条件成立时,对用户发送上述正文的正文发送装置。
进而,作为上述发送条件要使用发送的时间、发送的件数或从正文检索到发送所需的延迟时间。
另外,在将从一个以上的信息源得到的文件信息的正文数据作为对象,具有登录包含一个以上的检索项的一个以上的用户所指定的检索条件式的检索条件式登录装置,和在得到正文时,判断相对于该正文的上述检索条件式是否成立,对于检索条件式成立的用户,发送该正文的正文检索发送装置的文件检索发送装置中,包括:
在指定删除上述检索条件式的情况下,删除该检索条件式的检索条件式删除装置。
进而,上述检索条件式登录装置具有:
从上述检索条件式中抽出全部的检索项的检索条件式分解装置;
生成用于存储包含每个用户和从用户的检索条件式抽出的全部检索项数的管理信息的检索项数计数表的检索项数计数表制作装置;
生成在仅靠一次扫描正文,来核对从上述检索条件式中抽出的全部检索项时所参照的多重字符串核对表的多重字符串核对表生成装置;以及
将与从检索条件式中抽出的各检索项对应地指定该检索条件式的用户的用户识别符作为列表,生成链接的用户列表的用户列表生成装置,
上述检索条件式删除装置具有:从上述检索项数计数表以及上述用户列表中删除与指定删除的上述检索条件式有关的信息的检索条件式管理表删除装置。
进而,上述检索条件式登录装置还具有:生成用于存储由上述检索条件式分解装置抽出的检索项的检索项管理表的检索项管理表制作装置,
上述检索条件式管理表删除装置具有:
参照上述检索项管理表,从上述用户列表中,删除指定包含在指定删除的上述检索条件式中的与上述检索项对应的该检索条件式的用户的用户识别符的用户列表删除装置;以及
从上述检索项数计数表中删除与指定删除的上述检索项条件式相关的用户管理信息的检索数计数表删除装置。
附图简要说明
图1是展示本发明的处理概要的图。
图2是展示本发明的第1实施例的构成图。
图3是展示系统控制程序105的处理内容的PAD图。
图4是展示检索条件式登录控制程序106的处理内容的PAD图。
图5是为了说明检索条件式的分解方法的图。
图6是为了说明检索项数计数表120的制作方法的图。
图7是展示正文检索控制程序112的处理内容的PAD图。
图8是展示检索用自动机生成程序109的处理内容的PAD图。
图9是为了说明有限自动机121以及用户列表122的制作方法的图。
图10是展示正文检索程序114的处理内容的PAD图。
图11是为了说明用户列表122的生成处理图。
图12是为了说明正文扫描处理图。
图13是为了说明在正文中一致的部分字符串出现后的检索项的计数处理图。
图14是为了说明在正文中一致的部分字符串未出现时检索项的计数处理图。
图15是为了说明检索条件式的成立校验处理图。
图16是为了说明正文成形处理的图。
图17是展示本发明的第2实施例的构成图。
图18是展示系统控制程序105a的处理内容的PAD图。
图19是展示发送条件登录控制程序2100的处理内容的PAD图。
图20是展示发送管理表2108的构成图。
图21是表示正文检索控制程序112a的处理内容的PAD图。
图22是展示正文发送控制程序2104的处理内容的PAD图。
图23是展示正文发送程序2105的处理内容的PAD图。
图24是为了说明发送条件登录处理图。
图25是为了说明发送信息存储处理图。
图26是为了说明发送条件形成处理以及分发送息更新处理图。
图27是本发明的第3实施例的构成图。
图28是展示系统控制程序105b的处理内容的PAD图。
图29是展示检索条件式删除控制程序3100的处理内容的PAD图。
图30是展示用户列表更新程序3101的处理内容的PAD图。
图31是展示检索条件登录控制极程序106a的处理内容的PAD图。
图32是展示检索项管理表3106的构成图。
图33是为了说明用户列表更新处理图。
图34是为了说明检索项数计数表更新处理的图。
图35是为了说明检索项管理表制作处理的图。
以下,参照附图说明本发明的实施例。
先参照图1说明第1实施例的概要。
首先,说明有关检索条件式登录处理。
首先,分解检索条件式,抽出包含在检索条件式中的检索项。而后,通过检索项数计数表制作处理,将抽出的检索项数存储在检索项数计数表中。
例如,在图1中,由于用户1:在称作「包含“文件”和“检索”的文件」的检索条件式中,包含有称作“文件”和“检索”的2个检索项,所以在与检索项数计数表的用户1对应的位置上存储2。同样地在与用户2、用户3对应的位置上分别存储1、2。
接着,在有限自动机生成处理中,生成核对在上述检索条件式分解中抽出的全部检索项的有限自动机。该有限自动机与现有技术1以及现有技术2所示的自动机相同。
核对从称作用户1:「包含“文件”和“检索”的文件」,用户2:「包含“登山”的文件」,以及用户3:「包含“检索”和“登录”的文件」的检索条件式中抽出的检索项“文件”、“检索”、“登山”以及“登录”的有限自动机状态转换图为图中所示那样。在此图中,为简单起见用2字节(1个字符)为单位表示状态转换。
以下,在用户列表生成处理中,将指定各自的检索项的用户的识别符作为用户列表,与有限自动机链接。在图1中,例如,如果核对“检索”,则从其末尾的状态4参照用户列表,检测出指定“检索”的用户是“用户1”以及“用户3”。
以下,说明作为正文检索以及发送处理的正文检索发送处理。
在该处理中,首先用正文扫描处理来进行正文的扫描,核对检索项。
例如,正文:在使用图1中展示「检索文件」的有限自动机进行扫描的情况下,检测出和“文件”以及“检索”一致的部分字符串出现在正文中。在此图所示的有限自动机中,在末尾的状态下标记有“○”的检索项表示在正文中出现有一致的部分字符串,标记有“×”的检索项表示在正文中未出现的部分字符串。
在本例中,因为在正文中出现了与“文件”以及“检索”一致的部分字符串,所以在作为其末尾的状态的状态2以及状态4被标记“○”。
以下,对每个用户分别计算在检索项数计数处理中和正文中的部分字符串一致的检索项的出现次数。
例如,对于用户1,因为“文件”以及“检索”一致,所以计数为2;对于用户3,因为只有“检索”一致,所以计数为1。但是,用户2因为在正文中与检索项一致的部分字符串未出现,所以是0。
最后,在检索条件式校验处理中,比较存储在上述检索项数计数表中的检索项数和在上述检索项数计数处理中算出的检索项出现计数,在一致的情况下,在正文发送处理中,对该用户发送正文。
例如,在图1中,因为用户1检索项数是2,一致,所以发送正文,而因为用户2以及用户3不一致,所以不发送。
如上所述,在本实施例中,用有限自动机扫描正文,对每个用户边参照用户列表,边对作为在正文中一致的部分字符串出现的检索项的出现数进行计数。
而后,通过比较计数的结果与预先存储在检索项数计数表中的检索项数,核对检索条件式是否成立。
其结果,只用一次正文扫描,就可以判断多个用户的检索条件式是否成立,可以实现即时性强的正文检索发送。
以下,用图2详细说明有关本发明的第1实施例。
适用本发明的文件检索发送系统,由显示器100、键盘101、中央运算处理装置(CPU)102、主存储器104以及链接它们的总线103构成。
另外,在总线103上,通过LAN(Local Area Networ)等的通信线路124,链接发布新闻的新闻发布(分配)单元(源)125和利用文件检索发送系统的用户126。
新闻发布单元125用电子邮件和电子新闻等向本系统发送将新闻数据电子化了的正文,或通过互连网络展示正文,用户126用电子邮件向本系统登录检索条件式。
将根据上述检索条件式从本系统检索出的上述正文用电子邮件发送给相应的用户。
以下,在本实施例中,描述新闻发布单元125是用电子邮件在本系统中发布正文的情况,但是,新闻发布单元125只是在互连网络上展示正文,正文收集也可以用信息收集自动装置进行。
在主存储器104中,在存储系统控制程序105、检索条件式登录控制程序106、检索条件式分解程序107、检索项数计数表制作程序108、检索用自动机生成程序109、正文检索控制程序112、正文获取程序113、正文检索程序114、正文形成程序118、电子邮件程序119、检索项数计数表120、有限自动机121以及用户列表122的同时,确保工作区123。
检索用自动机生成程序109由有限自动机生成程序110以及用户列表生成程序111构成。
正文检索程序114用正文扫描程序115、检索项数计数程序116以及检索条件式校验程序117构成。
以上的程序还可以存储在硬盘装置(未图示)、软盘(未图示)等的用计算机可以读写的存储媒体上。
系统控制程序105接收文件检索发送系统的管理者用键盘101发出的指令后进行起动。
检索条件式登录控制程序106以及正文检索控制程序112,由系统控制程序105根据来自用户126的检索条件式的登录指令和来自新闻发布单元125的正文的发送指令来起动,分别进行检索条件式分解程序107、检索项数计数表生成程序108以及检索用自动机生成程序109的控制,和正文获取程序113、正文检索程序114以及正文形成程序118的控制。
在电子邮件程序119中,使用在工作站等中一般使用的现有的邮件程序。
本电子邮件程序119根据正文检索控制程序112的处理结果,由系统控制程序105起动。
以下,说明有关在本实施例中的文件检索发送系统的处理内容。
首先,用图3的PAD(Problem Analysis Diagram)图来说明系统控制程序105的处理内容。
在系统控制程序105中,首先在步骤700中,在从键盘101输入结束指令为止,循环执行以下的步骤。
在该循环处理中,首先在步骤701中检查从用户126端是否通过电子邮件传送检索条件式。
在此,当传送了检索条件式的情况下,在步骤702中起动检索条件式登录控制程序106,进行检索条件式的登录。
接着,在步骤703中,检查从新闻发布单元125是否通过电子邮件传送了正文。
在此,当传送了正文的情况下,在步骤704中起动正文检索控制程序112,进行正文的检索。
接着,在步骤705中,检查在正文检索控制程序112中的正文检索结果,当判断出成立的检索条件式即使存在一个的情况下,就在步骤706中起动电子邮件程序119,对指定了已成立的检索条件的用户,用电子邮件发送相应的正文。
以上是系统控制程序105的处理内容。
以下,用图4的PAD图来说明由检索条件式登录控制程序106进行的检索条件式登录的处理内容。
检索条件式登录控制程序106由系统控制程序105起动。
本程序,首先在步骤800中起动检索条件式分解程序107,对从用户126通过电子邮件传送的检索条件式进行分解。
在该检索条件式的分解处理中,把检索条件式展开成如下的某个形式。即(a)仅是单一检索项,(b)多个(a)的“与”条件,(c)多个(a)和多个(b)的“或”条件。
也就是说,如此展开检索条件式,使得在“或”条件的外侧不加“与”条件。
但是,使“非”条件加在全部检索条件式或检索项上。这里,所谓“与”条件,是指:例如,如
检索式「“文件”and“检索”」那样,具有所谓「查找“文件”和“检索”两种字符串均出现的文件」的含义,所谓“或”条件,例如,如
检索式「“文件”or“检索”」那样,具有所谓「查找“文件”或“检索”中某一种字符串出现的文件」的含义。
另外,所谓“非”条件,例如,如
检索式「“检索”」那样,具有「查找“检索”不出现的文件」的含义。
例如,如果将“A”、“B”、“C”、“D”、“E”作为检索项,则可以分别展开成以下那样的形式。(a)A(b)A and B and C and…(c)(A and B)or C or(D and E)or…
例如,当检索条件式是与“或”条件相对的“与”条件时,即在“或”条件的外侧加上“与”条件时,如图5所示那样地展开,并变形以满足上述的条件。
这里,将在展开结果中的“与”条件或单一的检索项的部分称作项。
以下,在步骤801中,检索条件式登录控制程序106,起动检索项数计数表生成程序108,将作为检索条件式分解程序107的分解结果而得到的检索条件式中所包含的检索项的数、和表示在检索条件式上是否加上“非”条件的信息存储在检索项数计数表120中。
该检索项数计数表120,是对每个检索条件式(即每个用户),根据检索条件式中的项来存储包含在其中的检索项的数的表。
图6展示其结构。
此图所示的检索项数计数表120,是相对于所谓的用户号1:「(“文件”and“检索”)or(“文件”and“检索”)」、用户号2:「“文字”and “识别”and “学习”」以及用户号3:「(“检索”and“学习”)」这3个检索条件式而生成的表。
首先,作为该检索项数计数表120的开头单元,设置检索条件式“非”标志。
对该检索条件式“非”标志,在全部检索条件式上加有“非”条件的情况下,设定为1,否则设定为0。
例如,在此图所示例子的情况下,由于用户号3的全部检索条件式加有“非”条件,所以设定为1,而由于在另外的检索条件式上未加“非”条件,所以设定为0。
对于该检索条件式“非”标志,从第1项开始顺序地将包含在该项中的检索项的数作为列表链接起来。
例如,在与用户号1对应的列表的第2单元中,存储包含在检索条件式的第1项中的检索项的数,由于在该项中包含称为“文件”和“检索”这2个检索项,所以存储2。
进而,在其下的单元中,存储包含在第2项中的作为检索项的数的2。
另外,在第2个单元以后的单元中,分别在存储检索项的数的同时,确保用于计算在正文检索时和正文中的部分字符串一致的检索项的出现数的区域。
最后,在步骤802中,检索条件式登录控制程序106,起动检索用自动机生成程序109,生成用于核对作为上述检索条件式分解程序107的分解结果而得到的、包含在检索条件式中的全部检索项的、有限自动机121。
而后,生成将指定3包含这些检索项的检索条件式、用户126的识别符作为列表而链接的用户列表122,将其与有限自动机121链接。
以下详细说明有关该检索用自动机生成程序109的处理内容。
以上是由检索条件式登录控制程序106进行的检索条件式登录的处理内容。
以下,用图17的PAD图来说明由正文检索控制程序112进行的正文检索的处理内容。
正文检索控制程序112由系统控制程序105起动。
本程序,首先在步骤1100中起动正文获取程序113,将从新闻发布单元125发出的由电子邮件等传送的正文存储在工作区123内。
接着,在步骤1101中起动正文检索程序114,用由上述检索项数计数表生成程序108生成的检索项数计数表120、以及由上述检索用自动机生成程序109生成的有限自动机121和用户列表122,检索存储在工作区123中的正文。
以下详细说明关于该正文检索程序114的处理内容。
接着,在步骤1102中,检查在正文检索程序114中的正文检索处理的结果,在成立的检索条件式即使存在一个的情况下,就在步骤1103中起动正文形成程序118,将存储在工作区123中的正文形成为如电子邮件程序119可以发送的形式。
以上是由正文检索控制程序112进行的正文检索的处理内容。
接着,用图8的PAD图来说明在由图4所示的检索条件式登录控制程序106进行的检索条件式登录处理中的检索用自动机生成程序109的处理内容。
检索用自动机生成程序109,如图8所示,首先在步骤1200中,起动有限自动机生成程序110,生成用于核对由上述检索条件式分解程序107抽出的全部检索项的有限自动机121。
在该有限自动机121的生成方法中,使用现有技术揭示的方法。
接着,在步骤1201中起动用户列表生成程序111,根据指定了包括由上述检索条件式分解程序107抽出的检索项的检索条件式的用户126的识别号(用户号)和包含该检索项的项的号码(项号),生成用户列表122,在步骤1202中通过指针,与有限自动机121的输出表链接。
在图9中展示由在上述检索项数计数表120说明中使用的3个检索条件式而生成的有限自动机121和用户列表122的例子。
在此图中所示的有限自动机121就是核对包含在检索条件式中的称作“文件”、“文字”、“检索”、“查找”、“识别”以及“学习”这6个检索项用的。
在此图中,为简单起见,用2字节(1个字)单位表示状态转移。
该有限自动机121与现有技术1以及现有技术2所示的有限自动机相同,但是输出表的部分不同。
与存储在输出表中的各状态号对应地设置出现标记。该出现标记在正文的扫描开始时复位为0,在与检索项一致的部分字符串出现在正文中的情况下置1。
另外,在输出表的末尾设置指针,指示将包含其检索项的检索条件式的用户号以及项号作为列表而链接的用户列表122。
对用户列表122的一个个单元,设置检索项“非”标志,在检索条件式中当其检索项是加有“非”条件的情况下,设定1,否则设定0。
例如,在此图中,称为“文件”的检索项在用户号1的检索条件式的项号1以及2的项中以没有“非”条件的状态而存在,称为“识别”的检索项在用户号2的检索条件式的项号1的号中,以附有“非”的条件的状态而存在。
以下,用图10的PAD图来说明在图7所示的正文检索控制程序112中的执行正文检索处理的正文检索程序114的处理内容。
正文检索程序114如此图所示,首先在步骤1400中,作为正文检索的初始设定,将设置在检索项数计数表120中的检索项的出现数计数用区域以及设置在有限自动机121的输出表中的出现标记复位为0。
接着,在步骤1401中,起动正文扫描程序115,用由有限自动机生成程序110生成的有限自动机121,扫描存储在工作区123中的正文,核对检索项。
在由该有限自动机121进行的检索项的核对处理中,使用现有技术1所揭示的方法。
这时,关于在正文中出现了一致的部分字符串的检索项,将与其检索项对应的输出表的出现标志设定为1。
接着,在步骤1402中,起动检索项数计数程序116,进行在正文中出现了一致的部分字符串的检索项的计数工作。
其实现的方法是:查找设置在输出表中的出现标志是1的用户列表122,使在与检索项“非”标志是0的用户号和项号所对应的检索项数计数表120中的检索项的出现数计数用区域的值每次增加1。
接着,在步骤1403中,进行在正文中未出现一致的部分字符串的检索项的计数工作。
其实现的方法是:查找设置在输出表中的出现标志是0的用户列表122,使在检索项“非”标志是1的用户号和与项号所对应的检索项数计数表120中的检索项的出现数计数用区域的值每次增加1。
接着,在步骤1404中,起动检索条件核对程序117,参照检索项数计数表120,检查检索条件式是否成立。
这里,在以下的2个条件中,可以认为满足某个条件的检索条件式成立。条件(1):检索条件式“非”标志是0(即,在检索条件式上未加“非”条件),检索项数一致的项号至少是一个。条件(2):检索条件式“非”标志是1(即,在检索条件式上加有“非”条件),检索项数一致的项号一个也没有。
用图6说明有关该检索条件式是否成立的判断。
在本发明中,如此图所示,将用户126指定的检索条件式变成用“或”条件链接项的形式,将其每项包含的检索项数存储在检索项数计数表120中。
所谓用“或”条件链接项,就是说如果这些项的某一个成立,则其全部检索条件式成立。
在此,项是单一的检索项或检索项的“或”。
因此,当与包含在该项中的检索项一致的部分字符串全部出现在正文中的情况下,即,预先存储在检索项数计数表120中的检索项数、和由检索项数计数程序116算出的检索项出现计数一致的情况下,该项成立。
其结果,用项的“或”条件构成的检索条件式也成立。
这样一来,如果满足上述条件(1),则可认为检索条件式成立。
在上述条件(2)中,与条件(1)相反。
当在检索条件式上加有“非”条件时,如果从检索条件式中去除“非”条件的检索条件式成立,则加有“非”条件的原有的检索条件式不成立,如果从检索条件式去除“非”条件的检索条件式不成立,则加有“非”条件的原有的检索条件式成立。
如果预先存储在检索项数计数表120中的检索项数和由检索项数计数程序116算出的检索项出现计数一致的项一个也没有,则去除“非”条件的检索条件式不成立,加有“非”条件的原有的检索条件式成立。
这样,如果满足上述条件(2),则认为检索条件式成立。
因为认为满足上述条件的某一个的检索条件式成立,所以在步骤1405中,向正文检索控制程序112输出该用户号,结束此程序。
以上是本发明的文件检索方法的实施例。
以下,具体地说明有关在图4所示的实施例中的检索条件式登录控制程序106的处理顺序。
首先,说明在图4的检索条件式登录控制程序106的步骤800中的检索条件式分解程序107的处理。
检索条件分解程序107由检索条件式登录控制程序106起动。
例如,用式(1)表示「“文件”and(“检索”or“查找”)」,即所谓「包含“文件”,并且包含“检索”或“查找”的文件」的用户1的检索条件式的展开结果,用式(2)表示「“文字”and
(“识别”or“学习”)」,即所谓「“包含“文字”,但是既不包含“识别”也不包含“学习”的文件」的用户2的检索条件数的展开结果,用式3表示「
(“检索”and “学习”)」,即所谓「既不包含“检索”也不包含“学习”的文件」的用户3的检索条件式的展开结果。
式1
用户1:「“文件”and (“检索”or“查找”)」
→「(“文件”and“检索”)or(“文件”and“查找”)」
…(1)
式2
式3
其结果,可以得到在“或”条件的外侧未加“与”条件的检索条件式,即,「(“文件”and“检索”)or(“文件”and“查找”)」、「“文字”and
“识别”and
“学习”」、「
(“检索”and“学习”)」。
如果从用户号和项号的观点将包含在这些检索条件式中的检索项归纳成表,则形成表1。
例如,在用户号1的检索条件式的项号1中包含所谓“文件”和“检索”的2个检索项,在项号2中包含所谓“文件”和“查找”的2个检索项,在用户号2的检索条件式的项号1中,包含所谓“文字”、“识别”以及“学习”这3个检索项,其中,在“识别”和“学习”中表示加“非”条件。
接着,说明有关在图14的检索条件式登录控制程序106的步骤801中的检索项数计数表生成程序108的处理。检索项数计数表生成程序108,由检索条件式登录控制程序106,在检索条件分解程序107之后起动。
此程序根据由检索条件式分解程序107的分解结果,生成检索项数计数表120。
根据表1的分解结果生成的检索项数计数表120如图6所示。
在此表中,对各用户号分别与项号对应地存储检索项的数,
另外,如上所述,如果在检索条件式全体上加有“非”条件,则在检索条件式“非”标志中设定1,否则设定0。
最后,说明有关在图4的检索条件式登录控制程序106的步骤802中的检索用自动机生成程序109的处理。
本程序的处理内容展示在图8中。此程序如图2所示那样,由有限自动机生成程序110以及用户列表生成程序111构成。
以下,按顺序说明。
在有限自动机生成程序110中,生成用于核对由检索条件式分解程序107抽出的全部检索项的有限自动机121。
例如,在式(1)、式(2)、式(3)以及表1所示的例子的情况下,从检索条件式分解程序107的分解结果中,可以得到“文件”、“检索”、“查找”、“文字”、“识别”以及“学习”这6个检索项。
如果用现有技术1以及现有技术2揭示的方法,生成用于核对这些检索项的有限自动机121,则可以得到图9所示的有限自动机121。
但是,这里为了简单起见,用一个字即2字节为单位表示状态转移。
在用户列表生成程序111中,用列表来链接由检索条件式分解程序107得到的包含检索项的检索条件式的用户号、项号及其检索项上是否加有“非”条件的信息,以此生成用户列表122,通过指针与有限自动机121的输出表链接。
该用户列表122的生成方法如上所述。
由表1的分解结果生成的用户列表122展示在图11中。
例如,所谓“学习”的检索项,在用户号2的检索条件式的项号1的项上出现时附加“非”条件,在用户号3的检索条件式的项号1的项上出现时未附加“非”条件,所以用列表链接与这些相对应的号码的形式生成用户列表122。
而后,这样生成的用户列表122,通过指针与有限自动机121的输出表链接。
以上是在本实施例中的检索条件式登录控制程序106中的检索条件式登录的详细程序方法。
以下,具体地说明有关在图7所示的本实施例中的正文检索控制程序112的处理程序方法。
首先,说明关于在图7的正文检索控制程序112的步骤1100中的正文获取程序113的处理。
正文获取程序113由正文检索控制程序112起动。
在此程序中,在工作区123中存储由电子邮件发送的正文。
以下说明,用此程序将所谓「分解检索的文件的格式,识别字符串部分」的正文、存储在工作区123内的方法。
说明有关在图7的正文检索控制程序112的步骤1101中的正文检索程序114的处理。
本程序的处理内容展示在图10中。
本程序如图2所示,由正文扫描程序115、检索项数计数程序116以及检索条件式核对程序117构成。
以下,顺序说明。
首先,在上述正文扫描程序115、检索项数计数程序116以及检索条件式核对程序117执行前进行初始化设定。
这里,如图6以及图11所示,将检索项数计数表120的检索项的出现数计数用区域以及输出表的出现标志置为0。
在正文扫描程序115中,用有限自动机121扫描存储在工作区123中的正文,核对检索项。
这里,将对应于在正文中出现了一致的部分字符串的检索项的出现标志设定为1。
例如,如图12所示,若扫描正文「分解后的文件的格式,识别文字列部分」,则首先,“检索”出现在正文中。
这里,将与“检索”对应的出现标志设定为1。
以下,因为顺序地出现“文件”、“文字”、以及“识别”,所以将它们的检索项所对应的出现标志设定为1。
关于所谓“查找”以及“学习”的检索项,因为在正文中未出现一致的部分字符串,所以与这些检索项对应的出现标志仍保持原有的0。
在检索项数计数程序116中,首先,进行在正文中出现了一致的部分字符串的检索项的计数。
这里,在正文中出现一致的部分字符串,即出现标志是1的对立检索项上未加“非”条件的,即检索项“非”标志是0的用户号和项号所对应的检索项数计数表120的检索项的出现数计数用区域增加1。
例如,在图13的例子中,关于检索项“检索”,因为用户号3的项号1的检索项“非”标志是0,所以计数,而有关检索项“识别”,因为用户号2的项号1的检索项“非”标志是1,所以不计数。
接着,进行正文中未出现一致的部分字符串未出现的检索项的计数。
这里,在正文中未出现一致的部分字符串,即出现标志是0,将在检索项上加有“非”条件的,即检索项“非”标志是1的用户号和项号对应的检索项数计数表120的检索项的出现数计数用区域增加1。
例如,在图14的例子中,关于检索项“学习”,因为用户号2的项号1的检索项“非”标志是1,所以计数,而因为用户号3的项号1的检索项“非”标志是0,所以不计数。
接着,在检索条件式校(核)对程序117中,参照检索项数计数表120,检查检索条件式是否成立。
这里,在以下的2个条件中,由于认为满足任一个条件的检索条件式都成立,所以输出指定该检索条件式的用户的号码。条件(1):检索条件式“非”标志是0,即在检索条件式上未加“非”条件,检索项数一致的项号至少有一个。条件(2):检索条件式“非”标志是1,即在检索条件式上加有“非”条件,检索项数一致的项号一个也没有。
例如,在图15的例子的情况下,与用户号1对应的检索条件式“非”标志是0,因为项号1的检索项数和检索项出现计数一致,所以满足上述条件(1)。
另外,与用户号3对应的检索条件式“非”标志是1,因为检索项数和检索项出现计数一致的项号不存在,所以满足上述条件(2)。
但是,在用户号2中,尽管检索条件式“非”标志是0,然而因为检索项数和检索项出现计数一致的项不存在,所以不能满足任一上述条件。
据此,由于认为用户号1以及用户号3的检索条件式成立,所以输出这些用户号。
最后,说明有关在图7的正文检索控制程序112的步骤1103中的正文形成程序118的处理。
正文形成程序118,只是在作为上述正文检索程序114的结果输出用户号的情况下,由正文检索控制程序112起动。
在本程序中,将存储在工作区123中的正文形成为电子邮件程序119可以发送的形式。
例如,在正文的开头附加被称为标题的控制信息。
在图20中展示本程序的处理结果。
在此图中,作为标题附加了“To:”、“Subject:”、以及“From:”的各行。
在“To:”行上附加正文发送的地址,例如电子邮件的发送目的地的地址。
在图16中,由于向用户1以及用户3发送正文,所以记述成“用户1”以及“用户3”。
在“Subject:”行上附加用户容易识别的信息。
在此图中,选择发送的正文的最初的多个文字加以记述,而在此也可以附加别的内容。
“在From:”行上附加正文的发送源,例如电子邮件的发送源的地址。
在此图中,记述了作为发送正文的系统的名称的“文件检索发送系统”。
以上是在本实施例的正文检索控制程序112中的正文检索的详细的程序方法。
在正文检索控制程序112的处理结果中,当成立的检索条件式即使存在一个的情况下,如图3所示,在正文检索控制程序112结束后,由系统控制程序105起动电子邮件程序119。
在本程序中,参照由正文形成程序118附加的标题,由电子邮件发送正文。
例如,在图16的例子的情况下,参照与标题的“To:”行相当的部分,向在那里记述的地址发送附加有标题的正文。
在此图中,由于在“To:”行上记述成“用户1”以及“用户3”,所以向用户1和用户3发送正文,并结束处理。
如以上说明的那样,如果采用本发明,则在多个用户的检索条件式的登录时,存储已指定了包含在那些检索条件式中的检索项的用户识别信息和由该用户指定的检索条件式中所包含的检索项的数,在正文检索时,由于通过比较每个在正文中出现一致的部分字符串的每个用户的检索项的数和已经存储着的每个用户的检索项数,就可以判断全部的检索条件式是否成立,所以只用一次扫描就可以判断全部用户的检索条件式是否成立,可以一次进行与全部用户的检索条件式有关的检索处理。
其结果,可以实现根据用户预先登录的检索条件式,只用一次正文检索,判断多个用户的检索条件式是否成立,对于条件成立的用户可以立即发送从多个信息源得到的正文的即时性强的文件检索发送系统。
另外,由于该文件检索发送系统即时性强,所以从用户向系统发出检索条件式起到发送检索出的正文为止的时间短,通过观测此时间,就可以判断本发明是否适用。
以下,说明有关本发明的第2实施例。
在本实施例所示的文件检索发送系统中,通过对每个用户分别进行发送条件管理,就可以在某一程度上分批地发送正文,或在决定的时间发送正文等,可根据用户的要求以适当方式发送正文。
另外,在作为商业系统使用时,也可以根据与用户的签约条件来设置时间延迟,发送正文。
本实施例采用与第1实施例的图2所示基本相同的构成,但是其中主存储器104内的构成不同。
该主存储器104内的构成采取如图17所示构成。
如图17所示,在主存储器104a上确保有发送管理表2108,在系统控制程序105a的控制下,重新设置发送条件登录控制程序2100以及正文发送控制程序2104。
另外,在发送条件登录控制程序2100的控制下设置发送条件分解程序2101以及发送条件登录程序2102,在正文检索控制程序112a的控制下设置发送信息存储程序2103,在正文发送控制程序2104的控制下设置正文发送程序2105。
该正文发送程序2105由发送条件核对程序2106、电子邮件程序119以及发送信息更新程序2107构成。
在电子邮件程序119中,使用在工作站等中一般使用的现有的邮件程序。
以上的程序还可以存储在硬盘装置、软盘等的用计算机可以读写的记录媒体上。
系统控制程序105a接受由文件检索发送系统的管理者通过键盘101发出的指令来起动。
发送条件登录控制程序2100、检索条件式登录控制程序106、正文检索控制程序112a以及正文发送控制程序2104,根据来自用户126的发送条件和检索条件式的登录指令、来自键盘101的发送条件的登录指令以及来自新闻发布源125的正文发送,由系统控制程序105a起动,分别进行发送条件分解程序2101以及发送条件登录程序2102的控制;检索条件式分解程序107、检索项数计数表生成程序108以及检索用自动机生成程序109的控制、正文取得程序113、正文检索程序114、正文形成程序118以及发送信息存储程序2103的控制、以及正文发送程序2105的控制。
以下,说明有关在本实施例中的文件检索发送系统的处理内容。
首先,用图18的PAD图说明有关系统控制程序105a的处理内容。
在系统控制程序105a中,首先在步骤2200中,在从键盘101输入结束指令之前,循环执行以下的步骤。
在该循环处理中,首先在步骤2201中,检查是否有来自用户126的电子邮件或由键盘101输入的发送条件。
这里,在发送条件发送来的情况下,在步骤2202中,起动发送条件登录控制程序2100,进行发送条件的登录。
接着,在步骤2203中,检查是否有用户用电子邮件传送来检索条件式。
这里,在检索条件式已传送来的情况下,在步骤2204中,起动检索条件式登录程序106,进行检索条件式的登录。
接着,在步骤2205中,检查是否有从新闻发布源125用电子邮件传送来的正文。
这里,在有正文传送来的情况下,在步骤2206中,起动正文检索控制程序112a,进行正文的检索。
最后,在步骤2207中,起动正文发送控制程序2104,判断发送条件,只对满足条件的用户发送正文。
以上是系统控制程序105a的处理内容。
以下,说明有关第1实施例中没有的发送条件登录控制程序2100和正文发送控制程序2104以及与第1实施例处理不同的正文检索控制程序112a的处理内容。
首先,用图19的PAD图说明由发送条件登录控制程序2100进行的发送条件登录的处理内容。
发送条件登录控制程序2100由系统控制程序105a进行起动。
本程序,首先在步骤2300中起动发送条件分解程序2101,分解来自用户126的电子邮件或由键盘101的输入而发送来的发送条件。
在该发送条件的分解处理中,从发送条件中抽出以下的信息。
(A)设定发送条件的用户的识别符
(B)发送条件的形式
(C)发送条件的设定值
作为上述(B)的发送条件的形式,抽出「发送时间」、「发送件数」、「延迟时间」等发送条件的种类。
作为(C)的发送条件的设定值而抽出的值,例如(B)如果是「发送时间」则是其时间,如果是「发送件数」则是发送的件数,如果是「延迟时间」则是从检索开始到实际发送为止的经过时间。
例如,
用户号1:发送时间(18:00)
这个意味着“对于用户号1在18:00发送”,在该发送条件已传送来的情况下,抽出「用户号1」、「发送时间」以及「18:00」。
用户号2:发送件数(5)
这个意味着“对于用户号2积攒够5件后才发送”,在该发送条件已传送来的情况下,抽出「用户号2 」、「发送件数」以及「5」。
用户号3:延迟时间(01:03)
这个意味着“对用户号3延迟30分发送”在该发送条件已传送来的情况下,抽出「用户号3」、「延迟时间」、以及「01:30」。
最后,在步骤2301中起动发送条件登录程序2102,在发送管理表2108中存储由发送条件分解程序2101分解出的结果。
图20表示发送管理表2108的例子。
在发送管理表2108中以与用户号对应的形式存储由发送条件分解程序2101抽出的发送条件的形式和设定值,确保发送条件核对用区域以及发送正文号码存储用区域。
接着,用图21的PAD图说明有关由正文检索控制程序112a进行的正文检索的处理内容。
正文检索控制程序112a由系统控制程序105a起动。
在图21所示的此程序的处理内容中,步骤2500~2503中的正文获取程序113、正文检索程序114以及正文形成程序118的处理内容,与第1实施例所述的相同。
正文检索控制程序112a在步骤2504中,起动发送信息存储程序2103,在发送管理表2108的发送正文号码存储用区域中追加存储检索条件成立后应该发送的正文的号码。
接着,在步骤2505中,将存储在发送管理表2108的发送正文号码存储用区域中的正文号码的数目,或现在的时间存储在该表的发送条件核对用区域内。
这时,发送条件的形式是「发送件数」的情况下存储已存储正文号码的数目,在是「延迟时间」的情况下存储现在的时间。在是「发送时间」的情况下,什么都不需要存储。
其后,在步骤2506中,在工作区123中存储由正文形成程序118形成的正文。
最后,用图22的PAD图说明由正文发送控制程序2104进行的正文发送的处理内容。
正文发送控制程序2104由系统控制程序105a进行起动。
本程序,在步骤2600中起动正文发送程序2105,对每个用户判断发送条件,对于满足其条件的用户发送正文。
图23展示正文发送程序2105的详细的处理内容。
正文发送程序2105,首先在步骤2700中,对于在发送管理表2108中存储的发送条件的全部用户号,循环执行以下的步骤。
在该循环处理中,首先在步骤2701中起动发送条件核对程序2106,用发送管理表2108判断是否满足发送条件。
这里,如果满足以下的条件,则视为满足发送条件。条件(1):发送条件的形式是「发送时间」,发送条件的设定值和现在的时间一致,或现在的时间超过了发送条件的设定值。条件(2):发送条件的形式是「发送件数」,发送件数的设定值和存储在发送条件核对用区域内的件数一致。条件(3):发送条件的形式是「延迟时间」,发送条件的设定值和从存储在发送条件核对用区域内的时间起到现在的时间为止所经过的时间一致,或经过时间超过发送条件的设定值。
在满足上述条件的情况下,在步骤2702中判断为满足发送条件,在步骤2703中起动电子邮件程序119,向该用户号发送已存储在发送管理表2108的发送正文号码存储用区域中的号码的正文。
最后,在步骤2704中起动发送信息更新程序2107,将与已发送正文的用户号相对应的发送管理表2108的发送条件核对用区域和发送正文号码存储用区域复位。
这是通过将发送条件核对用区域执行清零操作,从发送正文号码存储用区域中删除正文号码而实现的。
以上是本发明的文件检索系统的实施例。
以下,用图24具体地说明在图19所示的本实施例中的发送条件登录控制程序2100的处理程序方法。
首先说明图19的发送条件登录控制程序2100的步骤2300中的发送条件分解程序2101的处理。
发送条件分解程序2101由发送条件登录控制程序2100起动。
本程序,分解从用户126发出的由电子邮件传送来的发送条件或由键盘101输入的发送条件。
作为一例,在图28中展示了对所谓「用户号1:发送时间(18:00)」、「用户号2:发送件数(5)」以及「用户号3:延迟时间(01:30)」这些发送条件的分解结果。
例如,在「用户号1:发送时间(18:00)」这种发送条件的情况下,作为分解结果,得到设定发送条件的用户号「1」、发送条件的形式「发送时间」、发送条件的设定值「18:00」。
接着,说明有关在图19的发送条件登录控制程序2100的步骤2301中的发送条件登录程序2102的处理。
发送条件登录程序2102由发送条件登录控制程序2100,在发送条件分解程序2101之后进行起动。
本程序,根据发送条件分解程序2101的分解结果,生成发送管理表2108。
在图24中展示了生成的发送管理表2108的例子。
在本表中,根据由发送条件分解程序2101的分解结果,与各用户号对应地存储发送条件的形式以及设定值。并且,确保发送条件核对用区域以及发送正文号存储用区域。
以上是在本实施例的发送条件登录控制程序2100中的检索条件式登录处理的详细程序方法。
以下,具体地说明在图21所示的本实施例中的正文检索控制程序112a的处理程序方法。
在图21所示的本程序的处理内容中,步骤2500~2503中的正文取得程序113、正文检索程序114以及正文形成程序118的处理内容与在第1实施例中详细叙述的相同。
以下,是在步骤2504~2506中的发送信息存储程序2103的详细的处理内容。
发送信息存储程序2103,由正文检索控制程序112a在正文形成程序118之后进行起动。
本程序,首先在步骤2504中,将正文的号码存储在与检索条件成立的用户号相对应的分发管理表2108的发送正文号码存储用区域内。
图25展示本程序的处理内容。
本图是对于59号的正文,用户号1以及用户号2的检索条件式成立情况下的例子。
因此,正文号码“59”被存储在与发送管理表2108的发送正文号码存储用区域的用户号码1以及用户号码2所对应的位置上。
接着,发送信息存储程序2103,在步骤2504中,将在发送管理表2108的发送正文号码存储用区域上存储的正文号码的数,或现在的时间存储在发送管理表2108的发送条件核对用区域内。
这时,当发送条件的形式是「发送件数」的情况下存储已存有的正文号码的数,当是「延迟时间」的情况下存储现在的时间。当是「发送时间」的情况下什么都不需要存储。
在图25的例子的情况下,因为用户号2的发送条件的形式是「发送件数」,所以使发送件数核对用区域的值增加1,变为“5”,由于用户号1的发送条件的形式是「发送时间」,所以什么都不变。
最后,发送信息存储程序2103在步骤2506中,在工作区123中存储由正文形成程序118形成的正文。
最后,说明有关在图22的正文发送控制程序2104的步骤2600中的正文发送程序2105的处理。
正文发送程序2105的详细的处理内容和图23所示的相同。
首先,在步骤2700中,对发送管理表2108中存储有发送条件的全部用户反复执行以下的处理。
在该反复处理中,首先在步骤2701中起动发送条件核对程序2105,判断发送条件。
这里,如果满足以下的条件,则认为满足了发送条件。条件(1):发送条件的形式是「发送时间」,发送条件的设定值和现在的时间一致,或现在的时间超过了发送条件的设定值。条件(2):发送条件的形式是「发送件数」,发送件数的设定值和存储在发送条件核对用区域内的件数一致。
条件(3):发送条件的形式是「延迟时间」,发送条件的设定值和从存储在发送条件核对用区域内的时间起到现在的时间为止所经过的时间一致,或经过时间超过发送条件的设定值。
用户号1的发送条件的形式是「发送时间」。
但是,由于现在的时间“14:00”没有超过发送条件的设定值“18:00”,所以未满足发送条件。因此,转移至以下的循环。
用户号2的发送条件的形式是「发送件数」,因为存储在发送条件核对用区域中的件数和发送条件的设定值“5”一致,所以在步骤2703中,起动电子邮件程序119,发送存储在发送管理表2108中的发送正文号码存储用区域中的号码的正文。
在本图中,因为将正文号码19、24、33、42、59存储在与用户号2对应的发送正文号码存储用区域内,所以在存储在工作区123中的正文中,具有同样号码的正文被发送给用户号2。
接着,在步骤2704中起动发送信息更新程序2107,将发送正文后的用户号、即将与用户号2对应的发送管理表2108的发送核对用区域以及发送正文号码存储用区域复位,进行以后的循环处理。
用户号3的发送条件的形式是「延迟时间」,由于从存储在发送条件核对用区域中的时间起到现在的时间为止所经过的时间和存储在发送条件的设定值中的时间“01:30”一致,所以在步骤2703中起动电子邮件程序119,发送存储在发送管理表3108的发送正文号码用的区域中的号码的正文。
在本图中,因为在与用户3对应的发送正文号码存储用区域上存储了正文号码53,所以在存储在工作区123中的正文中,有同样号码的正文被发送到用户号3。
接着,在步骤2704中起动发送信息更新程序2107,将发送正文后的用户号、即将与用户号2对应的发送管理表2108的发送核对用区域以及发送正文号码存储用区域复位。
图26展示全部的循环处理结束时的发送管理表2108。
因为对用户号2以及用户号3已进行了正文发送处理,所以与它们对应的发送条件核对用区域以及发送正文号码存储用区域被清零。
如上所述,如果采用本发明,则由于对于每个用户设定发送条件,按照此发送条件来发送条件成立的正文,所以可以在积蓄到某种程度时发送正文,或者在规定的时间发送正文,即按照用户的要求发送正文。
另外,在作为商业系统使用时,还可以按照与用户的签约条件来设定时间延迟发送正文。
其结果,可以实现灵活性强的文件检索发送系统,即根据用户预先登录的检索条件式,只用一次正文扫描,即可判断出多个用户的检索条件式是否成立,根据用户要求的各种发送条件,来发送从多个信息源得到的正文。
以下,说明有关本发明的第3实施例。
在本实施例所示的文件检索发送系统中,对每个用户分别管理包含在各用户指定的检索条件式中的检索项,当由用户指定删除检索条件式时,用管理的检索项查找有限自动机,通过重新设置用户列表的指针,就可以很容易从用户列表中删除以前的信息。
如果采用本实施例,则在由用户指示变更检索条件式的情况下,也很容易进行变更。
本实施例采用和第1实施例的图2基本相同的构成,但是其中主存储器104内的构成不同。
该主存储器104内的构成采取如图27所示构成。
如图27所示,在主存储器1046上确保检索项管理表3106,在系统控制程序1056的控制下,重新设置检索条件式删除控制程序3100。
另外,在检索条件删除控制程序3100的控制下,设置用户列表更新程序3101以及检索项数计数表更新程序3104,在检索条件式登录控制程序106b的控制下,设置检索项管理表生成程序3105。
该用户列表更新程序3101由有限自动机查找程序3102以及用户列表部分删除程序3103构成。
以上的程序还可以存储在硬盘装置、软盘等用计算机可以读写的存储媒体上。
系统控制程序105b可以由文件检索发送系统的管理者通过键盘101发出的指令进行起动。
检索条件式删除控制程序3100、检索条件式登录控制程序106b、以及正文检索控制程序112,根据来自用户126的检索条件式的登录和删除指令、以及来自新闻发布源125的正文的发送,由系统控制程序105b进行起动,分别进行用户列表更新程序3101以及检索项数计数表更新程序3104的控制、检索条件式分解程序107、检索项数计数表生成程序108、检索用自动机生成程序109、以及检索项管理表生成程序3105的控制、正文获取程序113、正文检索程序114以及正文形成程序118的控制。
以下,说明有关在本实施例中的文件检索发送系统的处理内容。
首先,用图28的PAD图说明有关系统控制程序105b的处理内容。
在系统控制程序105b中,首先在步骤3200中,直至从键盘101输入结束指令为止,循环执行以下的步骤。
在此循环处理中,首先在步骤3201中,检查用户126是否用电子邮件发送了删除检索条件式的指令。
这里,在发送了检索条件式删除指令的情况下,在步骤3202中起动检索条件式删除控制程序3100,进行检索条件式的删除。
接着,在步骤3203中,检查用户126是否用电子邮件发送了检索条件式。
这里,在发送了检索条件式的情况下,在步骤3204中,起动检索条件式登录控制程序106b,进行检索条件式的登录。
接着,在步骤3205中,检查是否从新闻发布源125由电子邮件传送来正文。
这里,在正文传送来的情况下,在步骤3206中起动正文检索控制程序112,进行正文的检索。
接着,在步骤3207中,检查在正文检索控制程序112中的正文检索的结果,在判断为成立的检索条件式即使存在一个的情况下,在步骤3208中起动电子邮件程序119,对于指定了成立的检索条件式的用户,用电子邮件发送相应的正文。
以上是系统控制程序105b的处理内容。
以下,说明一个在第1实施例中没有的检索条件式删除控制程序3100、以及与第1实施例处理不同的检索条件登录控制程序106b的处理内容。
首先,用图29的PAD图说明有关由检索条件式删除控制程序3100进行的检索条件式的删除处理的内容。
检索条件式删除控制程序3100由系统控制程序105b起动。
本程序,首先在步骤3300中起动用户列表更新程序3101,删除与指定删除检索条件式的用户号对应的用户列表122。
而后,在步骤3301中,起动检索项数计数表更新程序3104,删除与指定删除检索条件式的用户号对应的检索项数计数表120。
在图30中展示用户列表更新程序3101的详细处理内容。
本程序,首先在步骤3400中,按存储在检索项管理表3106中的检索项的数,循环执行以下的步骤。有关检索项管理表3106在以后说明。
在循环处理中,首先在步骤3401中起动有限自动机查找程序3102,通过用检索项来查找有限自动机121,得到与用户列表122链接的指针。
最后,在步骤3402中起动用户列表部分删除程序3103,通过重新设置用户列表122的指针,删除与进行检索条件式删除的用户号对应的列表。
以上是由检索条件式删除程序3100进行的检索条件式删除的处理内容。
以下,用图31的PAD图来说明由检索条件式登录控制程序106b进行的检索条件式的登录处理的内容。
检索条件式登录控制程序106b由系统控制程序105b起动。
在图31所示的本程序的处理内容中,有关在步骤3500~3502中的检索条件式分解程序107、检索项数计数表生成程序108以及检索用自动机生成程序109的处理内容,与在第1实施例中所述的相同。
检索条件式登录控制程序106b在步骤3503中,起动检索项管理表生成程序3105,在检索项管理表3106中存储包含在检索条件式中的检索项。
这里,在图32中展示生成的检索项管理表3106的例子。
在本图所示的检索项管理表3106,是由从所谓「“文件”and(“检索”or“查找”)」的用户1的检索条件式、所谓「“文字”and(“识别”or“学习”)」的用户2的检索条件式以及所谓「(“检索”and“学习”)」的用户3的检索条件式中抽出的检索项生成的表。
以上是本发明的文件检索方法的实施例。
以下,用图33具体地说明有关在图29所示的本实施例中的检索条件式删除控制程序3100的处理程序方法。
首先说明图29的检索条件式删除控制程序3100的步骤3300中的用户列表更新程序3101的处理。
用户列表更新程序3101由检索条件删除控制程序3100进行起动。本程序的详细处理内容与图30所示相同。
本程序在步骤3400中,按照存储于检索项管理表3106中的检索项数,反复进行步骤3401以及步骤3402。
在步骤3401中起动有限自动机查找程序3102,用检索项来查找有限自动机121,得到通向用户列表122的指针。
在步骤3402中,起动用户列表部分删除程序3103,删除已指定要删除检索条件式的用户号所对应的用户列表122。
在图33中展示用户列表更新程序3101的处理的例子。
本图的例子是:删除在检索条件式中包含「文字」、「识别」以及「学习」的、用户号2的检索条件式。
在检索项管理表3106中存储「文字」、「识别」以及「学习」,对这些检索项,进行循环处理。
在循环处理中,在步骤3401中,用「文字」、「识别」以及「学习」来查找有限自动机121,分别得到通向用户列表122的指针。
在步骤3402中,寻找这些用户列表122,删除与用户号2有关的用户列表122。
在本图中,在用户列表122中删除用户号“2”的部分。
接着,说明在图29的检索条件式删除控制程序3100的步骤3301中的检索项数计数表更新程序3104的处理。
检索项数计数表更新程序3104,由检索条件式删除控制程序3100在用户列表更新程序3101之后进行起动。
在本程序中,删除已指定要删除检索条件式的用户号所对应的检索项数计数表120。
在图34中展示本程序的处理例子。
如此图所示,删除与用户号2对应的检索项数计数表。
以上是在本实施例的检索条件式删除控制程序3100中的检索条件式删除的详细的程序方法。
以下,具体地说明有关在图31所示的本实施例中的检索条件式登录控制程序106b的处理程序方法。
在图31所示的本程序的处理内容中,在步骤3500~3502中的检索条件式分解程序107、检索项数计数表生成程序108以及检索用自动机生成程序109的处理内容,与第1实施例所述相同。
以下,说明在步骤3503中的检索项管理表生成程序3105的详细的处理内容。
检索项管理表生成程序3105,由检索条件式登录控制程序106b在检索用自动机生成程序109之后进行起动。
在本程序中,在检索项管理表3106中,存储作为检索条件式分解程序107的分解结果而得到的包含在检索条件式中的检索项。
图35展示本程序的处理例子。
此图的例子是用户号2的用户指定了所谓「“构造”and“识别”」,即「同时包含“构造”和“识别”的文件」的检索条件式。
如果用检索条件式分解程序107来分解该检索条件式,则可以得到所谓“构造”以及“识别”这2个检索项。
用与用户号对应的形式在检索项管理表3106中存储这些检索项。在此图中,在与用户号2对应的情况下,存储“构造”以及“识别”。
以上是在本实施例的检索条件式登录控制程序106b中的检索条件式登录的详细程序方法。
如上所述,如果采用本发明,则对每个用户分别管理包含在各用户指定的检索条件式中的检索项,在由用户指定检索条件式的删除时,用管理的检索项来查找有限自动机,通过重新设置用户列表的指针,就可以很容易从用户列表中删除以前的信息。
其结果,在根据用户预先登录的检索条件式,只用一次扫描正文,即可判断出多个用户的检索条件式是否成立,对于条件成立的用户立刻发送从多个信息源得到的正文。在这种正文检索发送系统中,可以实现根据用户要求可随时变更检索条件式的文件检索发送系统。
在本实施例中,说明了有关分别发送检索条件式的删除指令和登录指令的情况,但是很显然,即使在同时发送检索条件式的删除指令和登录指令,即发送更新指令的情况下,也可以通过连续进行删除处理和登录处理来适应新的情况。
另外,本实施例是对第1实施例追加了检索条件式的删除处理的例子,但是,很显然,对于第2实施例也可以适用。
Claims (21)
1.输入检索项和文件的文件检索系统用的文件检索方法,具有以下步骤:
存储与多个用户分别指定的、具有一个以上的检索项的多个项相关的多个检索条件式;
对每个用户都准备具有包含在上述多个检索条件式中的检索项的数的、检索项数计数表;
为了准备收集与上述多个项各自对应的用户的、用户列表18,扫描输入到上述文件检索系统中的文件的正文数据,使得其包含与多个用户指定的重复的一个项对应的上述多个用户;根据上述用户列表,准备项类型数计数表16,其中对上述每个用户分别收集在上述文件的上述正文数据中找到的项的类型数;
比较上述项数计数表的检索项数和上述项类型数计数表的数,查找两者一致的用户。
2.如权利要求1所述的文件检索方法,其中,向上述检索项数和上述项类型数一致的用户发送上述文件。
3.如权利项2中的信息处理装置,其中上述发送步骤前进行的扫描上述正文数据的次数是1次。
4.一种文件检索发送方法,具有以下步骤:
检索条件式登录步骤,将从一个以上信息源获得的文件信息的正文数据被作为对象,分别登录包含一个以上的检索项的多个用户指定的多个检索条件式;
正文检索发送步骤,用于在得到了正文时,为了判断与对该正文来说上述检索条件式是否成立,扫描一次该正文,对于与成立的检索条件式相对应的用户,发送该正文。
5.如权利要求4所述的文件检索发送方法,其中:
上述检索条件式登录步骤具有:
从上述检索条件式中抽出全部的检索项的检索条件式分解步骤;
检索项数计数表生成步骤,用于生成检索项数计数表,对每个用户分别存储包含用户和从该用户的检索条件式中抽出的全部检索项数的管理信息;
多重字符串核对表生成步骤,生成在由正文的一次扫描来核对从上述检索条件式中抽出的全部检索项时核对用的多重字符串核对表;
用户列表生成步骤,用于生成包含指定该检索条件式的、与从检索条件式中抽出的、各检索项对应的用户的用户识别符的用户列表;
上述正文检索发送步骤具有:
正文扫描步骤,在判断对于该正文来说上述检索条件式是否成立时,通过参照上述多重字符串核对表并扫描该正文,核对由上述检索条件式分解步骤抽出的全部检索项;
检索条件式是否成立判断步骤,通过核对由上述正文扫描步骤核对后的检索项和上述用户列表和上述检索项数计数表,判断对于该正文来说上述检索条件式是否成立。
6.根据权利要求2所述的文件检索发送方法,其中,
作为上述多重字符串核对表,使用有限自动机。
7.如权利要求2或权利要求3所述的文件检索发送方法,其中,
上述检索条件式是否成立的判断步骤具有:
检索项核对数计算步骤,参照上述用户列表,对每个用户分别算出由上述正文扫描步骤核对后的检索项的个数;
检索项数比较步骤,比较在上述检索项核对计算步骤中算出的检索项的个数和存储在上述检索项数计数表中的检索项的个数,在一致的情况下认为包含该检索项的检索条件式成立。
8.一种文件检索发送方法,具有:
发送条件设定式登录步骤,登录包含多个用户或系统管理者指定的记录有正文发送的条件的发送条件设定式;
正文检索步骤,通过一次扫描上述正文,判断上述多个检索条件式对该正文是否成立;
正文发送控制步骤,对于用上述正文检索步骤判断上述检索条件式成立的用户,在由上述发送条件设定式登录步骤所登录的上述发送条件成立时,发送上述正文。
9.如权利要求8所述的文件检索发送方法,其特征在于:
上述发送条件设定式登录步骤具有:
从上述发送条件设定式中抽出需要设定发送条件的用户的识别符和发送条件的、发送条件设定式分解步骤;
发送条件管理表生成步骤,生成用于存储在上述发送条件设定式分解步骤中从上述发送条件设定式中抽出的用户识别符和发送条件的发送条件管理表;
上述正文发送控制步骤具有:
参照上述发送条件管理表,判断上述发送条件是否成立的、发送条件是否成立的判断步骤;
在由上述发送条件是否成立的判断步骤已判断出上述发送条件成立时,向用户发送上述正文的正文发送步骤。
10.如权利要求9所述的文件检索发送方法,其中,
作为上述发送条件,使用发送的时间、发送的件数或从正文检索到发送的延迟时间。
11.一种文件检索发送方法,具有:
从多个用户指定的检索条件式中抽出全部的检索项的检索条件式分解步骤;
检索项数计数表生成步骤,生成对每个用户存储包含用户和从该用户的检索条件式中抽出的全部检索项数的管理信息;
多重字符串核对表生成步骤,生成在通过只一次扫描正文来核对从上述检索条件式中抽出的全部检索项时参照的多重字符串核对表;
用户列表生成步骤,生成由与从检索条件式中抽出的各检索项对应地指定了该检索条件式的用户的用户识别符作为列表而链接的用户列表;
从上述检索项数计数表以及上述用户列表中删除与指定删除的上述检索条件式有关的信息的检索条件式管理表删除步骤。
12.如权利要求11所述的文件检索发送方法,进一步具有:
检索项管理表生成步骤,生成用于存储由上述检索条件式分解步骤抽出的检索项的检索项管理表;
用户列表删除步骤,参照上述检索项管理表,从上述用户列表中删除指定了与包含在被指定删除的上述检索条件式中的上述检索项所对应的该检索条件式的用户的用户识别符;
检索项数计数表删除步骤,从上述检索项数计数表中删除与被指定删除的上述检索条件式相关的用户的管理信息。
13.一种文件检索发送装置,具有:
从多个用户指定的检索条件式中抽出全部的检索项的检索条件式分解装置;
检索项数计数表生成装置,生成对每个用户存储包含用户和从该用户的检索条件式中抽出的全部检索项数的管理信息的检索项数计数表;
多重字符串核对表生成装置,生成在由只一次扫描正文即可核对从上述检索条件式中抽出的全部检索项时参照的多重字符串核对表;
用户列表生成装置,生成与从检索条件式中抽出的检索项对应地指定了该检索条件式的用户的用户识别符被作为列表而链接的用户列表;
正文扫描装置,在判断对于该正文来说上述检索条件式是否成立时,通过参照上述多重字符串核对表,扫描该正文,核对由上述检索条件式分解装置抽出的全部检索项;
检索条件式是否成立判断装置,通过核对由上述正文扫描装置核对后的检索项和上述用户列表以及上述检索项数计数表,判断对于该正文来说上述检索条件式是否成立。
14.如权利要求13所述的文件检索发送装置,其特征在于:
作为上述多重字符串核对表,使用有限自动机。
15.如权利要求13或权利要求14所述的文件检索发送装置,
上述检索条件式是否成立的判断装置具有:
检索项核对数计算装置,用于参照上述用户列表,对每个用户算出由上述正文扫描方法核对的检索项的数;
检索项数比较装置,用于比较用上述检索项核对数计算装置算出的检索项的个数和存储在上述检索项数计数表中的检索项的个数,在一致的情况下,认为包含该检索项的检索条件式成立。
16.一种文件检索发送装置,具有:
发送条件设定式登录装置,用于登录包含多个用户或系统管理者指定的记录有正文发送的条件的发送条件的发送条件设定式;
正文检索装置,通过只一次扫描上述正文,即可判断出上述多个检索条件式对该正文是否成立;
正文发送控制装置,对于由上述正文检索装置判断出上述检索条件式成立的用户,在由上述发送条件设定式登录装置登录的上述发送条件成立时,发送上述正文;
发送条件设定式分解装置,从上述发送条件设定式中抽出需要设定发送条件的用户的识别符和发送条件;
发送条件管理表生成装置,生成用于存储在上述发送条件设定式分解装置中从上述发送条件设定式中抽出的用户的识别符和发送条件的发送条件管理表;
上述正文发送控制装置具有:
参照上述发送条件管理表,判断上述发送条件是否成立的发送条件是否成立的判断装置;
在由上述发送条件是否成立判断装置判断出上述发送条件成立时,向用户发送上述正文的正文发送装置。
17.如权利要求16所述的文件检索发送装置,
作为上述发送条件,使用发送时间、发送的件数或从正文检索到发送的延迟时间。
18.一种文件检索发送装置,具有:
登录用户指定的检索条件式的检索条件式登录装置;
从上述检索条件式中抽出全部的检索项的检索条件式分解装置;
生成对每个用户存储包含用户和从该用户的检索条件式抽出的全部检索项数的管理信息的检索项数计数表的检索项数计数表生成装置;
生成在由只一次扫描正文即可核对从上述检索条件式中抽出的全部检索项时参照的多重字符串核对表的多重字符串核对表生成装置;
生成由与从检索条件式抽出的各检索项对应地指定了该检索条件式的用户的用户识别符作为列表而链接的用户列表的用户列表生成装置;
从上述检索项数计数表以及上述用户列表中删除与被指定删除的上述检索条件式相关的信息的检索条件式管理表删除装置。
19.如权利要求18所述的文件检索发送装置,
进一步具有:
生成存储了由上述检索条件式分解装置抽出的检索项的检索项管理表的检索项管理表生成装置,
上述检索条件式管理表删除装置具有:
参照上述检索项管理表,从上述用户列表中删除指定了与包含在被指定删除的上述检索条件式中的、上述检索项相对应的、该检索条件式的用户的、用户识别符的用户列表删除装置;
从上述检索项数计数表中删除与被指定删除的上述检索条件式相关的用户的管理信息的检索项数计数表删除装置。
20.一种用于输入检索项和文件的文件检索系统用的、具有计算机可以读写的文件检索数据的记录媒体,包括:
具有分别包含在每个用户的多个检索条件式中的检索项的数的检索项数计数表;
收集了与上述多个项分别对应的用户的用户列表18;
对每个用户分别收集在上述文件的上述正文数据中找到的项的类型数的项类型数计数表16;
比较上述项数计数表的检索项数和项类型数计数表的数,两者一致的用户的列表。
21.如权利要求20的记录媒体,其中,向上述列表上的用户发送文件的步骤前进行的扫描上述正文数据的次数是1次。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP201348/96 | 1996-07-11 | ||
JP201348/1996 | 1996-07-11 | ||
JP20134896A JP4153989B2 (ja) | 1996-07-11 | 1996-07-11 | 文書検索配送方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1173676A true CN1173676A (zh) | 1998-02-18 |
CN1126053C CN1126053C (zh) | 2003-10-29 |
Family
ID=16439554
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN97114619A Expired - Fee Related CN1126053C (zh) | 1996-07-11 | 1997-07-11 | 文件检索方法、文件检索发送方法及装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US5970485A (zh) |
EP (2) | EP1351163A3 (zh) |
JP (1) | JP4153989B2 (zh) |
CN (1) | CN1126053C (zh) |
DE (1) | DE69728091T2 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100430896C (zh) * | 2002-10-29 | 2008-11-05 | 洛克希德马丁公司 | 硬件解析器加速器 |
CN104820666A (zh) * | 2014-01-31 | 2015-08-05 | 凯为公司 | 基于栈顶(tos)存储器的有限自动机处理 |
CN107533652A (zh) * | 2015-05-11 | 2018-01-02 | 株式会社东芝 | 识别装置、识别方法及程序 |
US10466964B2 (en) | 2013-08-30 | 2019-11-05 | Cavium, Llc | Engine architecture for processing finite automata |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6337552B1 (en) | 1999-01-20 | 2002-01-08 | Sony Corporation | Robot apparatus |
JP4406944B2 (ja) * | 1998-11-11 | 2010-02-03 | 株式会社日立製作所 | 計算機システム及び問合せに対する処理分散システム |
US6442589B1 (en) * | 1999-01-14 | 2002-08-27 | Fujitsu Limited | Method and system for sorting and forwarding electronic messages and other data |
JP2000339346A (ja) * | 1999-03-19 | 2000-12-08 | Hitachi Ltd | 類似文書検索配送方法および装置並びに類似文書検索配送プログラムを格納した記憶媒体 |
JP2004005749A (ja) * | 1999-03-19 | 2004-01-08 | Hitachi Ltd | 類似文書検索配送方法および装置並びに類似文書検索配送プログラムを格納した記憶媒体 |
US6381594B1 (en) * | 1999-07-12 | 2002-04-30 | Yahoo! Inc. | System and method for personalized information filtering and alert generation |
US6678684B1 (en) * | 1999-12-30 | 2004-01-13 | Makio Koga | Worldwide early warning network and method of use |
EP1122651B1 (en) | 2000-02-03 | 2010-05-19 | Hitachi, Ltd. | Method and apparatus for retrieving and delivering documents, and recording media storing a program therefor |
US7333983B2 (en) | 2000-02-03 | 2008-02-19 | Hitachi, Ltd. | Method of and an apparatus for retrieving and delivering documents and a recording media on which a program for retrieving and delivering documents are stored |
JP4155382B2 (ja) * | 2001-01-25 | 2008-09-24 | 富士通株式会社 | パターン検索方法、パターン検索装置、パターン検索プログラムを記録したコンピュータ読み取り可能な記録媒体、パターン検索システムおよびパターン検索プログラム |
JP3931214B2 (ja) * | 2001-12-17 | 2007-06-13 | 日本アイ・ビー・エム株式会社 | データ解析装置およびプログラム |
NL1019618C2 (nl) * | 2001-12-20 | 2003-06-24 | Koninkl Kpn Nv | Werkwijze, systeem en agent voor het versturen van informatie over een communicatienetwerk. |
US7386783B2 (en) * | 2003-04-28 | 2008-06-10 | International Business Machines Corporation | Method, system and program product for controlling web content usage |
US20050033855A1 (en) * | 2003-08-05 | 2005-02-10 | Ahmad Moradi | Method and apparatus for generating and marketing video e-mail and an intelligent video streaming server |
JP4881196B2 (ja) * | 2007-03-16 | 2012-02-22 | 富士通株式会社 | 情報検索装置および情報検索プログラム |
DK176835B1 (da) | 2008-03-07 | 2009-11-23 | Jala Aps | Fremgangsmåde til skanning, medium indeholdende et program til udövelse af fremgangsmåden samt system til udövelse af fremgangsmåden |
JP5247311B2 (ja) * | 2008-08-29 | 2013-07-24 | キヤノン株式会社 | 電子文書処理装置および電子文書処理方法 |
US9218629B2 (en) * | 2012-01-20 | 2015-12-22 | Blackberry Limited | Prioritizing and providing information about user contacts |
US8856130B2 (en) * | 2012-02-09 | 2014-10-07 | Kenshoo Ltd. | System, a method and a computer program product for performance assessment |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2702927B2 (ja) * | 1987-06-15 | 1998-01-26 | 株式会社日立製作所 | 文字列検索装置 |
DE69032712T2 (de) * | 1989-06-14 | 1999-07-01 | Hitachi, Ltd., Tokio/Tokyo | Hierarchischer vorsuch-typ dokument suchverfahren, vorrichtung dazu, sowie eine magnetische plattenanordnung für diese vorrichtung |
JP3413866B2 (ja) * | 1992-03-19 | 2003-06-09 | 株式会社日立製作所 | 情報検索装置 |
JPH06203076A (ja) * | 1993-01-06 | 1994-07-22 | Hitachi Ltd | 情報検索方法 |
JP3343989B2 (ja) * | 1993-05-17 | 2002-11-11 | 株式会社日立製作所 | 文書検索方法 |
US5721902A (en) * | 1995-09-15 | 1998-02-24 | Infonautics Corporation | Restricted expansion of query terms using part of speech tagging |
US5742816A (en) * | 1995-09-15 | 1998-04-21 | Infonautics Corporation | Method and apparatus for identifying textual documents and multi-mediafiles corresponding to a search topic |
US5675788A (en) * | 1995-09-15 | 1997-10-07 | Infonautics Corp. | Method and apparatus for generating a composite document on a selected topic from a plurality of information sources |
US5717914A (en) * | 1995-09-15 | 1998-02-10 | Infonautics Corporation | Method for categorizing documents into subjects using relevance normalization for documents retrieved from an information retrieval system in response to a query |
US5737734A (en) * | 1995-09-15 | 1998-04-07 | Infonautics Corporation | Query word relevance adjustment in a search of an information retrieval system |
US5873081A (en) * | 1997-06-27 | 1999-02-16 | Microsoft Corporation | Document filtering via directed acyclic graphs |
-
1996
- 1996-07-11 JP JP20134896A patent/JP4153989B2/ja not_active Expired - Lifetime
-
1997
- 1997-07-08 EP EP03015323A patent/EP1351163A3/en not_active Withdrawn
- 1997-07-08 DE DE69728091T patent/DE69728091T2/de not_active Expired - Lifetime
- 1997-07-08 EP EP97111527A patent/EP0818741B1/en not_active Expired - Lifetime
- 1997-07-10 US US08/891,064 patent/US5970485A/en not_active Expired - Lifetime
- 1997-07-11 CN CN97114619A patent/CN1126053C/zh not_active Expired - Fee Related
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100430896C (zh) * | 2002-10-29 | 2008-11-05 | 洛克希德马丁公司 | 硬件解析器加速器 |
US10466964B2 (en) | 2013-08-30 | 2019-11-05 | Cavium, Llc | Engine architecture for processing finite automata |
CN104820666A (zh) * | 2014-01-31 | 2015-08-05 | 凯为公司 | 基于栈顶(tos)存储器的有限自动机处理 |
CN104820666B (zh) * | 2014-01-31 | 2018-09-25 | 凯为公司 | 基于栈顶(tos)存储器的有限自动机处理 |
CN107533652A (zh) * | 2015-05-11 | 2018-01-02 | 株式会社东芝 | 识别装置、识别方法及程序 |
CN107533652B (zh) * | 2015-05-11 | 2021-01-12 | 株式会社东芝 | 识别装置、识别方法及记录介质 |
Also Published As
Publication number | Publication date |
---|---|
DE69728091T2 (de) | 2005-03-24 |
DE69728091D1 (de) | 2004-04-22 |
JP4153989B2 (ja) | 2008-09-24 |
CN1126053C (zh) | 2003-10-29 |
JPH1027182A (ja) | 1998-01-27 |
EP0818741B1 (en) | 2004-03-17 |
EP1351163A2 (en) | 2003-10-08 |
EP0818741A2 (en) | 1998-01-14 |
EP0818741A3 (en) | 2000-07-26 |
EP1351163A3 (en) | 2005-10-26 |
US5970485A (en) | 1999-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1126053C (zh) | 文件检索方法、文件检索发送方法及装置 | |
CN1293500C (zh) | 组织计算机网络中电子邮件文档的方法及电子邮件系统 | |
CN1301470C (zh) | 服务提供系统和服务提供方法 | |
CN1301478C (zh) | 用于制作返送邮件的电子邮件处理系统及其方法 | |
CN1110757C (zh) | 处理两种文字对照的数据库的方法与装置 | |
CN1453687A (zh) | 通信装置及系统、插入模块控制方法及记录媒体 | |
CN1155906C (zh) | 数据处理方法、系统、处理程序及记录媒体 | |
CN1969292A (zh) | 用户轮廓管理系统 | |
CN1645336A (zh) | 基于模板的异构日志信息自动提取与分析方法 | |
CN1501285A (zh) | 排版系统、排版程序和排版方法 | |
CN1834889A (zh) | 软件认证系统和软件认证程序及软件认证方法 | |
CN1225484A (zh) | 地址识别设备和方法 | |
CN1447261A (zh) | 特定要素、字符串向量生成及相似性计算的装置、方法 | |
CN1530855A (zh) | 布局系统和布局程序以及布局方法 | |
CN1517849A (zh) | 通过网络设定参数的方法及其主机 | |
CN1450483A (zh) | 信息处理装置及信息处理程序 | |
CN1826612A (zh) | 电子化服务指南显示程序、记录了程序的记录介质、电子化服务指南显示控制方法、电子化服务指南显示控制装置、程序传送方法、程序传送装置、程序接收方法、及程序接收装置 | |
CN1507202A (zh) | 设备管理系统、设备管理终端、网络设备、终端程序、设备程序以及设备管理方法 | |
CN1604076A (zh) | 文章信息处理装置 | |
CN1384454A (zh) | 信息概括系统和信息概括方法 | |
CN1826613A (zh) | 电子化服务指南显示程序、记录了程序的记录介质、电子化服务指南显示控制方法、电子化服务指南显示控制装置、程序传送方法、程序传送装置、程序接收方法、及程序接收装置 | |
CN1826615A (zh) | 电子化服务指南显示程序、记录了程序的记录介质、电子化服务指南显示控制方法、电子化服务指南显示控制装置、程序传送方法、程序传送装置、程序接收方法、及程序接收装置 | |
CN1215403C (zh) | 传输装置、源分组生成装置、分组模式确定方法 | |
CN1666188A (zh) | 无缝系统和记录介质以及计算机系统的处理继续方法 | |
CN1577266A (zh) | 程序变换方法、程序及存储媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20031029 Termination date: 20150711 |
|
EXPY | Termination of patent right or utility model |