CN103412866A - 能从事灵感思维和直觉思维的高智能搜索引擎 - Google Patents
能从事灵感思维和直觉思维的高智能搜索引擎 Download PDFInfo
- Publication number
- CN103412866A CN103412866A CN2013102344428A CN201310234442A CN103412866A CN 103412866 A CN103412866 A CN 103412866A CN 2013102344428 A CN2013102344428 A CN 2013102344428A CN 201310234442 A CN201310234442 A CN 201310234442A CN 103412866 A CN103412866 A CN 103412866A
- Authority
- CN
- China
- Prior art keywords
- search
- information
- formula
- inspiration
- intuition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明(能从事灵感思维和直觉思维的高智能搜索引擎)涉及人工智能和搜索引擎领域,由灵感搜索、直觉搜索和自动文摘生成“概念信息”、“三式信息”三项子发明共同构成。本发明将教会搜索引擎象人脑那样以灵感思维和直觉思维的方式进行问题解决和知识发现活动。其方法是,通过自动文摘和人工编辑的方法建立“概念数据库”,然后输入三式信息,用“概念检索”,的方法来模拟直觉思维,做出知识发现;通过人工编辑、自动文摘和上述知识发现的方法建立“三式信息数据库”,然后输入问题,用“关键词检索”,的方法来模拟灵感思维,搜索出答案,解决问题。直觉搜索(直觉机)主要用于知识发现,灵感搜索(灵感机)主要用于技术发明和问题解决。
Description
技术领域
本发明涉及人工智能和搜索引擎领域,是用计算机模拟人脑的灵感思维和直觉思维,在信息搜索的同时模拟人脑灵感思维的问题解决活动和直觉思维的推理和知识发现活动。
背景技术
众所周知,目前的计算机虽然具有存储记忆能力、数字计算能力、简单的逻辑判断能力等,但尚未具备象人脑那样的灵感、直觉等高级思维的能力。目前的人工智能虽然在模式识别、机器翻译、语音合成等方面取得了较大的进展,但在如何用计算机模拟人脑灵感、直觉等高级创造性思维,以实现知识的增殖和人类高级智慧的延伸方面,一直是一个难题。在信息检索方面,目前的搜索引擎和互联网只能搜集和传播现有的信息,但不能象人脑那样加工、生产出全新信息(知识),所以,今天的互联网和搜索引擎虽然已搜集和存储了大量的信息(知识),但它还是个“书呆子”,不会根据原有的知识增殖出新知识。本发明将教会搜索引擎(互联网)从事灵感思维和直觉思维,象人脑那样灵活地从事科学发现(推理)和技术发明(解决问题)活动,从而开启由机器生产知识产品的新时代,在人工智能、搜索引擎和互联网领域里引发一场革命。本发明与传统搜索引擎和人工智能的最大区别在于,它是基于心理学的一项发明,是在经过长期的心理学研究,破解了心理结构之谜以及人脑灵感、直觉思维之谜后,结合传统的人工智能和信息检索技术而做出来的一项技术发明。
发明内容
本发明的主要目的是:在人工智能方面,教会计算机象人脑那样从事灵感、直觉思维,并且在该方面逐步超越人脑,为把生产“知识产品”的“车间”由人脑移入电脑,实现人类“生产知识产品的机器大工业”打下基础;在信息检索方面,使现有搜索引擎增加两项新功能:灵感搜索(简称“灵感机”)和直觉搜索(简称“直觉机”),在搜索的过程中实现“问题解决”和知识增殖、知识创新,从而使互联网不再单纯是信息的收集和传播者,同时也成为信息(知识)的生产者,总之,这两项新功能将帮助人们解决科学发现和技术发明中的一些的问题,同时也能实现知识的创新和增殖。本发明有巨大的现实意义和辉煌的远景,其意义表现在,使计算机模拟人脑灵感、直觉等高级思维成为可能,并引发一场搜索引擎和互联网领域里的革命---由“知识的搜集者和传播者”到“知识的生产者和创新者”的转变,其远景就是“人类生产知识产品的机器大工业”,使知识产品的生产效率成倍提高!虽然一开始还比较简陋,但意义巨大,前景广阔,这就好比,20世纪初美国莱特兄弟发明的飞机,虽然一开始也比较简陋,但它是一种质变,使“比空气重的载人飞行器”成为现实,是人类航空工业和宇航工业的鼻祖和开端,意义巨大,前景辉煌!
原理、方法和步骤。本发明由“自动文摘生成‘三式信息’和概念信息”、“直觉机”和“灵感机”三项子发明共同构成。三项发明相互衔接、相互配合。其配合关系见附图1。首先,利用计算机的文摘系统,从互联网或其它电子文档中自动摘取相关词汇,组成三式信息和概念信息,其中的概念信息经人工整理后组成直觉机的“概念数据库”,然后把其中的三式信息输入到直觉机中,直觉机从自己的概念数据库中调取概念信息,参照刚输入的三式信息进行推理,触类旁通地生成更多的三式信息,然后再把这些新生成的三式信息存入灵感机的“三式信息数据库”,这样,当用户向灵感机中输入“怎样才能……?”一 类的问题时,灵感机用关键词检索的方法,从自己的三式信息数据库中搜索出符合该问题的一些“三式信息”答案,并把这些三式信息按相关度在搜索结果中进行排列。由于上述问题中和与其相关三式信息答案中包含有共同的关键词,所以,能够输入问题,搜索出答案。
常言道,“闻一知十,触类旁通”,《老子》中有“以身观身,以家观家,以乡观乡,以邦观邦,以天下观天下。吾何以知天下然哉?以此”(54章),上述事例说明,人脑具有根据已有知识,组合、生成新知识的能力,那么计算机呢,目前还没有这项能力,比如,搜索引擎虽然有搜集和检索信息的能力,但还没有生成新信息(知识)的能力,你向百度中输入一个关键词,比如“心理学”,它一瞬间就能检索出上亿个相关的搜索结果(网页),但这些搜索结果都是已有的老知识,而不是机器自动生成的新知识,而本发明的中的直觉搜索(又叫“直觉机”),就具有象人脑那样根据原有知识迅速生成新知识的能力,如附图2所示,你输入一个老知识(信息),它能在一瞬间能“触类旁通”地自动生成很多新知识(信息)。本发明中的灵感搜索(又叫“灵感机”),具有人脑那样的灵感思维的能力,能很好地解决“怎样才能……?”一类的问题,比如,你输入一个“怎样才能……?”的问题,它会自动地搜索出一个针对该问题的启示性答案,使你受到一个惊喜的启示,从而找到该问题的解决方案,就象阿基米德在洗澡时,受到一个意外的启示(人进入洗澡盆后,所排出的水的体积等于人体的体积),从而找到解决王冠问题的答案。只所以如此,是因为,直觉搜索是对人脑直觉思维的全真模拟,灵感搜索是对人脑灵感思维的全真模拟。总之,本发明中的搜索引擎,与以往搜索引擎的不同之处就在于,它在搜索的同时,能够生成新知识,能象人脑那样灵活地从事知识发现和技术发明活动。更奇妙的是,灵感机和直觉机是一对“连环马”,二者是相互支持、相互配合的, 这是因为,直觉机在“直觉搜索”中所自动生成的信息就是“三式启示信息”,这些三式启示信息可以充实到灵感机的数据库中去,以便灵感机更好地解决问题,而灵感机数据库中的三式启示信息,并不都是由直觉机自动生成的,还有一部分是由人工编辑和自动文摘形成的,这两部分启示信息,输入到直觉机中以后,每条就可以自动增殖出大量全新的启示信息,这些新生成的启示信息又可以充实到灵感机的数据库中去,所以,二者是互为基础,相互配合的。直觉机生产新知识的能力将达人脑的数万倍,而灵感机解决问题的能力也将达人脑的数万倍,机器比人脑聪明,将不再是神话,而会成为一种现实。下面对三个子发明的原理和过程分别预以说明。
一,自动文摘生成三式信息和概念信息的原理与方法。
什么是概念信息呢?概念信息就是我们通常所说的日、月、星、晨等各种概念,其中有日常生活方面的,也有各门学科中专用的概念,有物质方面的,也有精神方面的概念等。什么是三式信息呢?三式信息是指由一种以上的因素,导致的一种结果。它可以用“A+B=C”来表示。其中,A和B是因素项,C是结果项。由一种因素导致的结果可以表示为“空(或0)+B=C”;由两种因素导致的结果可表示为“A+B=C”;由三种因素导致的结果可表示为“(A1+A2)+B=C”;由四种因素导致的结果可表示为“(A1+A2)+(B1+B2)=C”;五种、六种因素等依此类推。三式信息可以有两种表达方式,一种是公式化的表达方式,如上面的包含“=”号的几个三式信息;另一种是自然语言的表达方式,下面分别举例说明。例1,自然语言表达:毒品能使人脑功能失调;公式化表达:(空)+毒品=能使人脑功能失调。例2,自然语言表达:人浸入水后,能使人的体积被显示、测量出来;公式化表达:人+浸入水=能使人的体积被显示、测量出来,例3,自然语言表达:用船、碎石、湖水和古代的 称重工具来称大象的重量,能使大象的重量被准确地称量出来;公式化表达:(船+碎石+湖水+古代称重工具)+大象=能使大象的重量被准确地称量出来。为什么能用自动文摘的方法来编辑、生成三式信息呢?这是因为,三式信息的含意是一种或几种因素导致了一个结果,因此,它在语言的表达上是有一定的规律的,比如,通常都会包含有“能使”或能够、能引起、能导致、可使、可引起、可导致等“标志性词汇”,在这些“标志性词汇”的后面,通常就是等号后面的C项(效果项),而其前面,通常就是等号前面的A、B项(因素项),三式信息的这种规律能够在语言文字上表现出来,所以,能用自动文摘的方法自动地编辑、生成三式信息,当然,自动文摘所生成的三式信息,可以有两种表达方式,一种是自然语言的表达方式,另一种是公式化的表达方式。同样的道理,由于概念是对同类事物进行抽象和概括的结果,因此,在语言表达上也必然是有规律的,例如,通常都包含有“分为抄“划分为”“种类有”“有以下几种”等标志性词汇,这些标志性词汇的前面通常是母概念,其后面则为子概念,所以,能用自动文摘的方法自动地编辑、生成概念信息,如果再配合以人工的整理、完善,就可以形成完整的概念系统。
具体实施方式
(1),利用自动文摘生成三式信息的具体方法是,首先,运行文摘系统,在一个网页或电子文档中找到“标志性词汇”“能使”(或能够、能引起、能导致、可使、可引起、可导致等),然后,以此为中心,向上扩展到一个句号或逗号,再向下扩展到一个句号或逗号,两个句号或逗号之间的文字、词汇即为一个完整的自然语言方式表达的三式信息。如果用公式化的方式来表达,可进一步利用中文分词技术,把“能使”前的文字、词汇分为A项和B项,并在“能使”前键入“=”号,即可形成一个完整的公式化的三式信息。例如,一个网页 中包含如下一段文字:【我们来看下面一个现象,搓手能使手的温度升高,这是因为用做功的方法使得手的内能增加,……】,在上面这段文字中,首先找要到标志性词汇“能使”两个字,然后向前扩展到一个逗号,向下再扩展到一个逗号,两个逗号之间就是我们所要的三式信息的自然语言表术“搓手能使手的温度升高”,用公式化的方法表达就是“搓手=能使手的温度升高”。再如,【论文摘要通过调查和研究,文章指出微格教学法在高职体育教学中应用能使教师的教学技能得到提高,达到良好的教学效果,对培养学生适应社会有积极作用。应该在高职体育教学中重视和推广微格…】在上述文档中,首先要找到“能使”这个标志性词汇,然后向上和向下各扩展到一个逗号,得到一个自然语言的三式信息“文章指出微格教学法在高职体育教学中应用能使教师的教学技能得到提高”,用公式化的表达即为“文章指出+(微格教学法+在高职体育教学中应用)=能使教师的教学技能得到提高”。由于目前的自动文摘和中文分词技术还不太成熟,因此,所生成的三式信息的质量还比不上人工编辑,不过,其最大的优点是速度上要比人工编辑快很多,因此,若能再配合以人工的审核、修正,效果会更好。从目前来看,由自动文摘生成的三式信息,有一部分完全正确(如第一例),不需要人工修正,同时也有一部分存在瑕疵(如第二例中的“文章指出”就是多余的),需要人工修正。我们利用计算机的文摘系统就能从庞大的互联网和电子文档资源中自动摘取出大量的三式信息。除了通过上述自动文摘生成三式信息外,也可以人工编辑三式信息,比如,当我们在自然界和人类社会中看到“某几种因素导致了一种效果”这样的自然现象或社会现象后,就可以把它编辑成一条三式信息,除了以上人工和自动文摘生成三式信息外,还可以通过直觉机来自动生成三式信息,方法是把人工和自动文摘生成的三式信息输入到直觉机中后,进行概念检索,直觉机能根据刚输入的三式信息,触 类旁通地自动生成大量的新三式信息,而且其编辑、生成三式信息的效率要比人工和自动文摘的效率还要高很多,这方面的内容下文有详述。
(2),利用自动文摘生成概念信息的具体方法是,首先,运行文摘系统,在一个网页或电子文档中找到标志性词汇“分为抄或“包括”、“分类以下种类”等,然后以此为中心,向前扩展至一个句号或逗号,向后也扩展至一个句号或逗号,“标志性词汇”前面便是母概念,后面便是其下的各子概念。例如,【科学探究活动通常包括以下要素:提出问题、猜想与假设、设计实验与制订计划、进行实验与收集证据、析与论证、评估、交流与合作】。此例中,标志性词汇是“包括”,其前的“科学研究活动”是母概念,其后的“提出问题、猜想与假设、设计实验与制订计划、进行实验与收集证据、分析与论证、评估、交流与合作”为子概念。
如果标志性词汇后面有1、2、3或一、二、三等分项语句,则应把各分项全部收录,直到最后一个分项后面的句号为至。例如,【根据我国国家标准的有关规定,汽车分为以下几种类型:1.货车,2.越野汽车,3.自卸汽车,4.牵引汽车,5.专用汽车,6.客车,7.轿车等】。此例中,首先要找出文档中的标志性词汇“分为以下几种类型”,其前面的汽车为母概念,其后面的1…7项为子概念。上述自动文摘生成的概念有时会有一些不完善的地方,因此,还需要经过人工的审核和修改,在此基础上,还可以做进一步的补充和完善,以形成一个完整、系统的“树型概念体系”,这一树型概念体系就是直觉机的“概念数据库”。
二,直觉搜索的原理及说明。
直觉搜索是对人脑直觉思维的全真模拟,什么是直觉思维呢,直觉思维就是我们常说的“闻一知十,触类旁通”,这里的“类”就是指概念,“通” 是指一种途径,或一种现象(三式信息),所以,直觉思维就是指是针对某一现象或事实,做出种种可能性的推论,如,牛顿看到苹果落地,推论出其它物体和地球之间,甚至万物之间也都有引力,就是一种直觉思维。直觉思维的出发点是某一现象或事实(如“苹果落地”),然后沿着概念的方向进行延伸,做出种种推论。上述现象或事实都可以用“三式信息”(A+B=C)来表达,意思是指“A和B相互作用,产生了一种结果C”。例如,“苹果+地球=相互吸引”,苹果和地球又都属于物体这一大概念中的一种,因此,沿着“物体”这一大概念进行延伸、推广,可以做出种种推论,推断出宇宙中其它物体之间,甚至所有物质之间都有吸引力。直觉思维的两个前提是三式信息和概念信息,因此,要想用直觉搜索来模拟它,首先就需要通过自动文摘或人工编辑的方法建立起一个“树型概念数据库”,里面收集各种概念信息,包括数、理、化、天、地、生、文、史、哲、法、政、经等各方面的概念,这些概念按级别和亲疏、远近的关系进行排列,然后向直觉机输入一个公式化的或自然语言的“三式信息”,进行概念检索,沿着概念方向延伸,做出种种推断,这一过程就是一个知识发现的过程,是对人脑直觉思维的全真模拟。在这一延伸、推断过程中,从“近亲概念”做出的推断为逻辑推断,从“远亲概念”做出的推断为直觉推断,从“超远亲概念”做出的推断为预感推断。这方面的6个公式化的示例说明见附图3、4、5、6、7、8.下面我们结合第8例做一些详细的说明。1893年的一天,丹麦科学家芬森偶然发现一只猫不断地随着阳光的变动而挪动位置,通过阳光照射的方法来治疗其身上的一处伤疤。受此启发,芬森提出了“光线疗法”——用适量光线照射的方法来治疗人类的某些疾病。其后,世界各国的科学家相继证明了光线疗法不仅适用于人类,也适用于任何动植物。光线疗法的诞生是人类运用直觉 思维的一个典型。从图8可知,所有推断中,根据其与原形信息中的“阳光”和“猫A”这两个概念的远近,可划分为三种不同类型的推断:逻辑推断(如(1)(2)(3))——与“阳光”或“猫A”为近亲概念);直觉推断(如(4)(5)(6))——与阳光或猫A为远亲概念);预感推断(如(7)(8)(9))——与阳光或猫A为超远亲概念)。在上述三种推断中,逻辑推断的正确率最高,接近100%,可能性最大,可称之为“肯定性推断”;直觉推断的正确率较高,大约50%,可能性较大;预感推断的正确率最低,大约10%,可能性最小。直觉推断和预感推断都属“可能性推断”,可以合并称为“直觉推断”。逻辑推断的正确性几乎不必验证,而直觉推断和预感推断的正确性有待实验或实践的进一步验证。在正确率方面,一般来说,人工编辑的三式信息的正确率最高,肯定是100%,这是因为,人工编辑的三式信息是根据在科研、工作、生产或生活中所看到的某一现象实事所编辑而成的,它本身就是一个事实,因此,其正确率肯定是100%的,但直觉搜索中所产生的三式信息,其正确率却并非都是100%的,而是随概念间的远近关系的不同而有所不同的。
有益的效果。牛顿发现万有引力的案例告诉我们,机遇+观察+概念=知识发现(直觉思维),一个人首先遇到一个机遇,然后进行了观察,从中得到一个三式信息,接着调用自己头脑中的概念进行推断,才能做出知识发现。可见对于知识发现来说,机遇、观察、概念三者缺一不可,专家们的头脑中有丰富的概念,但若没有机遇,得不到三式信息,也不能做出知识发现,同样,普通人有机遇观察到某一个三式信息,但因头脑中没有概念,同样不能做出知识发现,但移动互联网和直觉机很好地克服了这一缺点,直觉机收录了数十亿人头脑中的概念,每个人利用手中的终端(如手机)又能把自己看到的某个三式 信息输入直觉机进行知识发现,可见,直觉机把一个人的机遇、观察和概念变成了数十亿人的机遇、观察和概念,所以,能够使人类知识增殖的速度得到极大的提高。
直觉搜索的应用领域和消费群体。直觉搜索的应用领域非常广泛,可应用于社会科学、自然科学、心理学等各知识领域。输入自然现象,得出自然规律;输入社会现象,得出社会规律;输入心理现象,得出心理规律。消费群体方面,中国科学院、中国工程院、中国社会科学院,以及其他国有或民间的研究机构,各企业研究机构,各高等院校,社会上(民间)一些从事科学研究工作的个人等都是直觉搜索的消费群体。比如,一名科研人员在做科学实验的过程中,看到一种新奇的自然现象,把它编辑成一条三式信息,输入直觉机,然后就能得出成千上万个引申推论(三式现象信息),最后还能得到一个总结性的“三式理论信息”(自然规律),比如,上述第3、5、6、8例直觉思维。同理,一名社会科学工作者在社会上看到一种社会现象,把它编辑成一条三式信息,输入直觉机,就能得到一条社会规律(或商业规律、经济规律)。比如,上述第4例“信用卡发明中的直觉思维”。“直觉机”数据库中的概念信息远多于人脑中的概念信息,因此,上述人员需要借助于直觉机来实现知识增殖和做出科学发现。这些新发现和新增殖的知识,可以直接应用教育、军事、工业、商业、科研、甚至日常生活等领域,而且还可以输入到灵感机的数据库中,通过灵感搜索来解决问题。
附图说明
图1是文摘系统、直觉机、灵感机三者之间的关系示意图。
图2是直觉搜索的示意图。
图3是“顿发现万有引力”事件中的直觉思维示意图。
图4是“信用卡”发明中的直觉思维示意图。
图5是“布郎运动”发现中的直觉思维示意图。
图6是“光电效应”现象发现中的直觉思维示意图。
图7是直觉思维的数学抽象模型图。
图8是“光线疗法”诞生中的直觉思维示意图。
图9是直觉搜索的检索方法…逻辑推断和直觉推断的划分示意图。
图10是直觉搜索的“树型概念数据库”示意图。
图11表示“外启型灵感思维的过程”图,即“2吸3”的过程图;
图12表示“内启型灵感思维的过程”图,即“2吸3”的过程图;
图13表示“外启型”和“内启型”灵感思维过程的抽象模型图。
具体实施方式
直觉搜索的实施需要三个关键步骤,一是建立“概念数据库”;二是确定概念检索的方法。三是教会(直觉搜索的)用户如何编辑“三式信息”进行概念检索;
一,概念数据库的建立方法:首先通过上述自动文摘生成概念的方法,收集各领域里的大量概念,然后经过人工的审核和进一步的补充、完善,形成一个“树型概念数据库”,并给其中的每个概念确定级别。概念最基本的分类就是物质概念和精神概念,物质的概念如,生物、非生物、动物、植物等,精神的概念如,自由、尊重、智慧、信仰、理想、心理学、哲学等,物质概念是对物质世界的分类和概括,精神概念是对精神世界和精神产品的分类和概括。这一树型概念结构见附图10。在这一树型概念数据库中,最高级别的概念是“元概念”,为一级概念,其下有两个二级概念“物质”和“精神”,物质又分为生物和非生物,精神又分为哲学、心理学以及其它各门学科等概念,总之,现有的任何一个概念都能在此数据库中找到自己的级别和位置,将来新产生的任何一个概念,也都能在此数据库中找到自己相应的级别和位置。因为它们都逃不出物质和精神这两大范畴,此数据库类似于人类的家谱,每个概念在这一家谱树 中都有自己的系别、级别和位置,除最高的元概念外,每个概念也都有自己的上级、平级和下级概念,有些概念可能暂时还没有下级,但将来会有下级概念的。
概念数据的来源。现有的互联网、电子文档、学术书籍,辞海、词典,百度百科词条等,都是概念数据库的重要来源,可以通过自动文摘和人工编辑的方法从中收集、编辑大量的概念信息组成概念数据库。
二,检索的方法(检索器)。直觉机的检索方法见附图9。当用户向直觉搜索引擎中输入一个“三式信息”(C5+P=Q)后,以C5和P为起端(原型概念)开始检索,检索的结果分为两档,一档是逻辑推断,另一档是直觉推断,其中,逻辑推断在搜索结果中的排序要优先于直觉推断。前文已述,C5和P的近亲概念为逻辑推断,远亲概念和超远亲概念为直觉推断和预感推断,由于逻辑推断是一种肯定性的推断,而直觉推断和预感推断都是一种可能性的推断,所以,为了简便,这里把直觉推断和预感推断合二为一,都称之为“直觉推断”。现在只有两种推断,近亲概念为逻辑推断,远亲和超远亲概念为直觉推断。那么如何确定近亲概念和远亲概念呢?方法是,(1),“起始概念”C5和P以下的各级直系子概念都是C5和P近亲概念(如附图7中,C5就是一个起始概念,C5以下的各级直系子概念如D1、E1、F1、F5等都是C5的近亲概念);(2),与起始概念平级的三代(级)以内旁系概念都是C5和P近亲概念(如附图7中与C5平级的C1到C9中的8个概念都是C5的近亲概念);(3),除此之外的所有其它概念都属远亲概念。也可以从上述“三代内旁系平级”和“直系下级”的两个范围内选取一定数量(如30至60个)的近亲概念做出逻辑推断,其它的都做为直觉推断。这里的“起始概念”就是指用于检索的(输入到直觉机中的)三式信息“C5+P=Q”等号左端的C5、P两项,而不包括等号右端的Q项,因 为Q项不是一个概念项,它只是对某种效果的描述。比如,在三式信息“苹果+地球=相互吸引”,“苹果”和“地球”就是两个起始概念。图7中的C5就是相当于“苹果”这样的一个起始概念。我们还来拿“牛顿发现万有引力”这一案例来说明直觉机的检索过程和方法。当我们向直觉机中输入一个三式信息“苹果+地球=相互吸引”后,开始概念检索,“苹果”和“地球”是两个起始概念,首先要分别确定这两个起始概念的近亲概念,近亲概念确定后,其它概念都是远亲概念。苹果的所有直系下位概念,比如产自不同的国家和地区的苹果,以及不同品种的苹果(如,红星、富士)等,都属于近亲概念,苹果的同级3代内的旁系概念如桃、梨等水果,这些也都属于近亲概念,从这些概念中先出30-50个做出逻辑推断,它们要优先出现在搜索结果中,地球的直系下属概念如各大山脉、高原、平原、海洋等,高原又可进一步分为青藏高原、内蒙古高原等,海洋又可进一步分为四大洋等,并可一级一级地向下分,也些直系下属的各级子概念都属于近亲概念,地球的同级的三代内的旁系概念如水星、火星、金星、木星等,由上述近亲概念做出的推断都属于逻辑推断,除此之外的概念都属地球的远亲概念,由其做出的推断都属于直觉推断。这样,输入“苹果+地球=相互吸引”后,搜索的结果,其数量可能非常惊人,会有上亿条搜索结果,最后还有一条总结性的三式理论信息“物质+物质=相互吸引”。为了避免这样出现过多的不必要的搜索结果,可以采用从不同级别的概念中分别挑选一个有代表性的概念组成三式信息,这样就可大大减少搜索结果的数量。此外,实践中,大多数三式信息输入直觉机后,都只适合做小范围的近亲概念间的检索,一旦扩大检索范围,就会出现错误的三式信息(推断),象万有引力这样适合大范围进行概念检索的案例只是极少数,所以,对于大多数三式信息而言,在近亲概念的范围内做出30到60个推断就可以了,在远亲概念范围内,再选择不 同级别的概念分别做出5到10个推断即可,这样就可以避免出现错误率太高和搜索结果数量太大的弊端,当然,如果遇到特殊情况,发现需要做进一步的大范围的概念检索,那么再做更详细的检索也可以,这叫特殊问题特殊对待,这样的特例只是极少数,所以不会造成不利的影响。也就是说直觉搜索可以分为简单搜索和详细搜索两种类型,通常情况下仅做简单搜索,如果用户需要,可以再做进一步的详细的搜索,以得到更多的搜索结果。
除了上述检索规则外,对于比较复杂的情况还要注意以下检索规则,1,在C5项或P项中,若有复合词,则只检索名词概念,不检索其它词类的概念;2,若复合词由两个以上的名词构成,要分别检索其中所包含的每一个名词概念。例如,“容易忘记的资料+笔记记录=使其长久保持,不消失”“章鱼的爪+爪底部的凹形吸盘=能使章鱼爪牢固地贴在其它物体上、不打滑”。上例中的动词、形容词如“容易忘记、记录”等非名词的概念,都不在检索的范围。而对于复合的名词如“章鱼的爪”,要对其中的两个名词概念“章鱼”和“爪”分别进行概念检索,并分别做出逻辑推断和直觉推断。
三,用户编辑“三式信息”的方法。上述“概念数据库”建好后,用户只需向直觉搜索的搜索框中输入一个“三式信息”,就能搜索出大量的全新的“三式现象信息”和一个“三式理论信息”。那么如何编辑“三式信息”呢?方法是,当我们看到的一个自然、社会或心理现象时,把它编辑成“三式信息”的形式,例如,
“人浸入水+所受浮力=人排开水的重量”
“玉米花+盐酸溶液=能改变玉米花的颜色”
“信用卡+餐馆消费=(方便+安全)”
以上是公式化的三式信息,当然也可以编辑成自然语言形式的三式信息,如 第一例如用自然语言表达就是“人浸入水后,所受到的水的浮力等于人排开水的重量”。这两种形式的三式信息输入直觉机后,都可以进行概念检索,并做出逻辑和直觉的种种推断,因为概念检索主要是对名词概念进行检索(替代),所以,即使用自然语言的方式表达,也不妨碍这种检索的进行。
上述三个条件具备后,就可以把人工编辑或上述自动文摘生成的三式信息输入直觉机进行搜索,以得到自己想要的三式现象信息和三式理论信息。
三,灵感搜索的原理及说明。
灵感搜索是对灵感思维的全真模拟,什么是灵感思维呢?灵感思维又叫“顿悟”,它通常出现在人们解决问题的过程中,是人们在对某一问题久思不得其解时,突然受到某种意外的启示而直接得出了问题的答案。可见,灵感思维的发生有两个前提:(1)疑问信息;(2)启示信息。可以用这样一个公式来表示灵感思维:“灵感=疑问信息+启示信息”。灵感思维发生的过程是:一,遇到某一需要解决的问题(该问题通常是:“怎样才能……?”的问题),从而在意识(头脑)中产生了一个“疑问信息”;二,来自内部“潜意识”或来自外界的某一“启示信息”进入意识;三,该“疑问信息”和“启示信息”在意识中发生“合并”(或融合),从而把“疑问信息”变为“肯定信息”,使问题得以“解决。例如,阿基米德面对“王冠问题”一筹莫展,而在洗澡中得到启示信息后,其王冠问题很快得以顺利解决。类似事例在中外科技史上不胜枚举。
根据启示信息的来源的不同可以把灵感思维分为两类:“外启型灵感”和“内启型灵感”。如果“启示信息”来源于外界,则该灵感思维就属“外启型灵感”;如果启示信息来源于内部“潜意识”,则该灵感思维就属于“内启型灵感”。例如,阿基米德解决王冠问题过程中的灵感思维就是“外启型灵感”的典型。这一灵感思维的过程见附图11。循环锅炉发明中的灵感思维是“内启型灵感” 的一个典型。日本人田雄,一直为“怎样才能改进、提高锅炉的热效率”这一问题绞尽脑汁,久思不得其解。一天,他突然想到自己所学过的医学生理学书籍,书中有关血液循环方面的知识使他顿开茅塞,找到了问题的答案,并最终发明出循环锅炉来。田雄的这一灵感思维过程见附图12.
所有灵感思维都有一个共同的特征,这一共同特征可用“2吸3”来概括。2是指“二式疑问”,3是指“三式信息”,“二式疑问”就是“怎样才能如何如何?”一类的问题,用数学模型来表示就是“A+?=C”,意思是怎样使A达到C那样的效果。例如:
“王冠+?=能使王冠的体积被显示、测量出来”;
“气球+?=能使气球获得上升力?
与三式信息一样,二式疑问也可以有两种表达方法,公式化的表达方法和自然语言的表达方法,以上两例就是公式化的表达方法,如果用自然语言的方法来表达就是“怎样才能使王冠的体积被显示、测量出来”;“怎样才能能使气球获得上升力?”,疑问信息是“2”,启示信息是“3”。位于意识中的疑问信息“2”,吸引潜意识中或外界中的启示信息“3”进入意识,并与该疑问信息发生合并,从而完成一个灵感思维,使问题得以解决。疑问信息“2”可以用抽象的数学字母表示为:“A1+?=C1”;启示信息“3”则可表示为:“A2+B2=C2”。内启型和外启型灵感思维过程可以用一个抽象的数学模型来表示,该模型的图示见附图13。
“二式疑问信息”吸引内部潜意识或外界中的“三式启示信息”进入意识,并与该三式启示信息发生合并,从而完成一个灵感思维,使问题得以解决,所以灵感思维又叫“2吸3”思维。这里的A1和A2;B1和B2是同类物,属于同一概念;C1和C2属于同一类表述。如,“人”和“王冠”同属“有形固体”这 一概念;“能使人的体积显示、测量出来”与“能使王冠的体积显示、测量出来”属于同一类表述。
怎样用计算机模拟人脑的灵感思维呢?可以用传统的“关键词”检索技术进行模拟,这是因为,灵感思维中的“二式疑问信息”和“三式启示信息”都可用语言、符号表达(示)出来,而且,“二式疑问”右端和“三式信息”右端中包含有共同的语言、符号,即“同名”的、“相重叠”的词汇、符号。此类共同的词汇、符号即是“共同关键词”,例如:
(1)“防毒面俱”发明中的灵感思维:
共同关键词:能使……防……毒气
(2)鲁班发明锯子中的灵感思维。
共同关键词:能使……锋利地划破……。
(3)“铁丝花盆”和“钢筋混凝土”发明中的灵感思维:
共同关键词:能使…………坚固、耐摔打、磕碰、不易碎
(4)“凹形运动鞋”发明中的灵感思维:
共同关键词:能使……牢固地贴在……、不打滑。
所以,用这些共同的词汇作为关键词进行检索即可实现:输入二式疑问信息,得到三式启示信息,也即“输入疑问,得到答案”。具体的做法是:首先,通过人工编辑和自动文摘的方法,收集各知识领域里的大量的三式信息,然后,把这些人工编辑和自动文摘生成的三式信息输入到直觉机中,由直觉机推断出更多的三式信息,并汇集成一个庞大的“三式信息数据库”,这样,当我们遇到“怎样才能……?”一类的问题时,就不必坐等机遇(即启示信息)的到来,而只需向计算机输入自己的二式疑问(既可以是自然语言的二式疑问,也可以是公式化的二式疑问),即可检索出自己所需要的启示信息(即三式信息)。下面再列举几个中外历史上的灵感思维案例,以说明疑问信息(二式疑问)和启示信息(三式信息)在关键词方面的对应、重叠关系:
(5)中国工程院院士张济生发明“竹材加工法”中的灵感思维:
共同关键词:能使……在被施加压力的情况下不断裂。
(6)“威尔逊云室”发明中的灵感思维:
共同关键词:能使……的微小的径迹放大、显示出来。
从上述6例灵感思维中,我们可以看出,每一个二式疑问信息和三式启示信息的右端中都包含有重复词,即共同关键词。
中外科技史上的许多发现和发明都是科研人员在久思不得其解而又受到意外的启示的情况下做出来的。例如,阿基米德在洗澡时得到启示信息,使王冠 问题得以解决;科学实验中用于观测微观粒子径迹的“云室”的发明是英国科学家威尔逊(18691959)受到雨后彩虹的启发后做出来的;比“云室”更胜一筹的“气泡室”是美国科学家格拉塞尔(1926—)在喝啤酒时受到瓶中冒出气泡的启发而做出来的(以上二人都是在久思不得其解的情况下受到上述两个意外的启示,获得灵感的,而且都因自己的发明而获得了诺贝尔奖);日本发明家鬼冢喜八郎在吃饭时受到章鱼吸盘的启发,从而使自己发明“能牢固贴紧地面”的运动鞋的难题迎刃而解,顺利地发明出“凹形运动鞋”……类似事例不胜枚举,科研人员能从微不足道的日常现象中得到启示,从而做重大发明、发现,这表明,在我们的日常生活和日常现象中隐藏着大量的三式信息(启示信息),可以说此类三式信息遍地都是,如果我们能事先把其收集起来,存入计算机中,科研人员再遇到某些难题时就不必再坐等外部机遇(启示信息)的到来,而是只需向“灵感机”中输入一个简短的关键词,瞬间就可得到自己所需的启示信息,从而使自己的难题得以顺利解决,使科研效率大大提高。除了上述日常生活、日常现象外,许多专业书籍和报刊杂志中也都隐藏着大量的三式信息,如,回旋加速器是美国科学家劳伦斯(1901——1958)在阅读书籍时,受到书中一幅插图的启发后发明出来的;“空气制动器”的发明是美国发明家乔治(1846——1914)在看报纸时受到一则关于“使用压缩空气推动风钻开凿山间隧道”的消息报道后做出来的。因此,只要我们能从日常现象、各类书、报、刊乃至因特网上收集大量的三式信息,建立起人工三式信息数据库,然后再经过直觉机的扩大和增殖,就可实现对人脑灵感思维的计算机模拟。
比起传统的计算机信息检索,灵感机最大的特点和优点就是,其信息检索的过程就是对灵感思维的模拟过程;其检索的速度快、效率高,只要你输入自己的二式疑问(公式化的或自然语言的两种形式都可以),就可“一针见血”, 瞬间检索出自己所需的启示信息,而且在完成信息检索的同时,还能实现知识的增殖(把“二式疑问”转变成新的“三式信息”)。如阿基米德在解决王冠问题的灵感思维思维过程中,把其疑问信息“王冠+?=能使王冠的体积被显示、测量出来”变成了肯定信息“王冠+浸入水=能使王冠的体积被显示、测量出来”,即实现了知识的增殖。而传统的信息检索只能检索(提取)出原先所储存的信息,检索的结果并不能实现知识的增殖。此外,许多常见的、微不足道的日常现象信息(这些信息是许多专业书籍和因特网服务器中所不屑收集的),到了“灵感机”的数据库中却能发挥出巨大的威力,导致重大发明的诞生。如上述第(5)例中的“木棒+高温软化=使木棒在被施加压力的情况下不断裂”;第(6)例中的“阳光+云雾=彩虹”;第六例中的“灵感+笔记=……”;第(4)例中的“章鱼爪+凹形吸盘=……”等……,这些三式信息都是很常见的、微不足道的日常现象信息,它们是许多专业书籍中和因特网上所不屑收集的,但到了“灵感机”的数据库中就能发挥出“出人意料”的巨大作用。
灵感机所储存的三式信息的数量越大,其灵感思维能力就越强,这一点和人脑是一样的,比如一个人没有知识就不能进行发明和创造,犹如不懂语言就不能做诗一样;如果我们的头脑中没有相应的启示信息,就只能坐等外部的机遇(启示信息)的来临,否则,灵感思维就无从发生;相反,如果我们的潜意识中储存有相应的启示信息,就不必坐等外部的机遇,从以往的知识、经验中即可得到启示,从而使灵感思维得以完成,问题得以解决;而且我们潜意识中所储存的启示信息(三式信息)越多,则我们的灵感思维能力和解决问题的能力也就越强。“灵感机”的重要意义就在于,一个人的知识量和记忆力都是有限的,因而启示信息对我们的灵感思维也就显得特别重要,有了灵感机,科研人员遇到问题后,就不必再坐等偶然机会(外部启示信息)的到来,而是可以主动地 向灵感机索取自己所需的启示信息(三式信息),从而使问题得以快速解决,使自己的科研效率大大提高。
虽然在目前的搜索引擎(如百度、谷歌等)中输入疑问词后也能搜索出相关的答案(网页),但其效果要比灵感机相差很远,因为灵感机的数据库中有一部分三式信息是经直觉机新发现的知识,这些新知识是百度搜索不出来的,另一方面,灵感机是专用于解决问题的,它的数据库中都是三式信息,而不象百度那样还有其它形式的信息,这样,在搜索的效果和相关度方面会表现得更好。
具体实施方式
实施本方案的具体方法包括:1,建立三式信息数据库的方法;2,人工编辑三式信息的方法;3,搜索结果排序的方法。下面分述之。
一,建立三式信息数据库的方法。首先,数据库中,每一条“三式信息”做要为一个独立的记录单元,这样,输入一个“二式疑问信息”后,可以把包含相同关键词的那个三式信息搜索出来。这就好比,目前的搜索引擎,每个网页都是一个独立的记录单元,输入某个关键词后,能把整个网页搜索出来。数据库中的三式信息可以按知识领域来划分,如物质领域、精神领域、物理领域、化学领域、生物学领域等,比如,“苹果+地球=相互吸引”就属于物理学领域,“信用卡+商场消费=(方便+安全)”就属于经济、商业领域。同一领域里的三式信息排列在一起,其次,对于数据库中的每一条三式信息,还要标明其以下三种不同的属性:1,人工编辑;2,自动文摘;3,机器的逻辑推断; 4,机器的直觉推断;这是因为,以上四种属性,其正确率是不同的,1的正确率是100%,3的正确率接近100%,而2和4的正确率只有大约50%,而三式信息的正确率越高,其参考价值就越大,对用户来说,这样的启示信息就越可靠,越有助于解决自己的“二式疑问”中的问题,如果一条三式信息,做为一个启示信息,它本身就是错误的,那么,它给出的启示也肯定是错误的,是毫无价值的,甚至会误导用户。所以,必须告诉用户,每一条三式信息的正确率是多少,以便用户做参考,只所以把具有逻辑推断和直觉推断属性的三式信息也呈现给用户,是因为,这两种推断虽然不敢肯定其为100%正确,但也有一定的正确可能性,因此,对用户是有参考价值的,当然,对于那些经过验证为正确的“逻辑推断”和“直觉推断”和自动文摘生成的信息,应当把其属性修改为“人工编辑”,经验证为错误的三式信息,则应当从数据库中除名。最后,由于三式信息的表述比较简洁,为了避免用户误解,人工编辑的三式信息的后面还需要附上必要的解释和说明,解释、说明的形式可以是文字、图像、动画、电影、声音等,这样,当用户搜索出一条三式信息后,同时还能搜索出其后的解释和说明。机器推断的三式信息,其后面的说明可以参照人工三式信息的说明,因为二者属同类的三式信息,其说明也一样。
为了与前述直觉搜索相配合,灵感搜索需要建立三个“三式信息数据库”,(1),“人工编辑的三式信息数据库”,(2),“自动文摘生成的三式信息数据库”,(3),“直觉机生成的三式信息数据库”,在这三个数据库中,(3)专门用于灵感搜索,而(1)和(2)中的三式信息要输入到直觉机中,由直觉机生成更多的三式信息,然后组成为(3),所以,(3)中的三式信息其实已经包含了(1)和(2)中的全部三式信息。人工的三式信息可以由专业人士编辑而成,也可以由全民参与的形式编辑而成。在移动互联网的时代,任何人看到一个自然现象或 社会现象,都可以把它编辑成一条三式信息,然后通过手中的终端设备(如手机、电脑等)上传到服务器中的“人工三式信息数据库”中。人工编辑和自动文摘生成的三式信息输入到直觉搜索中后,就可以自动生成大量的新的三式信息,这些新的三式信息又可以分为两类,1,逻辑推断的三式信息;2,直觉推断(包括预感推断)的三式信息;
二,人工编辑三式信息的方法。(1)人工三式信息的来源主要有:A:日常工作、生活中的日常现象;B:科学实验活动实验现象;C:各类专业书、报、刊;D:互联网;E:其它来源。(2)人工三式信息的收集方式。其收集方式可以借鉴历史上各类字典、词典、辞海等的编撰经验,以及因特网上的商业网站(或搜索引擎)的建设经验。建议采用下列方式:A:专职编辑;B:兼职有偿编辑;C:志愿无偿编辑。(3)三式信息的编撰方式。三式信息的编撰也要分三步走,谚云:“处处留心皆学问”,编撰三式信息的第一步,就是对大量日常现象信息和各专业的书、报、刊信息多加“留心”,从中分辨出符合三式信息“A+B=C”条件的哪些信息来,即符合:“A和B相互作用能产生一种结果C”这一特征的哪些信息来;第二步,用公式化的语言(A+B=C)或自然语言对这些符合条件的三式信息进行表述。第三步,对每一条三式信息做一些必要的解释和说明,说明的形式可以是文字、图形乃至图象、动画、声音等多形式,这是因为,每一条三式信息都是简短、精炼的语言,检索者即便检索出这些过于精炼的三式信息,也未必能理解其背后的真实含义,因而也就未必能从中得出有益的启示,因此,编撰好每一条三式信息后,有必要在其后附上一些解释和说明,这样,检索者在检索出其所需的三式信息后,会同时检索出对该三式信息的解释和说明。
三,搜索排序的方法。上述三式信息数据库建好后,就可以进行灵感搜索 了,输入“二式疑问”(A+?=C),或直接输入自然语言形式的“怎样才能如何如何?”的问题,就可以得到相应的启示信息“三式理论信息”或“三式现象信息”,在启示信息的启发、帮助下,找到问题的答案,使自己的问题得以解决。但这里还有一个重要的问题,就是搜索结果中的信息排序问题,因为,在直觉机生成的三式信息数据库中,有大量的三式信息,既有人工编辑的,也有自动文摘生成的,还有直觉机自动生成的,后者又可进一步分为“逻辑推断的三式信息”“直觉推断的三式信息”,因此,在我们向灵感搜索中输入一个二式疑问后,会搜索出大量相关的三式信息,所以,这里就会有一个如何排序的问题,即谁排名最靠前的问题,在排序方面,应该遵循两个原则,(1),人工编辑优先于逻辑推断,逻辑推断优先于自动文摘和直觉推断。这是因为,人工编辑的三式信息正确率最高,为100%,而逻辑推断的三式信息的正确率次之,接近百分之百,而直觉推断和自动文摘生成的三式信息,其正确率最低,大约只有50%,因此,在排名时,人工的最优先,逻辑推断的次之,直觉推断和自动文摘生成的最靠后;(2),与二式疑问(A+?=C)中的A项概念最接近者,排名优先。即三式信息中包含有与二式疑问中A项概念最接近的概念者,该三式信息在搜索结果中排名优先,这是因为,二者的概念越接近,就越符合逻辑推断,因此,正确率就越高,二者之间就越能够相互启示、相互借鉴。在有直觉机自动生成的情况下,通常二式疑问中的A项和所搜索出的三式信息的A项是同名的,例如,当你用“王冠+?=能显示、测量出王冠的体积?”进行搜索时,能搜索出“王冠+浸入水=能显示、测量出王冠的体积”,因为这条三式信息早已由直觉机自动生成了,而且在搜索排名中能排列在第一位,因为它与输入的二式疑问最相关。
Claims (9)
1.一种模拟人脑直觉思维和灵感思维的搜索引擎技术,由“直觉搜索”、“灵感搜索”和“由自动文摘生成概念信息和三式信息”这三项子发明共同构成,三者相互衔接、相互配合。其中,直觉搜索的特征是,(1),通过自动文摘和人工编辑的方法建立起树形的“概念信息数据库”;(2),输入一个“三式信息”“A1+B1=C1”;(3),以概念检索的方式触类旁通地自动生成大量全新的三式信息“A2+B2=C2”、“A3+B3=C3”,、“A4+B4=C4”……等,以及一个总结性的三式理论信息“A+B=C”A1,A2,A3,A4是指A下的各个子概念,B,C的情况与此类似。灵感搜索的特征是,(1),通过自动文摘、人工编辑和上述直觉机自动生成的方法建立起“三式信息数据库”;(2),输入一个二式疑问“A+?=C”或直接输入“怎样才能如何如何?”,的问题;(3),以关键词检索的方式,搜索出一些相关的三式启示信息,如“A2+B2=C2”、“A3+B3=C3”、“A4+B4=C4”等,在这些三式启示信息的启发下,使问题得以解决,由于问题中和三式启示信息中包含有共同的关键词,所以,输入前者,能搜索出后者。其中,灵感搜索是对人脑灵感思维的全真模拟,所以简称“灵感机”,直觉搜索是对人脑直觉思维的全真模拟,所以简称“直觉机”。灵感机数据库中的“三式信息”分为三种:自动文摘生成、由人工编辑而成和由直觉机自动生成,自动文摘和人工编辑的三式信息输入直觉机后,以概念检索的方式可以自动生成出大量新的三式信息,这些新生成的三式信息又可以充实到灵感机的三式信息数据库中,所以,灵感机和直觉机可以相互配合,相互支持。
2.权利要求1中的直觉搜索的进一步的特征是,(1),这里所说的概念数据,是指物质领域里和精神领域里的各种概念,如数、理、化、天、地、生、文、史、哲、法、政、经等各门学科中的各种概念,以及专业学科之外的日常生活中的各种通俗概念等。直觉搜索的概念数据库是一个树状的概念系统,最高级别的概念是“元概念”,为一级概念,其下有两个二级概念“物质”和“精神”,物质又分为生物和非生物,精神又分为哲学、心理学以及其它各门学科等概念,总之,这样一张“概念网”可以网住所有“现在的”和“将来的”一切概念,任何一个概念都能在该网中找到自己的级别和位置,除最高的元概念外,每个概念也都有自己的上级、平级和下级概念,有些概念暂时还没有下级,但将来可能会有下级的。(2),这里所说的三式信息“A+B=C”,是指A和B相互作用,产生了一种结果C。(3),这里所说的概念检索,不同于传统的概念检索技术,因为传统的概念检索是关键词检索的一种辅助技术,目 的是为了提高关键词搜索的灵活性和智能化水平,而这里所说的概念检索是指,向直觉机输入一个三式信息“A+B=C”后,以概念检索的方式,选取数据库中与A、B接近的子概念,触类旁通地自动组合出大量新的三式信息,每一个新的三式信息都是一个推断,所有的推断被分为两档:逻辑推断和直觉推断,逻辑推断在搜索结果的排序中优先于直觉推断,其中,与A和B关系最接近的一些概念,组成逻辑推断,其它与A和B关系较远的概念则组成直觉推断。如果A和B两项中包含有两个以上的复合型的名词概念,则应按照上述检索和排序规则对每一个名词概念分别进行概念检索。
3.权利要求1中的灵感搜索的进一步的特征是,(1),其三式信息数据库中的特征是,数据库中,每一条“三式信息”做为一个独立的记录单元,这样,输入一个问题后,可以把包含相同关键词的那个三式信息搜索出来。数据库中的三式信息可以按知识领域来划分,如物质领域、精神领域、物理领域、化学领域、生物学领域等,同一领域里的三式信息排列在一起。其次,对于数据库中的每一条三式信息,还要标明其以下四种不同的属性:1,人工编辑;2,机器的逻辑推断;3,机器的直觉推断;4,由自动文摘生成。最后,由于三式信息的表述比较简洁,为了避免用户误解,人工编辑的三式信息的后面还需要附上必要的解释和说明,解释、说明的形式可以是文字、图像、动画、电影、声音等,这样,当用户搜索出一条三式信息后,同时还能搜索出其后的解释和说明。此外,为了与直觉搜索相配合,灵感搜索需要分别建立三个“三式信息数据库”,第一个是“人工的三式信息数据库”,第二个是“自动文摘生成的三式信息数据库”,第三个是“混合的三式信息数据库”(即由前两项三式住处输入直觉机后自动生成的三式信息组成的“三式信息数据库”),其中,“混合的三式信息数据库”专门用于灵感搜索,而人工的和自动文摘生成的三式信息数据库则专门用于输入到直觉搜索中去,以便自动生成更多的新三式信息,然后再充实到“混合的三式信息数据库”中去,供灵感搜索使用。(2),这里所说的“二式疑问”(A+?=C)就是“怎样才能如何如何?”一类的问题,意思是指“怎样才能使A达到C那样的效果”。(3),这里所说的关键词检索就是传统的关键词检索技术,即关键词匹配的检索方法。
4.根据权利要求3的方法,其进一步的特征在于每一个“二式疑问”中和与其相应的“三式信息”中包含有相重叠的词汇——共同关键词。所以能够用“二式疑问”搜索出“三式启示信息”。
5.根据权利要求1的方法,其特征是灵感搜索的过程就是对人脑灵感思维“2吸3”的模拟过程,直觉搜索的过程就是对人脑直觉思维“以某事实、现象为开端,沿概念方向进行延伸”的模拟过程。
6.根据权利要求1的方法,其中的“二式疑问”和“三式信息”包括两种表达方式,一种是公式化的“A+?=C”和“A+B=C”的表达方式,另一种是用自然语言表达的方式。在搜索时可以输入前者(公式化的),也可以输入后者(自然语言的) 。
7.根据权利要求1的方法,通过自动文摘生成概念信息的特征是:首先,运行文摘系统,在一个网页或电子文档中找到标志性词汇“分为”或“包括”、“分类以下种类”“可划分为”“各类有”“有以下几类”等,然后以此为中心,向前扩展至一个句号或逗号,向后也扩展至一个句号或逗号,“标志性词汇”前面便是母概念,后面便是其下的各子概念。如果标志性词汇后面有1、2、3或一、二、三等分项语句,则应把各分项全部收录,直到最后一个分项后面的句号为至。
8.根据权利要求1的方法,通过自动文摘生成三式信息的特征是:首先,运行文摘系统,在一个网页或电子文档中找到标志性词汇“能使”或“能够”“能引起”“能导致”“可使”“可引起”“可导致”等,然后,以此为中心,向上扩展到一个句号或逗号,再向下扩展到一个句号或逗号,两个句号或逗号之间的文字、词汇即为一个完整的自然语言方式表达的三式信息。如果用公式化的方式来表达,可进一步利用中文分词技术,把“能使”前的文字、词汇分为A项和B项,并在A项和B项之间键入“+”号,在“能使”前面键入“=”号,即可形成一个完整的公式化的三式信息。
9.根据权利要求1的方法,其中的直觉搜索的进一步的特征是,搜索的结果分为两种类型:简单搜索和详细搜索。前者只列出有代表性的少数推断,后者要进一步列出更多、更详细的推断。其中的每一个类型中又都包括逻辑推断和直觉推断。用户根据地自己的需要可以选择简单搜索或详细搜索。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013102344428A CN103412866A (zh) | 2013-06-14 | 2013-06-14 | 能从事灵感思维和直觉思维的高智能搜索引擎 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2013102344428A CN103412866A (zh) | 2013-06-14 | 2013-06-14 | 能从事灵感思维和直觉思维的高智能搜索引擎 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103412866A true CN103412866A (zh) | 2013-11-27 |
Family
ID=49605878
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2013102344428A Pending CN103412866A (zh) | 2013-06-14 | 2013-06-14 | 能从事灵感思维和直觉思维的高智能搜索引擎 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103412866A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103399962A (zh) * | 2013-08-24 | 2013-11-20 | 河南星智发明电子科技有限公司 | 智能化加法发明系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050050030A1 (en) * | 2003-01-30 | 2005-03-03 | Decode Genetics Ehf. | Set definition language for relational data |
CN1752966A (zh) * | 2004-09-24 | 2006-03-29 | 北京亿维讯科技有限公司 | 使用本体论和用户查询处理技术解决问题的方法 |
CN101093559A (zh) * | 2007-06-12 | 2007-12-26 | 北京科技大学 | 一种基于知识发现的专家系统构造方法 |
-
2013
- 2013-06-14 CN CN2013102344428A patent/CN103412866A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050050030A1 (en) * | 2003-01-30 | 2005-03-03 | Decode Genetics Ehf. | Set definition language for relational data |
CN1752966A (zh) * | 2004-09-24 | 2006-03-29 | 北京亿维讯科技有限公司 | 使用本体论和用户查询处理技术解决问题的方法 |
CN101093559A (zh) * | 2007-06-12 | 2007-12-26 | 北京科技大学 | 一种基于知识发现的专家系统构造方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103399962A (zh) * | 2013-08-24 | 2013-11-20 | 河南星智发明电子科技有限公司 | 智能化加法发明系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Pylyshyn | Computational models and empirical constraints | |
Dennett | Why not the whole iguana? | |
Schmidt | History and Structure | |
CN108804654A (zh) | 一种基于智能问答的虚拟学习环境构建方法 | |
CN103412866A (zh) | 能从事灵感思维和直觉思维的高智能搜索引擎 | |
Ullman | AI systems and human cognition: The missing link | |
Combs | Application of analogical reasoning for use in visual knowledge extraction | |
Delz | A theoretical approach to automatic loanword detection | |
Jones | Priesthood, cult, and temple in the Aramaic scrolls from Qumran: analyzing a pre-Hasmonean Jewish literary tradition | |
Herron | The nature of scientific enquiry as seen by selected philosophers, science teachers, and recent curricular materials | |
Biltawi | Neural Machine Understanding for Arabic Text | |
Manikas et al. | The species problem in evolution education | |
Umphrey | Natural Kinds and Genesis: The Classification of Material Entities | |
Anand et al. | Sentiment Analysis | |
Schneider | Towards End-To-End Information Retrieval: Enabling Question Answering Systems To Answer Open-Domain Questions | |
Amraouy et al. | Sentiment analysis in digital learning: Comparing Lexical, Traditional machine learning, and deep learning approaches | |
CN116842187A (zh) | 基于开源情报自动抽取产学研信息的知识图谱构建方法 | |
Williams | Debating Scientific Origins: Can Intelligent Design be Supportively Involved in Natural Science Debates on the Origin of Life? | |
Johnson-Laird | The correspondence and coherence theories of cognitive truth | |
Pascual-Leone | Computational models for metasubjective processes | |
Sokxnonick | On the theory of general semiotics | |
Pylyshyn | The AI debate: generality, goals, and methodological parochialism | |
Domotor | Al: model-theoretic aspects | |
Sun | Mining Disparate Sources for Question Answering | |
Benzon | Digital Criticism and the Search for Patterns |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20131127 |