CN106575255A - 信息处理装置、信息处理方法以及程序 - Google Patents

信息处理装置、信息处理方法以及程序 Download PDF

Info

Publication number
CN106575255A
CN106575255A CN201580024644.7A CN201580024644A CN106575255A CN 106575255 A CN106575255 A CN 106575255A CN 201580024644 A CN201580024644 A CN 201580024644A CN 106575255 A CN106575255 A CN 106575255A
Authority
CN
China
Prior art keywords
information
factor
item
expression
expression formula
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580024644.7A
Other languages
English (en)
Inventor
关洋
关洋一
国井利泰
儿玉敏男
百瀬公朗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maeda Corp
Original Assignee
Maeda Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Maeda Corp filed Critical Maeda Corp
Publication of CN106575255A publication Critical patent/CN106575255A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/288Entity relationship models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations
    • G06F16/24558Binary matching operations
    • G06F16/2456Join operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本信息处理装置处理对象信息,该对象信息使用由符号形成的标识符、将包含一个以上标识符的因子结合并形成具有顺序的因子序列的乘积运算符、将包含一个以上因子的项结合并形成作为该项的组合的表达式的加法运算符来描述。此外,本信息处理装置包含:分割部,在规定的位置将对象信息分割为多个项;发送部,将包含对象信息内的项的出现位次和该项内的该因子的出现位次的位置信息,与分割后的项中所包含的因子的至少任一个建立关联,并按分割后的项保持于多个服务器装置的任一个。

Description

信息处理装置、信息处理方法以及程序
技术领域
本发明涉及信息处理装置、信息处理方法以及程序。
背景技术
以往,作为计算机所处理的数据结构,例如,公知有关系数据库的表形式的结构、面向对象数据库的对象、知识数据库的框架或者规则等。
但是,以往提出的数据库在无法对已定义的数据结构追加新的结构这样的应对变更的灵活性方面存在问题。例如,开始运用关系数据库后,在对一个表追加新属性的情况下,已有的数据结构和处理数据结构的应用程序的改造相伴,改造的工时对于计算机的使用者、管理者、或者应用程序的开发者而言是负担。此外,在以往的关系数据库中,无法分级描述信息,例如无法在一个表的一个属性中进一步定义表。另一方面,在面向对象的数据库、或者框架中,虽然能为对象间的关系、或者框架间的关系定义所谓的亲子关系,但是相反,有时并不适合于想要单纯地处理属性与属性值的关系这样的请求。
因此,为了使信息处理装置对使用者要处理的关于事物、组织、人等的信息或者使用者要处理的概念等进行处理,本申请人提出了描述信息的新的数据结构和对由该数据结构所存储的信息进行处理的过程(参照专利文献1至4)。在该提案中,以表达式来表达信息,例如以标识符与标识符的和、标识符与标识符的积、标识符与标识符的积的和等来表达信息。
现有技术文献
专利文献
专利文献1:日本专利第4343984号公报
专利文献2:日本专利第5113779号公报
专利文献3:日本专利第5357286号公报
专利文献4:国际公开第2012/023192号
发明内容
发明所要解决的问题
再者,在所提出的上述技术中,由于以文本形式连续地描述作为处理对象的信息,因此适于按序存取。另一方面,存在如下问题:随着所保持的信息增加,处理时间也增加。因此,本申请的技术的目的在于,在由申请人等提出的数据结构描述的信息的处理技术中,以规定的条件对处理对象的信息进行分割。
用于解决问题的方案
本发明的一方面的信息处理装置对对象信息进行处理,该对象信息使用由符号形成的标识符、将包含一个以上标识符的因子结合并形成具有顺序的因子序列的乘积运算符、将包含一个以上因子的项结合并形成作为该项的组合的表达式的加法运算符来描述。然后,信息处理装置包含:分割部,在规定的位置将对象信息分割为多个项;发送部,对分割后的项中所包含的因子的至少任一个附加位置信息,并按分割后的项保持于多个服务器装置的任一个,其中该位置信息包含该对象信息内的项的出现位次和该项内的该因子的出现位次。
如此,能将由上述的数据结构描述的对象信息以可复原的形式进行分割,并分散储存于多个服务器装置。需要说明的是,对于分割后的对象信息的子集,可以由各服务器装置并行处理。
此外,对象信息具有分级结构,该分级结构呈嵌套状地包含表达式来作为因子,该表达式由维持顺序地将项的组合建立关系的有序因子构成运算符、或者不维持顺序地将项的组合建立关系的集合因子构成运算符所划分,规定的位置可以是在由有序因子构成运算符划分的表达式的外侧,通过加法运算符来将对象信息划分的部位的任一个。具体而言,通过这样做,能将应该在上述的数据结构中保持的顺序以可复原的形式进行分割。
此外,还可以包含:结合部,从多个服务器装置分别接收分割后的项,基于位置信息,按照项的出现位次递减的顺序且因子的出现位次递减的顺序将各项结合并生成对象信息。根据这样的结合部,能复原分割后的对象信息。
此外,服务器装置分别保持的位置表达式可以在由用户指定的位置被分割,服务器装置分别保持的位置表达式也可以在分割后的子集为规定的容量以内的位置处被分割,服务器装置分别保持的位置表达式还可以按共同包含通过乘积运算符连接的规定的因子的项被分割。
用于解决上述问题的方案的内容可以在不脱离本发明的课题、技术思想的范围内,尽可能地组合。此外,可以提供信息处理装置执行上述方案的方法、使计算机执行的程序。此外,程序可以通过记录于计算机可读取的记录介质的方式来提供。所谓的计算机可读取的记录介质是指通过电、磁、光学、机械、或者化学作用积累信息并能由计算机读取的记录介质。这样的记录介质中,作为可从计算机拆卸的记录介质,例如有光盘、磁光盘、软盘、磁带、存储卡等。此外,作为固定于计算机的记录介质,有HDD(Hard Disk Drive:硬盘驱动器)、SSD(Solid State Drive:固态硬盘)、ROM(Read Only Memory:只读存储器)等。
发明效果
根据本发明,在由申请人等提出的数据结构描述的信息的处理技术中,能以规定的条件对处理对象的信息进行分割。
附图说明
图1是用于说明表达式表达的图。
图2是表示蜂窝(cellular)空间信息的第一数据结构例的图。
图3是表示蜂窝空间信息的第二数据结构例的图。
图4是表示第三数据结构例的图。
图5是举例示出以KVS形式储存示意性的位置表达式的表的图。
图6是举例示出实施方式的信息处理系统的构成的框图。
图7是举例示出实施方式的信息处理装置的构成的框图。
图8是举例示出实施方式的服务器装置的构成的框图。
图9表示分割储存处理的一例的处理流程图。
图10A是表示以KVS形式储存对象信息的子集的表的一例的图。
图10B是表示以KVS形式储存对象信息的子集的表的一例的图。
图11A是表示以KVS形式储存对象信息的子集的表的一例的图。
图11B是表示以KVS形式储存对象信息的子集的表的一例的图。
图11C是表示以KVS形式储存对象信息的子集的表的一例的图。
图12A是表示以KVS形式储存对象信息的子集的表的一例的图。
图12B是表示以KVS形式储存对象信息的子集的表的一例的图。
图12C是表示以KVS形式储存对象信息的子集的表的一例的图。
图13是表示结合处理的一例的处理流程图。
图14是用于说明多个对象信息的整合以及复原的图。
具体实施方式
以下,参照附图对用于实施本发明的方式(也称为“实施方式”)的信息处理装置进行说明。以下的实施方式的构成是举例示出,本发明不限定于实施方式的构成。
在本实施方式中,信息处理装置对关于事物、组织、人等的信息进行处理。将以本实施方式的信息处理装置可处理的形式对这些信息进行表达的信息称为“对象信息”。以下,示出了对用于描述对象信息的数据结构、以及由该数据结构描述的对象信息进行处理的过程。
(数据结构)
所谓数据结构是指用于描述对象信息的结构。需要说明的是,对象信息通过具备处理器和存储装置的信息处理装置进行生成、存储、读出、更新(也称为“运算”)、删除等。
(1)对象信息的构成要素
信息处理装置以表达式的形式保持对象信息。使用了本实施方式的表达式的表达方法也称为“表达式表达”。图1是表示表达式的一例的图。表达式包含一个以上作为构成要素的最小单位的标识符(也称为基本要素)。本实施方式的标识符并不限于能唯一确定数据的信息。而且,表达式使用规定的符号进行描述。运算符和分隔符被用作规定的符号。具体而言,使用加法运算符“+”、乘积运算符“×(可以如图1那样省略)”、第一括号(圆括号)“(”和“)”、以及第二括号(大括号)“{”和“}”。第一括号相当于本发明的集合因子构成运算符(也称为组合部分隔符)。此外,第二括号相当于本发明的有序因子构成运算符(也称为排列部分隔符)。
此外,标识符是构成对象信息的最小单位,通过符号来表达。所谓符号是指英文数字等字符串以及特殊字符(不过,加法运算符“+”、乘积运算符“×”、第一括号“(”和“)”、以及第二括号“{”和“}”除外)。
在本实施方式中,作为特殊字符,使用“Φ”以及“ε”。Φ是值0、在加法运算符中不使运算结果变化的值、或者表示空集的标识符。在本实施方式中,也将Φ称为“零元”。此外,ε是值1、或者在乘积运算符中不使运算结果变化的值。在本实施方式中,将ε称为“单位元”。需要说明的是,有时也将Φ称为加法运算的单位元,但在本实施方式中,将Φ称为零元。
此外,如图1所示,将由标识符以及规定的符号描述的部分(可以是全部)称为“因子”。然后,将由因子的积描述的部分称为“项”。而且,由项的和描述的部分是表达式。换言之,表达式包含通过加法运算符来连接的一个以上的项。此外,项包含通过乘积运算符来连接的一个以上的因子。而且,因子有时也呈嵌套状地被描述为表达式。需要说明的是,图1的“a”、“b1”、“c1”等是标识符,相当于构成对象信息的最小单位。
在本实施方式中,基于以下的规则(a)~(d),生成表达对象信息的表达式。
(a)标识符、单位元以及零元均是表达式表达(表达式)。
(b)在r和s均是表达式表达的情况下,r+s也是表达式表达。
(c)在r和s均是表达式表达的情况下,r×s也是表达式表达。此时,运算的结合强度与一般代数相同,r×s强于r+s。
(d)在r是表达式表达的情况下,(r)、{r}也是表达式表达。
(2)表达式表达的代数结构
在本实施方式中,表达式表达r、s、t具有如下的代数性质(a)~(f)。
(a)结合律
r+(s+t)=(r+s)+t;
r×(s×t)=(r×s)×t;
(b)交换律
r+s=s+r;
需要说明的是,在本实施方式的表达式表达中,乘积运算符的交换律不成立。因此,在多个因子通过乘积运算符结合的情况下,各因子位置具有信息(或者含义)。即,因子具有作为对位置进行指定的所谓位置参数的功能。“乘积运算符的交换律不成立”相当于本发明的乘积运算符“将多个标识符结合为具有顺序的因子序列”。
(c)乘积运算的单位元
r×ε=ε×r=r;
(d)乘积运算、加法运算的零元
r×Φ=Φ×r=Φ;
r+Φ=r;
(e)分配律
r×(s+t)=r×s+r×t;
(r+s)×t=r×t+s×t;
(f){r+s}×{t+u}={r×t+s×u};
此外,由表达式表达的对象信息能以抽象度不同的多个层级来表达。例如,通过处理器执行本发明的规定程序,能变更对象信息的表达的层级。多个层级例如包含:集合层级,对象信息的抽象度被表达得最高;拓扑空间层级,对象信息的抽象度低于集合层级,以子集为要素来表达对象信息;黏着(adjunction)空间层级,对象信息的抽象度低于拓扑空间层级,拓扑空间层级中的对象信息彼此黏着;蜂窝空间层级,对象信息的抽象度低于黏着空间层级,以规定的属性来表达拓扑空间中的对象信息。
(3)集合信息
集合信息被定义为项的组合、或者项的和。在此,各个项被定义为作为集合ID(相当于本发明的第一标识因子)的标识符与作为值的标识符的积,即被定义为集合ID×值。其中,值可以是多个标识符的积。典型的集合信息的表达式表达如下。
(例子)
集合ID×值1+集合ID×值2+……
如上所述,在本实施方式的数据结构中,交换律对于加法运算符是成立的,由此,集合信息可以说是没有顺序的项的组合。另一方面,构成项的因子间的位置关系得以维持。在图1所示的例子中,例如,项1以及项2中所包含的因子1相当于集合ID。
在计算机上表达事物、或者概念的情况下,这样的因子间的位置关系的维持功能发挥极大的效果。一般而言,对于描述事物、或者概念的修饰关系,交换律不成立。例如,“儿玉的桌子”与“桌子的儿玉”含义不同。根据本实施方式的因子和乘积运算符,能简化地描述这样的修饰关系。而且,通过加法运算符将以那样的修饰关系描述的项组合,由此能描述事物的集合、或者概念的集合,能构建形式单纯的数据库。而且,在将管理对象的事物或者概念作为项的集合来进行管理的情况下,也能对项中的因子的位置关系赋予含义。
此外,构成项的因子也可以说是分别具有作为所谓的位置参数的意义。例如,考虑如下所述的集合信息。
(例子)
水果×任意形状×任意颜色×香蕉+水果×任意形状×任意颜色×苹果+水果×细长×黄色×香蕉+水果×圆形×红色×苹果
该情况下,项的第一因子是作为集合ID的水果,第二因子表示形状,第三因子表示颜色,第四因子表示名称。如此,通过在各个因子的位置附加含义上的限制来使用,在集合层级也能对属性与属性值的关系进行处理。集合信息能通过维持这样的顺序的因子而自由地定义事物的属性。
此外,通过包含那样的因子的项的组合,在计算机上表达事物、人的集合等所有信息。
(例子)
A×a1+A×a2+A×a3,b1×B+b2×B×B,水果×苹果+水果×香蕉+水果×橘子,蔬菜×卷心菜+蔬菜×黄瓜+蔬菜×牛蒡,员工×A+员工×B+员工×C
即,集合信息描述所属于由集合ID标识的集合的项的组合。在上述的例子中,在员工C退休了的情况下,“员工×C”与加法运算符一起被删除。而且,在员工D以及员工E入职了的情况下,进一步通过加法运算符连接“员工×D+员工×E”。
(4)拓扑空间信息
拓扑空间信息通过作为拓扑ID的标识符与子集的和的积来描述。即,是拓扑ID×(子集的和)。在此,子集通过标识子集的子集ID与此子集中所包含的项的和的积来表达。即,是子集ID×(项的和)。其中,项可以进一步包含:用第一括号“()”、或者第二括号”{}”将项的和组合而成的项、或者它们的积。在图1的例子中,例如,项2的因子2相当于拓扑ID。此外,项2的因子3所包含的因子“1”、因子“2”相当于子集ID。
将拓扑空间信息的例子示出如下(在下述的例子中,逗号“,”不是表达式的构成要素,是例子的隔点)。
(例子)
T×(ABC×(ab1+ac2+bc3)+A×(ab1+ac2)+B×(ab1+bc3)+C(ac2+bc3)),
水果×(所有种类×(苹果+香蕉+橘子)+红色×苹果+黄色×(香蕉+橘子)),水果×(所有种类×(苹果+香蕉+橘子)+圆形×(苹果+橘子)+细长×香蕉),
蔬菜×(所有种类×(萝卜+黄瓜+牛蒡)+粗×萝卜+细×(黄瓜+牛蒡)),公司×(员工×(员工1+员工2+员工3+员工4)+营业×(员工1+员工2)+经理×(员工3+员工4)),
该情况下,对于最后(第五个)的例子,例如,在新设总务、录用员工5并且分配给总务的情况下,进行如下更新。
(例子)
公司×(员工×(员工1+员工2+员工3+员工4+员工5)+营业×(员工1+员工2)+经理×(员工3+员工4)+总务×员工5)
(5)黏着空间信息
对于拓扑空间信息中所包含的两个子集X和子集Y,将各个部分所包含的子集建立关系,由此构成黏着空间信息。在本实施方式中,将通过该关系的建立所产生的关系称为等价关系。
在此,拓扑空间信息T(拓扑ID是Tid)以及拓扑空间信息U(拓扑ID是Uid)被存储为拓扑空间信息Tid×(属于T的子集的和)+拓扑空间信息Uid×(属于U的子集的和)。此外,设为能如下地分离成两个子集:属于T的子集的和=子集T0+子集T-T0。
该情况下,指定将拓扑空间信息T与拓扑空间信息U建立关连的拓扑空间信息T的因子p和拓扑空间信息U的因子q(相当于本发明的第二等价因子)。然后,拓扑空间信息T分离为:包含因子p的子集T0和不包含因子p的子集T-T0。在此,T-T0是从集合T中删除了集合T0的差集。此外,拓扑空间信息U分离为:包含因子q的子集U0(相当于本发明的第二关连项)和不包含因子q的子集U-U0。在此,U-U0是从集合U中删除了集合U0的差集。
上述两个拓扑空间信息T与U的和表达如下。
(例子)
拓扑空间信息Tid×(子集T0)+拓扑空间信息Tid×(子集T-T0)+拓扑空间信息Uid×(子集U0)+拓扑空间信息Uid×(子集U-U0)
如此,在从集合中取出了包含特定的因子p的子集的情况下,将其称为商。此外,将去除此商的子集称为余数。
而且,描述为:子集T0=T0id×(T0的项的和)、子集U0=U0id×(U0的项的和)。该情况下,通过将子集T0与子集U0建立关系,能构成以下的黏着空间信息。即,该情况下的黏着空间信息是:{子集T0中的p的左因子+子集U0中的q的左因子}{p+q}{子集T0中的p的右因子+子集U0中的q的右因子}+拓扑空间信息Tid×(子集T-T0)+拓扑空间信息Uid×(子集U-U0)。在此,子集T0中的p的左因子以及子集T0中的p的右因子均相当于本发明的第一被黏着因子。此外,子集U0中的q的左因子以及子集U0中的q的右因子均相当于本发明的第二被黏着因子。
需要说明的是,在此,对黏着拓扑空间层级的信息的情况进行了说明,但是,除了拓扑空间层级的信息以外,对于对属性和属性值进行定义而构成的蜂窝空间层级的信息、以及作为项的组合的集合层级的集合信息,也能定义黏着空间信息。此外,能对拓扑空间、蜂窝空间、集合空间中的一个层级的信息和其他层级的信息定义黏着空间信息。
在此,设为:存储有如下的水果的拓扑空间信息与蔬菜的拓扑空间信息的和。
(例子)
水果×(所有种类×(苹果+香蕉+橘子)+圆形×(苹果+橘子)+细长×香蕉)+蔬菜×(所有种类×(萝卜+黄瓜+牛蒡)+粗×萝卜+细×(黄瓜+牛蒡))
在此,指定作为水果的拓扑空间信息的因子的细长与作为蔬菜的拓扑空间信息的子集的因子细的关连建立,设为其处于等价关系。该情况下,两个拓扑空间信息分别如下地分离为商和余数。即,各集合信息分离为商和余数的拓扑空间信息为:水果×细长×香蕉+水果×(所有种类×(苹果+香蕉+橘子)+圆形×(苹果+橘子))+蔬菜×细×(黄瓜+牛蒡)+蔬菜×(所有种类×(萝卜+黄瓜+牛蒡)+粗×萝卜)。
然后,通过指定了等价关系的细长和作为蔬菜的拓扑空间信息的子集的细,黏着空间信息构成为:{水果+蔬菜}×{细长+细}{香蕉+(黄瓜+牛蒡)}+水果×(所有种类×(苹果+香蕉+橘子)+圆形×(苹果+橘子))+蔬菜×(所有种类×(萝卜+黄瓜+牛蒡)+粗×萝卜)。
如此,在维持两个拓扑空间信息的结构的状态下,黏着空间信息基于指定了关系建立的处于等价关系的因子进行结合。如果“细”与“细长”的等价关系被承认,则能从黏着空间信息将右因子“香蕉”与“(黄瓜+牛蒡)”建立关连并输出为{香蕉+(黄瓜+牛蒡)}。
此外,考虑存储有描述记账单ID第一张(A{ε+B+C{C1+C2}+D+E{E1+E2}}(a{ε+b+c{c1+c2}+d+e{e1+e2}}+位置(右上+右下)))+记账单ID第二张(A{ε+B+C{C1+C2}+D+E{E1+E2}}(a{ε+b+c{c1+c2}+d+e{e1+e2}}))+MEMO(1(aiu)+2(ABC))+……这样的一串记账单、以及备忘录MEMO的信息的情况。在此,示出了将MEMO指定位置地粘贴于第一张记账单的右上的例子。
在该例子中,为了将MEMO的1粘贴于第一张记账单的右上,首先,在MEMO信息的因子“1”、记账单第一张的信息的因子“右上”分别创建商空间。记账单ID第一张(A{ε+B+C{C1+C2}+D+E{E1+E2}}(a{ε+b+c{c1+c2}+d+e{e1+e2}}+位置(右下)))+记账单ID第一张×位置(右上)+记账单ID第二张(A{ε+B+C{C1+C2}+D+E{E1+E2}}(a{ε+b+c{c1+c2}+d+e{e1+e2}}))+MEMO(2(ABC))+MEMO(1(aiu))+……
在此,当指定“1”与“右上”的关系建立并进行黏着时,黏着信息构成为:包含{记账单ID第一张×位置+MEMO}{右上+1}{ε+(aiu)}+余数的子集的信息。如此,对于相互没有结构上的共同性的两个对象信息,黏着信息能在维持了各自的黏着前的结构的状态下将两个对象信息结合并存储。
(6)蜂窝空间信息
蜂窝空间信息是具有关于事物、组织、人等的属性或者人要处理的概念的属性和对应于此属性的属性值的信息。属性分为键属性(Key attribute)和其他属性。键属性是能通过属性值来标识信息的属性,对应于在数据库的检索中能作为键来使用的值。在蜂窝空间信息中,将属性值(或者将多个属性值结合后的序列)称为实例。实例相当于以往的储存在数据库的表中的记录。各实例具有被称为实例ID的标识信息。此外,在存在多个键属性、或者其他属性的情况下,键属性、或者其他属性通过第二括号“{”和“}”,以维持住顺序的因子的形式来描述。即,以所谓矢量形式描述属性和其对应的属性值。
蜂窝空间信息包含:蜂窝空间ID(相当于本发明的蜂窝空间标识符)、键属性的因子、具有单位元以及键属性以外的属性的因子、以及具有实例的集合的因子。蜂窝空间信息由蜂窝空间ID×(键属性×{ε+(其他属性的和)}×((实例ID×{ε+(值的和)})的和))构成。
该键属性的因子和具有单位元以及键属性以外的属性的因子相当于本发明的属性因子。此外,在{ε+(其他属性的和)}中的任一个属性由多个标识符的积构成的情况下,这样的由标识符的积构成的属性相当于本发明的属性的有序序列。此外,在这样的属性是用第二括号“{}”括起来的因子的情况下,此用第二括号括起来的属性相当于本发明的属性的有序因子。
此外,对应于这样的属性,在实例的{ε+(值的和)}中的值由标识符的积构成时,此值相当于本发明的值序列。此外,在值是用第二括号“{}”括起来的因子的情况下,此用第二括号括起来的值相当于本发明的值的有序因子。
蜂窝空间信息的例子可以如下所示。
(例子)
水果id×(名字{ε+形状+颜色}(苹果{ε+圆形+红色}+橘子{ε+圆形+黄色}+香蕉{ε+细长+黄色}))+蔬菜id×(名字{ε+形状+颜色}(萝卜{ε+粗+白色}+黄瓜{ε+细+绿色}+牛蒡{ε+细+茶色}))
在该例子中,将以往的关系模型中描述为水果表、蔬菜表之类的信息通过表达式表达来描述。需要说明的是,由于该例子包含两个蜂窝空间信息(水果和蔬菜),因此也称为整合蜂窝空间信息。
示出该整合蜂窝空间信息的处理例。首先,创建水果的实例中属性“形状”具有“细长”的值的实例的子集(称为商)和其他实例的子集(称为余数)。此外,首先,分离为:蔬菜的实例中属性“形状”具有“细”的值的实例(称为商)和其他实例(称为余数)。该情况下,结合蜂窝空间信息如下。
水果id×香蕉×形状×细长+蔬菜id×形状×(黄瓜+牛蒡)细+水果id×(名字{ε+形状+颜色}(苹果{ε+圆形+红色}+橘子{ε+圆形+黄色}+香蕉{ε+黄色}))+蔬菜id×(名字{ε+形状+颜色}(萝卜{ε+粗+白色}+黄瓜{ε+绿色}+牛蒡{ε+茶色}))
接着,指定水果中属性“形状”具有值“细长”的子集与蔬菜中属性“形状”具有值“细”的子集的关系建立,设定等价关系。然后,当通过该等价关系创建黏着空间信息时,如下。
{水果id×形状×香蕉+蔬菜id×形状×(黄瓜+牛蒡)}{细长+细}{ε+ε}+水果id×(名字{ε+形状+颜色}(苹果{ε+圆形+红色}+橘子{ε+圆形+黄色}+香蕉{ε+黄色}))+蔬菜id×(名字{ε+形状+颜色}(萝卜{ε+粗+白色}+黄瓜{ε+绿色}+牛蒡{ε+茶色}))
(描述例)
以下,示出如何能以本实施方式的数据结构来描述作为以往的数据结构的表以及树形结构。
图2表示第一实施方式的蜂窝空间信息的第一数据结构例。如该图所示,在第一实施方式中,以往以表形式表达为正规化表结构的对象信息能以表达形式1的状态储存于存储装置。在表达形式1中,A是键属性(例如,员工号码等),B、C、D、E等是其他属性(例如,姓名、性别、入职年份、所属部门等)。
图3表示第一实施方式的蜂窝空间信息的第二数据结构例。如该图所示,在第一实施方式中,以往被表达为树形结构的对象信息能以表达形式2或3储存于存储装置。然后,如该图所示,能够应对作为有向图的一部分的树形结构。在表达形式2中,a例如是动物,b是哺乳类,c是鱼类,d是人,e是鲸鱼,f是金枪鱼,g是鲤鱼等。该情况下,b(哺乳类)以及c(鱼类)继承例如进食、呼吸等a(动物)的属性。b(哺乳类)以及c(鱼类)的共同属性定义为a(动物)。
因此,通过本实施方式的表达式表达,能描述框架等知识库、或者面向对象数据库等,并储存于存储装置。本实施方式的信息处理装置能接收与这些对应的事物的相关信息的输入,生成对应的信息并储存于存储装置,进而将其一部分或全部读出并输出。
此外,即使对于以倒树形结构表达的对象信息,也能如表达形式3那样储存于存储装置。倒树形信息能应用于由基本信息构成更复杂的信息的情况。在表达形式3中,例如,a是CPU,b是接口,c是外部存储装置的驱动部,d是CPU板,e是外部存储装置,f是个人计算机。
如此,倒树形结构能将产品的设计书、业务的流程管理图等基本信息组成更复杂的信息并进行管理。因此,通过本实施方式的表达式表达,能描述产品的设计信息、业务的流程等。
图4表示第一实施方式的第三数据结构例。如该图所示,即使对于非正规化表结构和没有属性的对象信息,也能以表达形式4的状态进行保持。在此,如图4所示,所谓的非正规化表结构和没有属性的对象信息能举例示出:表示记账单的对象信息和相当于追加于此对象信息的便笺备忘录的对象信息。通过创建黏着空间,在计算机上实现与对记账单添加便笺备忘录的内容同等的处理。
需要说明的是,在按形式相同的记账单储存于表的情况下,能够通过关系模型在以往的数据库中管理信息。但是,如果记账单的种类数发生变动,而已有的记账单的构成发生了变更的情况下,无法通过关系模型来应对。
在此,基于上述表达形式4,对表达式表达更详细地进行说明。ID或id(identification)对所储存的对象信息进行标识。然后,该对象信息由以下部分构成:标识符A~E2、a~e2;运算时的结合强度不同的第一括号()以及第二括号{};通过这些来表达的因子{C1+C2}、{E1+E2}等;通过这些因子的积来表达的项E×{E1+E2}等;以及通过所述项的和来表达的表达式。需要说明的是,在本实施方式中,也将项称为要素。此外,如前所述,在执行了规定的处理的情况下,单位元ε是作为1来处理的符号。作为上述以外的特殊符号,在执行了规定的处理的情况下,存在作为0来处理的零元Φ。在这样的前提下,通过执行规定的程序,所储存的对象信息按照所输入的记账单数据而生成,被储存于存储装置,分离为子集,与其他子集黏着,或者被检索。
在图4的例子中,作为实例,举例示出了以记账单ID1表示的第一张记账单、以记账单ID2表示的第二张记账单、以及以MEMO表示的备忘录。此外,该情况下,在第一张记账单与第二张以后的记账单中,项目的构成不同也无妨。由于本信息处理装置100能对构成对象信息的标识符、或者项分别赋予属性,因此能自由地存储、检索、变更具有不同的属性排列的不同标识符、或者项。此外,如果在{}内以+标识符的形式追加,并且追加对应于属性的值,则即使作为数据库在运用过程中,也能自由地追加、变更、删除属性和属性值。因此,根据本实施方式,不进行严密、详细的文件设计,就能灵活地变更要处理的数据的结构。
(位置表达式)
位置表达式是包含表示表达式表达中的标识符的位置的位置信息的表达形式。也将位置信息称为绝对位置信息。作为表达式表达,可举例示出由标识符、将多个标识符结合为具有顺序的因子序列的乘积运算符、由标识符以及结合为因子序列的多个标识符的任一个或双方来构成项的组合的加法运算符来进行描述的信息。因此,标识符的位置、即位置表达式能通过表达式表达中的包含各标识符的项的位置、项中的包含各标识符的因子的位置来描述。需要说明的是,在本实施方式的处理对象这一含义上,位置表达式也称为对象信息。在实施例1中,举例示出了在标识符的左侧附加了表示标识符的位置的位置信息的表达形式。不过,位置信息也可以附加于标识符的右侧。
位置表达式中的位置信息以<项的位置×因子的位置>进行定义。因此,在本实施方式中,位置表达式采取<项的位置×因子的位置>标识符这一形式。
(例子)
例如,在位置表达式中,包含标识符A、B、C的表达式表达A+B+C是<1×1>A+<2×1>B+<3×1>C。即,<1×1>A表示相当于第一项的第一因子的标识符是A。此外,<2×1>B表示相当于第二项的第一因子的标识符是B。
此外,例如,在位置表达中,包含标识符A、B、C的表达式表达A+A×B+A×B×C是<1×1>A+<2×1>A+<2×2>B+<3×1>A+<3×2>B+<3×3>C。如上,在不包含第一括号“(”和“)”的表达式表达中,作为表达式表达中的第i个项中的第j个因子的标识符Z通过<i×j>Z来描述。此外,包含多个项的表达式表达整体的位置表达式将各标识符的位置表达式用加号(+)等分隔符分隔排列而成。
需要说明的是,“<”和”>”是用于说明的分隔符,在计算机上,无需用“<”和“>”括起来。例如,导入表示位置表达的字符&,可以描述为&项的位置×因子的位置。同样地,“位置×因子”之间的符号无需是“×”。例如,可以使用下划线“_”。而且,在对应于多个项的位置表达中,代替将<i×j>Z用加号(+)分隔排列,可以用例如其他表示点的符号、逗号(,)、冒号(:)、分号(;)、空格、制表等其他分隔符来分隔排列。
在包含第一括号“(”和“)”的表达式表达中,使用标识符分级描述信息。因此,向对应于包含第一括号“(”和“)”的表达式表达的位置表达,导入表示分级的深度、分级在哪个位置变深(是否进入第一括号中)的信息。
当将表达式表达A×(B+C×(D+E))+F×(G+H)转换为位置表达式时,如下。
(例子)
<1×1>A+(1×2)<1×1>B+(1×2)<2×1>C+(1×2)(2×2)<1×1>D+(1×2)(2×2)<2×1>E+<2×1>F+(2×2)<1×1>G+(2×2)<2×1>H
在上述例子的表达式表达中,标识符B位于第一项中的第二因子中。此外,第二因子由第一括号“(”和“)”包围。因此,标识符B的位置表达首先包含(1×2)。然后,在第二因子中的()内,标识符B为第一项的第一因子。因此,标识符B的位置表达为(1×2)<1×1>B。
同样地,在上述例子的表达式表达中,标识符C为第一项中的第二因子中的第二项的第一因子。因此,标识符C的位置表达为(1×2)<2×1>C。而且,在上述例子的表达式表达中,标识符D位于第一项中的第二因子中的第二项的第二因子中。因此,首先,作为标识符D的位置信息,明确表示为(1×2)(2×2)。而且,在第一项中的第二因子中的第二项的第二因子中,标识符D为()内的第一项的第一因子。因此,标识符D的位置表达最终为(1×2)(2×2)<1×1>D。
如上述的例子,在标识符Z位于由()包围的因子中的情况下,使用(i×j)来作为表示包含此标识符Z的项的位置的信息和表示此项中的因子的位置的信息。(i×j)表示:位于第i个项中的第j个因子中,并且第j个因子是由第一括号包围的因子(集合因子)。上述例子这样的表达式表达的位置表达由(i×j)这样的表示存在第一括号的信息与<k×l>这样的表示不包含()型的因子的项的位置和因子的位置的信息的组合来描述。因此,在因子通过多个()加深为二级以上的情况下,以(i1×j1)(i2×j2)的方式列出表示存在第一括号的信息。通过列出表示存在第一括号的信息的个数,明确表示第一括号的分级深度。
在图5中,示出了将由表达式表达得到的位置表达式与标识符的关系储存于数据库的表的例子。不过,在图5中,位置表达式以绝对位置信息进行表示。图5将由上述例子的表达式表达得到的位置表达式与标识符的关系描述成表。如这样的例子,根据实施方式1,能以第一项的第一因子是A、第一项的第二因子中的第一项是B、第一项的第二因子中的第二项的第一因子是C、第一项的第二因子中的第二因子中的再第一项是D等的方式,通过表的形式来储存位置表达式与标识符的关系。
而且,例如,当发现C作为值时,从其位置表达式(1×2)<2×1>去除<2×1>,检索位置表达式(1×2),由此能取得与标识符C关连的标识符。例如,通过取得对应于包含位置表达式(1×2)(i×j)的属性的值,能取得包含因子C的项。在此,i和j是任意的整数。在实施例1中,这样的位置表达式(1×2)(i×j)描述为(1×2)*。
即,从表达式表达转换为位置表达式,如图5所示,对各标识符,生成位置表达式与标识符的关联,由此能将表达式表达转换为已有的数据库的数据。因此,能使用已有的数据库的管理系统等的功能来处理表达式表达。
在表达式表达是包含第二括号“{”和“}”的表达式表达的情况下,也能与包含第一括号“(”和“)”的表达式表达同样地生成对应的位置表达。例如,当将表达式表达A×(B+C×{D+E})+F×{G+H}转换为位置表达式时,如下。
<1×1>A+(1×2)<1×1>B+(1×2)<2×1>C+(1×2){2×2}<1×1>D+(1×2){2×2}<2×1>E+<2×1>F+{2×2}<1×1>G+{2×2}<2×1>H
如此,将第一括号与第二括号组合来创建位置信息,由此,在项的因子包含由第一括号与第二括号的组合所形成的分级的表达式表达的情况下,也能唯一地描述表达式表达中的标识符的位置。
在此,由绝对位置信息的括号划分的各项可以说是通过中缀表示法将包含该标识符的项的表达式内的出现位次与包含该标识符的因子在包含该标识符的项内的出现位次通过乘积运算符连接的。例如,在图5的第二行中,对应于值“A”的绝对位置信息<1×1>表示:表达式A×(B+C×{D+E})+F×{G+H}中的、第一项A×(B+C×{D+E})中的第一个因子A。
此外,绝对位置信息中的多个括号的积表示:表达式表达中的嵌套状的分级结构。例如,在图5的第三行中,对应于值“B”的绝对位置信息中的第一个括号(1×2)表示:表达式A×(B+C×{D+E})+F×{G+H}中的、第一项A×(B+C×{D+E})中的第二个因子(B+C×{D+E})。此外,第二个括号<1×1>表示:表达式(B+C×{D+E})中的、第一项B中的第一个因子B。需要说明的是,在本实施方式中,设为:越用更多的括号括起来,越表达下位的分级或分级越深。
此外,绝对位置信息的括号中的、第一括号“(”和“)”表示:表达式表达中用第一括号划分的级。另一方面,第二括号“{”以及“}”表示:表达式表达中用第二括号划分的级。
如上所述,根据位置表达式,能以附加了可唯一确定各标识符的位置的信息的形式表示由表达式表达描述的信息。此外,表达式表达中的表达式与位置表达式能相互转换。
需要说明的是,可以对表达式表达所包含的表达式附加位置信息。例如,针对表达式表达所包含的所有的项(表达式表达的子集),对各项所包含的至少任一个因子附加位置信息。表达式表达A×(B+C×(D+E))+F×(G+H)包含两个项A×(B+C×(D+E))以及F×(G+H)。此时,当对各项的开头的因子A以及F附加位置信息时,最初的表达式表达能以<1×1>A×(B+C×(D+E))+<2×1>F×(G+H)这一位置表达式来表示。然后,该位置表达式能分割为两个部分<1×1>A×(B+C×(D+E))以及<2×1>F×(G+H),或者基于位置信息将分割后的部分结合并恢复为原来的位置表达式。
此外,如上述的结合律所示,以加法运算符结合后的表达式表达的一部分能在任意的位置分成子集(用圆括号划分的表达式表达的部分)。例如,A+B+C这一表达式能表达为A+(B+C)或(A+B)+C。如此,如果将表达式表达分割为项的子集并对各项附加位置信息,则能基于位置信息将项结合并恢复为原来的表达式表达。由此,除了<1×1>A+<2×1>B+<3×1>C这一位置表达式,上述的表达式表达也能用<1×1>A+<2×1>(B+C)、或者<1×1>(A+B)+<2×1>C这一位置表达式表示。
(系统构成)
图6是表示本实施方式的系统的一例的构成图。图6的系统1包含:信息处理装置100,控制本实施方式的处理;服务器装置200(在图6的例子中,为200a、200b、200c……),分散地执行本实施方式的处理。此外,信息处理装置100与服务器装置200以能够介由网络300通信的方式连接。需要说明的是,在图6的例子中,以一个信息处理装置100集中管理其他服务器装置200为例进行说明,但也可以构成进行分散控制的装置群。即,在任一个装置接收了处理要求的情况下,都对数据进行分割并分散储存于其他装置以及自身装置,或者将自身所保持的数据与其他装置保持的数据结合(也称为“复原”),输出结合结果。
(信息处理装置的装置构成)
图7是举例示出第一实施方式(也称为实施例1)的信息处理装置100的构成的框图。如该图所示,第一实施方式的信息处理装置100具备:输入对象信息的键盘和指示器等输入部11、储存所输入的对象信息的存储器12(相当于本发明的存储部)、基于规定的程序处理对象信息的CPU13、输出所输入的对象信息或处理后的对象信息的显示器等输出部14、连接CPU13与输入部11之间的接口15、以及连接CPU13与输出部14之间的接口16。
接口15例如是USB(Universal Serial Bus:通用串行总线)等串行接口。此外,接口16例如是RGB(红、绿、蓝)的图像信号以及同步时钟的输出接口。
其中,如图7中以虚线举例示出的,信息处理装置100可以介由接口与外部存储装置、可拆装的存储介质的驱动装置、通信部等连接。在此,外部存储装置例如是硬盘驱动装置、SSD(Solid State Drive:固态硬盘)等。此外,可拆装的存储介质例如是CD(Compactdisc:光盘)、DVD(Digital Versatile Disk:数字通用磁盘)、蓝光光盘(Blue-layDisk)、闪存卡(Flash Memory Card)等。此外,通信部是访问网络并与其他信息处理装置通信的装置,例如是NIC(Network Interface Card:网络接口卡)等。
信息处理装置100较为典型的是个人计算机、服务器等计算机。不过,信息处理装置100并不限定于那样的计算机,例如,能采用移动信息终端、移动电话、PHS(PersonalHandyphone System:个人手持电话系统)、数字电视、数字电视的调谐器或者机顶盒、包含硬盘的电视的录像装置、车载用终端等来实现。此外,存储器12包含:易失性DRAM(DynamicRandom Access Memory:动态随机存取存储器)、非易失性EPROM(Erasable ProgrammableRead Only Memory:可擦除可编程只读寄存器)、EEPROM(Electronically Erasable andProgrammable Read Only Memory:电可擦除可编程只读存储器)、闪存等。
信息处理装置100的功能通过CPU13执行程序来实现。该程序安装于存储器12或者未图示的外部存储装置。程序通过通信接口从网络或者可拆装的存储介质安装。因此,该程序通过网络或者可拆装的存储介质等流通。
此外,储存于存储器12或者未图示的外部存储装置的对象信息通过CPU13执行规定的程序而在各层级中转移。需要说明的是,所谓各层级通过以下层级来举例示出:集合层级122,所述对象信息的抽象度被表达得最高;拓扑空间层级123,所述对象信息的抽象度表达得低于所述集合层级122,以子集为要素来表达该对象信息;黏着空间层级124,所述对象信息的抽象度表达得低于所述拓扑空间层级,该拓扑空间层级中的所述对象信息彼此黏着;蜂窝空间层级125,以规定的属性来表达所述拓扑空间中的所述对象信息。此外,在各层级中表达的对象信息也可以表示为附加了位置信息的位置表达式。
(服务器装置的装置构成)
图8是举例示出第一实施方式的服务器装置200的构成的框图。与信息处理装置100相同,服务器装置200也是一般的计算机装置。如该图所示,第一实施方式的服务器装置200具备:输入对象信息的键盘和指示器等输入部21、储存所输入的对象信息的存储器22(相当于本发明的存储部)、基于规定的程序来处理对象信息的CPU23、输出所输入的对象信息或处理后的对象信息的显示器等输出部24、连接CPU23与输入部21之间的接口25、连接CPU23与输出部24之间的接口26。
接口25例如是USB等串行接口。此外,接口26例如是RGB的图像信号以及同步时钟的输出接口。
其中,如图8中以虚线举例示出的,服务器装置200可以介由接口与外部存储装置、可拆装的存储介质的驱动装置、通信部等连接。在此,外部存储装置例如是硬盘驱动装置、SSD等。此外,可拆装的存储介质例如是CD、DVD、蓝光光盘、闪存卡等。此外,通信部是访问网络与其他信息处理装置通信的装置,例如是NIC等。
需要说明的是,服务器装置200也并不限定于计算机,例如,能采用移动信息终端、移动电话、PHS、数字电视、数字电视的调谐器或者机顶盒、包含硬盘的电视的录像装置、车载用终端等来实现。此外,存储器22包含:易失性DRAM、非易失性EPROM、EEPROM、闪存等。
服务器装置200的功能通过CPU23执行程序来实现。该程序安装于存储器22或者未图示的外部存储装置。程序通过通信接口从网络或者可拆装的存储介质安装。因此,该程序通过网络或者可拆装的存储介质等流通。
此外,储存于存储器22或者未图示的外部存储装置的对象信息(表达式)221以包含附加并关联有位置信息的键(Key)222和值(Value)223的KVS(Key Value Store:键值存储)形式来保持。需要说明的是,KVS是具体的实现手段的一例,也可以使用其他形式。例如,既可以将位置信息保持于键、将因子保持于值,也可以将共同的因子保持于键、将通过乘积运算符与该共同的因子结合的其他因子以加法运算符连接并保持于值。
(分割储存处理)
图9是表示由信息处理装置100执行的对象信息的分割储存处理的一例的处理流程图。信息处理装置100执行能在存储器12中执行并展开的计算机程序,执行图9的处理。需要说明的是,在图9的处理中,对象信息以表达式表达形式保持。
首先,信息处理装置100将作为对象信息的表达式读出至存储器12(图9:D1)。在此,对例如数据结构(表达式的结构)按各国有所不同的一些对象信息进行处理。例如,读出如下表达式。
(例子)
德国(表达式1)+法国(表达式2)+日本(表达式3)+德国(表达式4)+法国(表达式5)+日本(表达式6)+德国(表达式7)+法国(表达式8)+日本(表达式9)+……
需要说明的是,表达式1、表达式2、……分别是本实施方式的表达式表达。即,能包含加法运算符、乘积运算符、有序因子构成运算符、集合因子构成运算符等。此外,各表达式的结构按通过乘积运算符连接的国名而不同。
接着,信息处理装置100在规定的位置分割对象信息,并且附加位置信息(D2)。由于对象信息是字符串,因此能在任意的位置进行分割,但在本实施方式中,在表达式表达中的项之间进行分割。所谓的项之间是表达式表达中以加法运算符连接的部位。此外,表达式表达呈嵌套状地包含多个表达式,但在本实施方式中,在以第二括号(有序因子构成运算符)划分的级的上位的部位(以括号划分的表达式的外部)进行分割。换言之,不在第二括号内进行分割。对于以第二括号划分的级所包含的项,如果不维持顺序进行处理,恐怕无法取得一致性,此时,如果维持顺序进行分割,则使用分割后的表达式也能进行并行处理。例如对分割如下表达式的情况进行说明。
(例子)
A(B+C)+{D+E}{F+G}
在该例子中,能在A(B+C)与{D+E}{F+G}之间进行分割。需要说明的是,基于上述的分配律,也可以分割为A×B和A×C+{D+E}{F+G}。不过,不在第二括号内的D与E之间、或者F与G之间进行分割。然后,能对分割后的各表达式并行执行检索处理、统计处理,将结果进一步结合或统计。即,能将由表达式表达描述的对象信息分散保持,分割为能并行处理的形式。
具体的分割位置可以接收用户的指定。该情况下,基于例如上述的条件,用户指定表达式表达中以“+”连接的部位的任一个。然后,在所指定的部位分割为多个表达式(即,对象信息的子集)。例如,在用户指定了项“法国(表达式2)”与项“日本(表达式3)”之间的情况下,对象信息分割为以如下位置表达式表示的两个子集。
(分割例1)
<1×1>(德国(表达式1)+法国(表达式2)),
<2×1>(日本(表达式3)+德国(表达式4)+法国(表达式5)+日本(表达式6)+德国(表达式7)+法国(表达式8)+日本(表达式9)+……)
此外,可以基于数据大小,以分割后的子集为规定的容量以内的方式决定分割位置。该情况下,例如,计算从开头起的数据量,在超过规定的阈值之前所存在的项之间进行分割。如此,能以分割后的表达式的容量为固定值以下的方式分割对象信息。例如,在从开头到表达式5的中途超过规定的容量、而且从表达式4之后到表达式9的中途超过规定的容量的情况下,对象信息分割为如下三个以上的子集。
(分割例2)
<1×1>(德国(表达式1)+法国(表达式2)+日本(表达式3)+德国(表达式4)),
<2×1>(法国(表达式5)+日本(表达式6)+德国(表达式7)+法国(表达式8)),
<3×1>(日本(表达式9)+……
此外,可以按各项内共同包含通过乘积运算符连接的规定的因子的项进行分割。如此,能基于信息的含义、特征来分割对象信息。当参照上述的表达式表达的例子时,各项内作为国名的“德国”、“法国”、“日本”的因子通过乘积运算符结合。由此,例如,当按各项中在左侧通过乘积运算符结合的因子共同的项进行分割时,对象信息分割为如下三个子集。
(分割例3)
德国(<1×2>(表达式1)+<4×2>(表达式4)+<7×2>(表达式7)+……),
法国(<2×2>(表达式2)+<5×2>(表达式5)+<8×2>(表达式8)+……),
日本(<3×2>(表达式3)+<6×2>(表达式6)+<9×2>(表达式9)+……)
然后,信息处理装置100将分割后的对象信息的子集分散储存于服务器装置200(D3)。在本步骤中,基于规定的规则将数据分配给多个服务器装置200,介由网络进行发送。另一方面,取得数据后的服务器装置200分别将数据储存于存储装置。在上述的分割例1的情况下,分别如图10A以及图10B所示,两个服务器装置200以KVS形式保持数据。在图10A以及图10B的例子中,按分割后的项,以位置信息对应于键、表达式对应于值的方式储存。此外,在分割例2的情况下,分别如图11A~图11C所示,三个服务器装置200以KVS形式保持数据。在图11A~图11C的例子中,按分割后的项,也以位置信息对应于键、表达式对应于值的方式储存。此外,在分割例3的情况下,分别如图12A~图12C所示,三个服务器装置200以KVS形式保持数据。在图12A~图12C的例子中,按分割后的项,以共同因子对应于键、通过乘积运算符与共同因子结合的位置表达式对应于值的方式储存。
通过如上所述的分割处理,能将以表达式描述的对象信息分散配置于多个服务器装置200。此外,对于如上述的分割例1~3那样分割后的各项,如果对各自所包含的至少一个因子附加位置信息,则能通过基于位置信息将各项结合来恢复为原来的表达式。此时,即使各项包含结构不同的表达式,也能进行处理。如图10A~图12C所示,分割是在被有序因子构成运算符所包围的表达式的外侧的、通过加法运算符连接的位置的任一个进行的。即,表达式1,表达式2,表达式3,……这样的对象信息的内容保持应该维持的构成要素(标识符等)的顺序并分割。由此,能对分割后的数据进行并行处理。需要说明的是,也可以通过将同一信息重复保持于多个服务器装置200中来提高可用性。
(结合处理)
接着,对将分散配置的对象信息结合(复原)并提交给用户的处理进行说明。由上述的分割处理生成的对象信息的子集能基于位置信息恢复为原来的对象信息。具体而言,基于附加于各项的任一个因子的位置信息,按照表示项的出现位次的值递减的顺序、因子的出现位次递减的顺序结合。
图13中示出了执行结合处理的应用程序的处理例。需要说明的是,由分割处理生成的位置表达式以图10A以及图10B、图11A~图11C、或者图12A~图12C的KVS形式保持在多个服务器装置200。
首先,信息处理装置100从用户接收结合处理的执行指示(图13:C1)。此外,信息处理装置100从各服务器装置200取得分散储存于多个服务器装置200的对象信息的子集(C2)。
然后,信息处理装置100将取得的结果结合(C3)。由于从服务器装置200取得的信息中附加有位置信息,因此,基于位置信息,按照表示项的出现位次的值递减的顺序、并且因子的出现位次递减的顺序结合,由此,能生成原来的对象信息。根据本实施方式,由于信息处理装置100能将各服务器装置200处理后的结果简单地结合,因此通过增加服务器装置的数量,能提高整体的处理速度。
然后,信息处理装置100输出结合后的结果(C4)。在此,例如,既可以输出描述为包含位置信息的位置表达式的对象信息,也可以输出删除位置信息并以表达式表达进行描述的对象信息。至此,结束结合处理。
(对具体数据的应用例)
本实施方式的分割处理能将各种数据作为对象信息处理。例如,能将设于大厦之类的建筑物的设备、工业产品等的BOM(Bills of Materials:构成表)转换为表达式表达进行处理。一般而言,BOM按厂家以不同的形式描述。然后,作为成品的建筑物、工业产品中包含多个构成要素。能直接将模式(schema)不统一的数据结合,或者基于例如表示建筑、建筑公司、设备机器厂家的因子,按建筑、建筑公司或者设备机器厂家进行分割。此外,可以使用分割后的数据进行并行处理。能通过分散处理来提高处理性能。
同样地,可以将加工食品的原材料作为对象信息。对于食品,在从生产到零售的各阶段中,交易数据的项目不同。此外,有时经销商的变更或质量检查步骤的追加等流通流程也会发生变化。根据上述实施方式的处理,能将模式不统一的数据整合处理。此外,根据上述的分散处理,能提高处理性能。
此外,可以将房地产的土地编号作为对象信息。对于土地,有时因由划分整理等所产生的分割(分划)或整合(合并)而变更土地编号或者变更地名。对于这样的数据,例如通过使用指针,能作为没有闭路的有向图(DAG:Directed Acyclic Graph(有向无环图))进行处理。根据表达式表达、位置表达式,通过设置指针属性,能构筑即使在土地编号变化的情况下也能容易追溯到过去并参照某土地的地目的系统。
此外,能处理人脉的连接关系(人才的交友关系)、软件开发中的客户需求与需求定义的关联、化学领域中的化学式的原子的连接关系等难以通过系统来建立关联的信息,能进一步提高处理性能。需要说明的是,将各数据转换为表达式表达、位置表达式的处理能按具体数据进行定义。
(其他变形例)
在上述的例子中,说明了对一个对象信息进行分割处理、以及复原(结合)处理,但也可以对多个对象信息进行整合处理、以及复原(分割)处理。图14是用于说明多个对象信息的整合以及复原(分割)的图。如上部分所示,在德国的DB(Database:数据库)、法国的DB以及日本的DB中分别登记有表达式1~表达式3、表达式4~表达式6以及表达式7~表达式9。在此,例如以表达式来描述如图2~图4所示的数据结构的对象信息,登记于各DB。此外,各DB例如分别储存于未图示的三个服务器装置。需要说明的是,各DB例如模式可以按国家分别不同。
接着,在图14的中间部分,三个对象信息被整合。在此,形成表示国名的因子与描述了登记于该国的DB的表达式的因子通过乘积运算符连接的项,通过加法运算符连接了三个DB的量的项的表达式登记于整合DB。整合后的表达式既可以以将表示国名的因子设为键、将与该国名通过乘积运算符连接的表达式设为值的KVS形式来保持,也可以例如进一步在各式中附加原来的DB中的位置信息。如此,表示国名的因子也可以说是用于确定整合前的DB的信息。
然后,图14的下部分,三个对象信息被复原(分割)。例如,分割基于各项中通过乘积运算符连接的最左的因子或各项中通过乘积运算符连接的、由一个标识符构成的因子进行。然后,该因子分割登记于所示的DB(各国的DB)。需要说明的是,由于表达式以一行文本进行描述,因此分割后原来的对象信息被复原,但在附加有位置信息的情况下,也可以基于位置信息进行分割。根据如上的处理,能将由多个服务器装置管理的对象信息整合并对整合后的数据进行各种处理,并且能将原来的对象信息复原。需要说明的是,多个对象信息的模式可以不统一。
此外,实施方式中所述的表示表达式表达的符号、表示位置表达式的符号是一例。因此,例如,可以使用其他符号来代替加法运算符、乘积运算符、集合因子构成运算符、有序因子构成运算符。此外,可以使用其他符号来代替位置表达<i×j>(i×j){i×j}。
此外,实施方式所述的表达式表达、以及位置表达式的应用对象并不限定于KVS。不过,通过以KVS形式保持位置信息和标识符,能构筑适合分散处理的系统。
此外,应用并不限定于取得与表达式表达所包含的标识符关连的关连信息法的处理。对于实施方式所示的信息处理装置100、服务器装置200的功能,举例示出了此前尚未提出的新的数据库的数据结构和数据处理的过程。因此,实施方式的技术能应用于关于使用者要处理的事物、组织、人等的信息或者使用者要处理的概念等在计算机上的处理。作为那样的计算机上的处理,例如,一般能应用于将关于事物、组织、人等的信息或者概念描述为计算机上的信息,储存于存储器等的主存储装置、硬盘等的外部存储装置,构筑数据库,提取、更新、管理所储存的信息的技术。即,实施方式的信息处理装置100、服务器装置200举例示出了计算机上的新的信息的表达技术。
附图标记说明
11、21 输入部
12、22 存储器
13、23 CPU
14、24 输出部
15、16、25、26 接口
100 信息处理装置
200 服务器装置

Claims (8)

1.一种信息处理装置,处理对象信息,所述对象信息使用由符号形成的标识符、将包含一个以上所述标识符的因子结合并形成具有顺序的因子序列的乘积运算符、将包含一个以上所述因子的项结合并形成作为该项的组合的表达式的加法运算符来描述,所述信息处理装置包含:
分割部,在规定的位置将所述对象信息分割为多个项;
发送部,对分割后的项中所包含的因子的至少任一个附加位置信息,并按所述分割后的项保持于多个服务器装置的任一个,其中所述位置信息包含所述对象信息内的项的出现位次和该项内的该因子的出现位次。
2.根据权利要求1所述的信息处理装置,其中,
所述对象信息具有分级结构,该分级结构呈嵌套状地包含所述表达式来作为所述因子,所述表达式由维持顺序地将所述项的组合建立关系的有序因子构成运算符、或者不维持顺序地将所述项的组合建立关系的集合因子构成运算符所划分,
所述规定的位置是在由所述有序因子构成运算符划分的所述表达式的外侧,通过所述加法运算符来将所述对象信息划分的部位的任一个。
3.根据权利要求1或2所述的信息处理装置,其中,还包含:
结合部,从所述多个服务器装置分别接收所述分割后的项,基于所述位置信息,按照项的出现位次递减的顺序且因子的出现位次递减的顺序将各项结合并生成所述对象信息。
4.根据权利要求1至3中任一项所述的信息处理装置,其中,
所述服务器装置分别保持的所述位置表达式在由用户指定的位置被分割。
5.根据权利要求1至3中任一项所述的信息处理装置,其中,
所述服务器装置分别保持的所述位置表达式在分割后的子集为规定的容量以内的位置处被分割。
6.根据权利要求1至3中任一项所述的信息处理装置,其中,
所述服务器装置分别保持的所述位置表达式按共同包含通过所述乘积运算符连接的规定的因子的项被分割。
7.一种信息处理方法,由信息处理装置执行,所述信息处理装置处理对象信息,所述对象信息使用由符号形成的标识符、将包含一个以上所述标识符的因子结合并形成具有顺序的因子序列的乘积运算符、将包含一个以上所述因子的项结合并形成作为该项的组合的表达式的加法运算符来描述,所述信息处理方法包含以下步骤:
在规定的位置将所述对象信息分割为多个项;
对分割后的项中所包含的因子的至少任一个附加位置信息,并按所述分割后的项保持于多个服务器装置的任一个,其中所述位置信息包含所述对象信息内的项的出现位次和该项内的该因子的出现位次。
8.一种程序,由信息处理装置执行,所述信息处理装置处理对象信息,所述对象信息使用由符号形成的标识符、将包含一个以上所述标识符的因子结合并形成具有顺序的因子序列的乘积运算符、将包含一个以上所述因子的项结合并形成作为该项的组合的表达式的加法运算符来描述,所述程序包含以下步骤:
在规定的位置将所述对象信息分割为多个项;
对分割后的项中所包含的因子的至少任一个附加位置信息,并按所述分割后的项保持于多个服务器装置的任一个,其中所述位置信息包含所述对象信息内的项的出现位次和该项内的该因子的出现位次。
CN201580024644.7A 2014-05-09 2015-05-08 信息处理装置、信息处理方法以及程序 Pending CN106575255A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2014-097501 2014-05-09
JP2014097501 2014-05-09
PCT/JP2015/063390 WO2015170770A1 (ja) 2014-05-09 2015-05-08 情報処理装置、情報処理方法およびプログラム

Publications (1)

Publication Number Publication Date
CN106575255A true CN106575255A (zh) 2017-04-19

Family

ID=54392618

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580024644.7A Pending CN106575255A (zh) 2014-05-09 2015-05-08 信息处理装置、信息处理方法以及程序

Country Status (6)

Country Link
US (1) US9990415B2 (zh)
EP (1) EP3142013A4 (zh)
JP (1) JP6542204B2 (zh)
CN (1) CN106575255A (zh)
CA (1) CA2948447A1 (zh)
WO (1) WO2015170770A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108776578A (zh) * 2018-06-01 2018-11-09 南京紫光云信息科技有限公司 一种快速合并对象的方法和系统
CN112199370A (zh) * 2020-09-02 2021-01-08 安徽深迪科技有限公司 一种可有效提高结算效率的bom加速结算工方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007088982A2 (ja) * 2006-02-03 2007-08-09 Maeda Construction 情報処理装置、情報処理方法、プログラム、データ構造、および媒体
WO2012023192A1 (ja) * 2010-08-18 2012-02-23 前田建設工業株式会社 情報処理装置、情報処理方法、プログラム、および媒体
WO2013042230A1 (ja) * 2011-09-21 2013-03-28 前田建設工業株式会社 情報処理装置
CN103475905A (zh) * 2013-09-25 2013-12-25 浙江大学 云环境下基于网络连接复用的影像数据块高效传输方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8396712B2 (en) * 2004-08-26 2013-03-12 West Corporation Method and system to generate finite state grammars using sample phrases
US8863101B2 (en) * 2008-12-10 2014-10-14 International Business Machines Corporation Compiler generator
JP5357286B2 (ja) 2011-09-21 2013-12-04 前田建設工業株式会社 情報処理装置、情報処理方法、およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007088982A2 (ja) * 2006-02-03 2007-08-09 Maeda Construction 情報処理装置、情報処理方法、プログラム、データ構造、および媒体
WO2012023192A1 (ja) * 2010-08-18 2012-02-23 前田建設工業株式会社 情報処理装置、情報処理方法、プログラム、および媒体
WO2013042230A1 (ja) * 2011-09-21 2013-03-28 前田建設工業株式会社 情報処理装置
CN103475905A (zh) * 2013-09-25 2013-12-25 浙江大学 云环境下基于网络连接复用的影像数据块高效传输方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108776578A (zh) * 2018-06-01 2018-11-09 南京紫光云信息科技有限公司 一种快速合并对象的方法和系统
CN108776578B (zh) * 2018-06-01 2021-10-26 紫光西部数据(南京)有限公司 一种快速合并对象的方法和系统
CN112199370A (zh) * 2020-09-02 2021-01-08 安徽深迪科技有限公司 一种可有效提高结算效率的bom加速结算工方法
CN112199370B (zh) * 2020-09-02 2024-01-26 安徽深迪科技有限公司 一种可有效提高结算效率的bom加速结算工方法

Also Published As

Publication number Publication date
JP6542204B2 (ja) 2019-07-10
EP3142013A4 (en) 2017-10-04
EP3142013A1 (en) 2017-03-15
CA2948447A1 (en) 2015-11-12
US9990415B2 (en) 2018-06-05
WO2015170770A1 (ja) 2015-11-12
JPWO2015170770A1 (ja) 2017-04-20
US20170270187A1 (en) 2017-09-21

Similar Documents

Publication Publication Date Title
Lanza et al. Object-oriented metrics in practice: using software metrics to characterize, evaluate, and improve the design of object-oriented systems
CN103744846B (zh) 一种多维度动态局部知识地图及其构建方法
Coscia et al. Uncovering hierarchical and overlapping communities with a local-first approach
CN110168515A (zh) 用于分析数据关系以支持查询执行的系统
CN108446368A (zh) 一种包装产业大数据知识图谱的构建方法及设备
CN107193967A (zh) 一种多源异构行业领域大数据处理全链路解决方案
CN106104518A (zh) 用于按照示例的数据提取的框架
CN108121757A (zh) 一种数据同步方法、装置、系统、计算设备及存储介质
CN105447902B (zh) 动画处理方法和装置
CN109933311A (zh) 一种信息系统创建方法及相关装置
Batagelj et al. Analysis of kinship relations with Pajek
CN109117470A (zh) 一种评价文本信息的评价关系提取方法及装置
CN108197656A (zh) 一种基于cuda的属性约简方法
CN105912665A (zh) 一种Neo4j向关系型数据库的模型转换和数据迁移方法
CN106575255A (zh) 信息处理装置、信息处理方法以及程序
CN109241508A (zh) 一种试题和试卷结构的设计器和设计方法
D'Errico Push: Software design and the cultural politics of music production
CN110263021A (zh) 一种基于个性化标签体系的主题库生成方法
CN104063230B (zh) 基于MapReduce的粗糙集并行约简方法、装置及系统
US20090300533A1 (en) ETL tool utilizing dimension trees
CA2642401A1 (en) Computing technology/artificial intelligence/neural links and/or multidimensional internet
Usuelli R machine learning essentials
EP3306540A1 (en) System and method for content affinity analytics
JP7022472B1 (ja) データ管理システム、データ管理方法及びデータ管理プログラム
Costa et al. Training software for orthogonal packing problems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170419

RJ01 Rejection of invention patent application after publication