WO2007065356A1 - Procede de traitement documentaire - Google Patents

Procede de traitement documentaire Download PDF

Info

Publication number
WO2007065356A1
WO2007065356A1 PCT/CN2006/003296 CN2006003296W WO2007065356A1 WO 2007065356 A1 WO2007065356 A1 WO 2007065356A1 CN 2006003296 W CN2006003296 W CN 2006003296W WO 2007065356 A1 WO2007065356 A1 WO 2007065356A1
Authority
WO
WIPO (PCT)
Prior art keywords
software
instruction
text
instructions
different
Prior art date
Application number
PCT/CN2006/003296
Other languages
English (en)
French (fr)
Inventor
Donglin Wang
Xu Guo
Changwei Liu
Original Assignee
Beijing Sursen Co., Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from CNB2005101266836A external-priority patent/CN100547590C/zh
Priority claimed from CN2005101310735A external-priority patent/CN1979479B/zh
Application filed by Beijing Sursen Co., Ltd filed Critical Beijing Sursen Co., Ltd
Priority to EP06828250A priority Critical patent/EP1965310A4/en
Publication of WO2007065356A1 publication Critical patent/WO2007065356A1/zh
Priority to US12/133,280 priority patent/US20080263333A1/en
Priority to US13/645,382 priority patent/US20130031085A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/84Mapping; Conversion
    • G06F16/88Mark-up to mark-up conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/151Transformation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents

Definitions

  • the information is roughly divided into non-consolidated and non-consolidated data, and the non-consolidated data mainly composed of Hexi and Li occupy 70%.
  • the comparative comparison of sheep is the medium, and its wood is represented by its main use of data, which reached its peak from the 1970s to the 1990s, and is relatively mature. Non-condensation does not have a fixed number, so non-conversion is very unusual.
  • the software for studying non-consolidated texts has become more popular, forming a multi-scientific format.
  • O ce Red O ce etc. in the oso wod WPS>.
  • the content management software is often in the format of two or three hundred gods, and the format is not updated to the software. How to solve the versatility, digital content extraction, and format compatibility
  • the current control methods are sheep and passwords. Information leakage, companies that cause huge losses every year, are not investigated.
  • any search without Wu Jian will result in a large number of search results.
  • the full-text search basically solves the entire problem, but the rapid rise of power is the primary problem.
  • Existing wood has not fully utilized all the information to solve the problem, for example, the character of the word, the importance of the unused word, but it is ignored in the search.
  • Different requirements under different systems may have different storage requirements. For example, it needs to consider how to reduce the number of magnetic co-finding in order to improve the performance.
  • the embedded number is not the same as that stored in the memory, so it does not exist.
  • the same software may use different storage formats on different platforms. Therefore, the Cruadier General storage system is portable and scalable.
  • the philosophical method, the instruction of the method, and the description method of the instruction operation system generate a system instruction to execute the document operation.
  • the system is the universal wooden platform software operation function of each god's scripture operation. It is connected to the system command without command to the system. As long as each software and each system follow the same, different software can be operated with the same system and the same operation. The same software can also operate in different cultures and different languages, instead of having separate formats.
  • This book includes the introduction of the general text model model and the corresponding requirements of the software.
  • the connection is due to the model, so that different software can be connected to the operation.
  • the common model is also applicable to all formats, and only the same software can operate in different formats. It is connected to the instructions of the general text model operation, and the way of software instruction. All
  • the general-purpose text model recently consists of commands such as, and commands, and also contains multiple commands for group management, query checking, and security control.
  • the general model will be composed of the upper and lower order, the operation instructions also included in the connection, and the storage and retrieval of a residence file.
  • the software for making sums no longer directly deals with the format of Hugh, and it is no longer specific software, so that the same text can be operated in different software, in the same common software, and in different languages.
  • the function is not limited to the sheep will be divided into multiple can be different for different management and control, more than the same page of different software operations (can be divided into different software management and different residence) to provide convenience in file mode is also a very good way
  • the integration of information security makes it possible for security gaps to be closely combined with security operations, rather than being possible. With the same deployment of security management trees, it also hides deeper and more effectively and illegally improves safety and reliability In addition, it provides a degree of safety management, more
  • Figure 1 shows the main software, interface, system and storage according to this system.
  • the software includes any existing management and content management software
  • the software is all rational, and the operations described in accordance with the received instructions are all in accordance with the general text model, and the storage format.
  • the interface command instructs the text to return to the interface. Therefore, since the software can accept the operation of the Guyou command conforming to the general text model, it is not The same software can be operated with the same text and the same text, and the same seat.
  • the access can include the upper access sheep and the lower interface sheep.
  • the upper access sheep command is sent to the lower interface sheep.
  • the lower interface sheep receives the instructions. As a result, the sheep were returned to the system. On the top, the upper interface can be centered, and the lower interface can be centered.
  • the system's software interface does not execute the instructions to execute the operation.
  • each system is commonly used or can also be,,, or tape, or it can be stored as long as it has its own capacity.
  • the software does not need J storage.
  • This liter of software includes a sheep for instructions that operate in accordance with the general text model.
  • This liter of science and technology includes an interface sheep for receiving instructions and a sheep whose root instructions conform to the operation of the general text model.
  • Step the sheep can be connected to the instructions generated by Yuyou to generate instructions.
  • the instructions received by the sheep can be matched, and the matched instructions can be analyzed.
  • the general model is based on the force of the paper.
  • the mercury method is the current method. As long as all the functions of each paper can meet the needs of work and life.
  • thumbnail layout is each thumbnail created in advance. You can view the unspecified pages of the thumbnail layout.
  • the general text model contains multi-subordinates such as,,,,,,, group and layout.
  • composition of the medium or more is the same as the next, and the same can be combined with the sheep without using the number of the original.
  • the general text model can specify that media can only be mediated but can also be mediated. It is not a combination of sheep, it can closely establish, especially for the introduction of each index, can be more profitable.
  • pre-order which can be different and not necessarily rectangular, can be of any shape, and can be represented by more or less closed
  • Layouts refer to (Hui, Yan, ROP, etc.), (including Fusi), factors (straight,, closed, filled with the designated face, etc.),
  • the media or layout can be composed of media groups.
  • An image group can also contain any number of sub-image groups.
  • miniature layout can also be in the miniature layout or in the second,,,,,,,, group of pictures can include digital information. It is best to follow the layout information. It can include shared resources such as fonts and images.
  • the general text model can be assigned or assigned by angle. Use text,,,,,,, group, sheep to assign horns. Is it possible, is it possible, is it possible, is it printed, etc.
  • the universal text model is a way to surpass the previous Aries car. It contains many and centralized inclusions. In the Chinese language, it has a wide range of places and security controls. You can rest Chinese characters or rectangles, unlike the current management file.
  • 3 to 9 show the general object model involved in this general text model. The groups of the images are described.
  • Heku is made up of mediators or elephants (in the middle). As shown in 3, it includes mediator, any number, and any number of shares.
  • the angle, angle, index information, book, number, Wait. Sharing refers to the possible sharing of images, images, etc. in different texts.
  • Font information, information, mini-layout, numbers, etc.
  • Differences in sharing may use images, seals, etc. in common.
  • Shown in 8 includes media or layout, any number of groups and any number of. Including, numbers
  • the picture group includes any number of layouts, any number of picture groups and possible numbers.
  • the image group includes the image group, which is similar to the file format of the resource manager including the file.
  • the layout includes,, straight,, arc, path,, image, rest,,, information, document, text,,, and connection.
  • the most generalized text model is contains, and layout.
  • the layout includes text, straight and image.
  • Complete general security model is
  • the room of the elephant is to all the children of the elephant.
  • the system includes whether it can be, whether it can be, whether it can be recycled, whether it can be collected, and its arrangement and combination. You can also print other ones that need to be uncoordinated by the software.
  • the angle can be arbitrary. It includes the child of the elephant and the referenced ones.
  • the result of the instructions of the horn elephant is to return to the software, and the software depends on the identity of the mercury, usually P, by Software storage, Hu can also be the mercury password.
  • the software can be as many as possible, and some are from different corners.
  • the unified interface of the interface can be based on the general text model, the general security model, and the commonly used operations, depending on the instructions of each village operation in the general text model.
  • Each software can be accessed by Guyou commands.
  • Zeng Jie or also very sheep. Included in the operation of the general text model.
  • Querying Yu Gen in to find the matching content can be either information or inaccurate information, that is, fuzzy.
  • Each operation of each medium is a function of connection.
  • Each operation instruction can encapsulate each, and a method of writing possible operations.
  • the search program of Heli is divided into text information and more information can only be extracted from text information.
  • this P query function is integrated, it can make full use of the information contained in the text without providing a more powerful means
  • the following is the interface that is connected in the mode of operation ten operations, in which the interface non-binding operating language (O) is available.
  • the ER is out of operation, and the corresponding information is displayed. For other sub-elements, you can refer to the description of each command.
  • 1.2 ph to go It can be either a file or a path or a path, or other The specified representation method.
  • Different characters can be used in different situations, that is, without command format, as long as the characters are different, they can be specified in different ways. For example, each file () and
  • the different characters of different gods can be specified in different ways, and are closer to other physical combinations, especially those that do not specify a specific resource location.
  • the method has the best versatility because or as long as the file is supported, or Support characters.
  • 2.2.1 de is the reference pointer of the image represented by the intermediary character.
  • one or more contents can be specified (the ones in the front corner can be specified), or the size not specified by C p can also be specified.
  • 3.2.6 o p describes the layout method, and the sage attribute is used by GePageB p.
  • the O R T contains sub-elements that represent the query results, and the sub-elements that represent the number of query results. You can use O GET to query each query.
  • Example text operation can be completed with the following command
  • the text creation operation can be completed with the following command: ps insertion position
  • TR h ocBase is a function of introducing new phenomena
  • the method P of the function is connected in every operation of each interface.
  • the inserted operation instruction is to connect the interface function that is connected in the following way. se Docse P ocbase 0)
  • v a ocBase () operation instruction is that the connection function of the upper interface is not connected in the following way.
  • X ACOS SY BA or specific hardware platforms (such as x86CP PS POW R PC, etc.) can have cross-platform special interfaces, so that software and systems on different platforms can all use the same
  • the interface, especially the software on the platform, can also introduce the unimplemented phase operations on the platform.
  • the software deployment in the customer is using C, W dOWS operation system, the system is deployed in each, using a large, x operation system, but the software can still operate like the system on the local culture.
  • the interface can be language-specific. It can be seen that
  • connection of platform and language is more versatile. Especially with the d command, because there are currently generation analysis tools on different platforms and languages in different gods, it has good cross-platform and language connection, and it is very convenient for engineering to connect to the yuan and the next sheep.
  • the instructions described in this article can be generated by the description method of the operating system, the description method of the hardware platform or the language.
  • the way can be language X, or the way of instruction.
  • the instruction is a character that conforms to the operation of the general model.
  • the value in the instruction has the value length and the order of high and low bits. The value is not 32, and the order of high and low bits is high. Further instructions can be compared with the same interval
  • the instructions generated by Yu Yan's description method are such that the parameters of the instruction only use characters, and are based on integers and / or integers.
  • the length of the value and the order of the high and low bits can be used to specify the parameter order of the instruction. Language characteristics.
  • the connection methods listed above are based on similar ideas, and the connection is also included in this warranty.
  • the operation instruction can be added to the same idea as above, and the operation instruction can also be changed, especially the modeled operation instruction is also changed.
  • the optimized case only the text, the text, and the layout
  • the software is the software that contains the access interface, such as the Oce software, content management, resource collection, etc.
  • the instructions are unified according to the previous method. All the instructions are not completed and the operation is suspended.
  • the system can be stored locally. For example, you can store all of the media files in the media file. You can use the file system function in the operating system. You can also page the file to fully operate the system. management.
  • the storage format can be saved in the format, X, and near X.
  • the description language (methods of words, images, etc. on the surface) can be Pos Sc p, P F SPD (True Language used by Half Life), but any language can also be used as long as it conforms to the traditional interface.
  • the undescripted model can be used as a subordinate type, and the phase can be completely established.
  • the execution operation is added in the village, the deletion operation is deleted, and the execution operation is the same.
  • the execution operation of the software is taken out, and the return software is executed.
  • the core is the sub-node expressed by the sub-node.
  • the result of a certain result of the child is the result of the child of the first child, then the S of the child, and then the sequence of the individual S is connected to the AS of the value of the child. If the reference of the subtree is required, the referenced meson can also be used. The method is the same as above.
  • the existing Muli can no longer be used.
  • the method of introducing the result can be changed to the following scheme.
  • the child and its attributes are connected in order by separation, and the result of the connection is S. It is possible to change the method of introducing results into a subroutine of the next scheme.
  • the unused separation of each of its attributes is connected in sequence with no sub-sub-, and each attribute is connected, and the result is obtained.
  • the method of introducing the results can be any of the following schemes.
  • Some of the children,,, each, the sub-diversity of the future (possible) or specific (S,) are connected in a predetermined order. Not (directly connected or separated
  • the above-mentioned predetermined order means that the sub-length, each length, sub-, and each can be in any order, as long as it is a predetermined order.
  • each of the subtrees can be either depth first or width first.
  • the number is usually meson tree and all its children) has inch P, where the density .
  • C has a & which will be given to the number of secret angles that can be modified, while the number of four can be cored.
  • each content has not been modified or deleted before being generated, the number can be used.
  • the number can be the content of the home, or it can be from the home and all the content generated before the home. In the future, it may be better to wait for a while, as long as the new content is located in the newly created one without modification, it will still be effective, but the former only bears the responsibility of the future and not the future.
  • the wood plan that meets the needs very well has a great deal. In contrast, other existing wood is either not allowed or edited (it's just not changed). The existing content in the previous wood plan is not modified.
  • the solution is to complete the editing by the software.
  • the file (the mercury is stored in a complete file according to the format of the software, such as the OC file) is embedded into the file.
  • you need to edit take out the file and use the file to edit.
  • After editing clear the software management and regenerate the content, Embed the newly modified file into it.
  • Any software can print and print.
  • any software can add any content, but does not already exist.
  • Any software can be edited on the existing content layout without having to consider the existing (no or no). 4. Any original editing software that uses content that the text already contains can be used as usual.
  • a software instructions are at. Create a new text in ase and store it in c
  • a software instruction creates a new page in c, the size is w, it will be stored in age
  • a software instruction inserts text at x y position semi-business O Tex ex
  • the sum number makes the same text common among different softwares, so that different softwares have good operation at the same time.
  • the important aspect is that the aspect can be subtle, and the other aspect can be very, not the unrestricted.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Document Processing Apparatus (AREA)

Description

理方法 木領域
本 涉及 神文 理方法。 背景
信息 大致分力 化 和非結 化 , 其中以 和 休力主的非結 化 資料 占有 百分 七十。 化 的 比較 羊 即 介 , 其 木以 代表, 主要是利用數 統 , 上 紀七 十年代 到九 十年代 到頂峰, 和 已 比較成熟。 非結 化 則沒有固定 數 因此 非 化 的 非常的 。
目前赴理各 非結 化文 的軟件已 比較普及, 形成了多神文 格式林立的狀況。 例 , 目前就存在 c oso 的wod WPS> 中的 O ce Red的 O ce等。 通常, 介 容管理軟件往往 二三百神文 格式, 而且 格式近在不 更新 給 軟件的 未了巨大的 。 何解決 通用性、 數字內容提取、 格式兼容 越未越 們的 們迫切希望解決以下
1) 不通用
基本上 不同用戶只能交換同 軟件 理的 , 交換不同 軟件 理的 形成信息 。
2) 接 不統 、 兼容 太
不同的 軟件 文件格式互不兼容 在 中 利用 組件解析 (前提是 提供相 接口 ) 己投 力 量 到尾的解析 的格式。 3)信息安全較差
目前 的 控制手段羊 , 主要是 、 口令 。 信息泄露, 每年造成巨大損失的公司案例 出不究。
4)都是 羊 的 缺乏 袖管理手段
胸中都有大量 但 同缺乏有效的組 管 理 而且資源共享很 。 , 休文件 全文數 等。
5) 分居的 木不完善
目前 些軟件 Adobe的p O OS op, C OSO 的Wod 多多少 少已 有 的概念, 但 的功能近比較羊 , 管理手段比較 羊, 不能 滿足 需求。
6)檢索手段不移
看信息的海量化, 任何 介吳健 未搜索都合得到數量 大的 檢索結果, 全文檢索 木基本解決了 全 的 , 但 迅速上升 力首要問題。 現有 木近沒有很充分地利用全部信息未解決 問 題, 例 文字的字休、 完全可以用未 文字的重要性 但 都在檢索 忽略了。
然各大公 目前都努力將 己特有的 格式 , 各 也致力于制訂通用的 格式 。 但不管是 有的 格 式( .dOC)近是 的 格式( P F),只要是以文 格式 , 就不可 兔戶生以下問題
a) 效果不統
使用同 杯 的不同軟件都需要 己 解釋、 生成 格式的 , 造成大量 , 而且 各 解釋程序不同, 例 有的完善有的 相 羊 有的支持新版本有的只支持 版本數 , 同一文 在不同軟 件下 現出不同的版式, 甚至出現解釋 。 k b) 得 新
軟件是不 新的行止, 但由于 增 介新功能就需要增 描述 功能的信息 而且只有等到 修訂的時候才能增 新的格式 因此 把存儲格式固定 將合 得 木 新的 。
c) 索性能
海量信息 需要增 大量的 信息以提高 索性能 但固定死 的存儲格式 以增 檢索信息
d) 可移植 和可伸縮性
在不同的 統 下 不同的 需求,可能 有不同的存儲要求。 例 存儲在 上就需要考慮 何減少磁共尋 的次數以提高性能 而在嵌 中數 都相 于存儲在 存中的, 就不存在 。 例 , 同 介 的數 軟件在不同平台上就可能 使用不同的存儲 格式。 因此 存儲 准將 統的可移植 和可伸縮性。
現有 木中最 、可交換 最好的 是AdobeAc ob 的 然而, 然P F已 全球文 、 交換的事 , 但也不能 現在不同的軟件 間交換P F , 也就是說, 不能 P F 的 操作 。 而且 是Ac ob 近是 O ce, 都只能 羊
, 缺乏 的管理功能 不 各 操作的功能。
另外, 在 信息安全的方面, 現有 木也存在較 缺陷。 Wod 和P F 最 的 ,都是 或者口令 等 安全控制, 沒有提供 統的身份 , 的控制都是 固的 不能 化到 的任意 , 任意
和 。 現有的內容管理 統 然 提供較好的 份 和 制, 但由于 理 統是 的, 不 管理 只能做到 , 而 在 使用 施安全控制 以 必要的安全 管理。 由此可凡 由于現有的安全和制 是 的 , 容易 出現安全 。 內容
本 提供了 神文 理方法 的 操作、 多 的管理、 更好的 安全性以及更好的 檢索。
神文 理方法, 方法 的 指令, 所述 指令 操作 統 的描述方式生成 統 指令執行文 操作。
本 了 用戶界面到 存儲都由 介軟件未完成的現 狀, 將 分力 和 統 , 介 間交 互的接 , 近可以 步 介符合 接 的接 。
統是 各各神文 操作功能的通用 木平台 軟件 操作 就 接 未向 統 相 指令 統 指令 相 操作。 , 只要各 軟件和各 統 都遵循同 的 , 不同 軟件就可以 同 介 統 同 丈 操作, 即可 的 操作。 同 同 介 軟件也可以 不同文 統 不同文 操作, 而不用分別 格式都 羊 。
本 近包括 介通用文 模型 模型 各 軟件所需要 理的 相符合。 接 就是 于 模型未 的, 才能 不同的 軟件都可以 接 未 操作。 通用 模 型也這 于各 格式, 同 介 軟件才可以 接 未 不同文 格式 操作。 接 了 于 通用文 模型 操作的各 指令, 以及 軟件向 統 指令的方式。 統 各
指令的功能, 以 軟件 。
通用文 模型近包括由 組成的 、 和 令 等 接 中也包含 多 的組 管理、 查詢檢 、 安全控 制等指令。
通用模型近 將 由具有上下順序的 組成 接 中也包 含 的各 操作指令, 以及 介 某 居所 文件的存儲和 提取。
統近 各 的信息安全管理控制功能, 于角 的 細 管理, 在接 中 了相 的操作指令。
依照本 , 使得 和數 軟件不再直 接跟 休的 格式打交道, 也不再 特定 軟件 , 而使 得同 文 能在不同的 軟件 同通用 同 座 軟件也 不同文 操作 了 的 操作 理 統 各
功能 而不局限在羊 將 分成多 可以 不同居 不同管理和控制, 更 于不同 軟件 同 頁的操作 (可以 成不同 軟件管理和 不同居) 力以 文件方式 提供了 便利 也是 很好的保留 的方式 將信息安全集成在 理的 , 可以 安全縫隙 近能使安全 操作緊密 地結合力 休, 而不是可以 的 , 同 有更多的 同部署安 全管理 木, 相 也 隱藏得更深 更有效地 非法 提 高安全可靠 , 另外 提供 度的安全管理手段, 更 的
, 小的管理羊 。 1 依照本 的 理 統的 。
2 了依照本 的通用 模型的組 。 3 了 2所示通用文 模型中文 象的組 。
4 了 3所示 中文 象的組 。 5 了 3所示 中文 象的組 。
6 了 所示 中丈 象的組 。
7 了 6所示 中 象的組 。
8 了 7所示 中 象的 。
9 了 8所示 中版面 象的組 。
10-17力本 的 中 的 。
18力以 接 的 理 統的 示意 。
本 的方式
以下結合 本 步 細說明。 理解 此 的 休 于 本 不用于限定本 。
1所示 依照本 的 理 統主要 軟件、 接口 、 統和存儲 各。
其中的 軟件包括現有的任何 理和 容管理軟件
軟件都 于 理 統的 , 通 符合接 的指令 操作 所述操作都是 符合通用文 模型的 的, 休存儲格式 。 接口 向 統 指令 所述文 統通 接口 向 返 的 。 由此可凡, 由于 軟件均可以 接 居友 指令 符合通用文 模型的 操作, 所以不 同的 軟件可以 同 文 統 同 文 操作, 同 座 , 接 可包括上接 羊元和下接口羊 , 上接 羊 指令至下接口羊 , 統通 下接口羊 接收 指令, 下接口羊 近 于將 統的執行結果 上接 羊 返 回 統。 在 上, 上接口 可 于 居中, 下接 可 于 統中。
其中的 統 理 統的 軟件 接 口 未的 指令執行 休的 理操作。
其中的存儲 各 理 統的存儲 , 常用的是 或者內 也可以是 、 、 、 磁帶, 也可以是 的存儲 各 只要 各 的 能力即可。 在存儲 各中存儲有多 , 但 軟件而言 不需要 J 的 休存儲方式。
由此可 依照本 , 使得 用房和
不再 特定 軟件 軟件不再直接跟 休的 格式打 交道 不同的 軟件可以 符合通用文 模型的同 丈 , 使不同 軟件 具有良好的 操作 。
本 公升了 軟件, 其包括 于 指令的接 羊 , 所述 指令 于 符合通用文 模型的 操作。
本 公升了 科文 統 其包括 用于接收 指令的接 口羊 和 于根 指令 符合通用文 模型的 操作 的 羊 。
本 近公升了 接口 , 其
上接 羊 于 符合通用文 模型的 操作的 指令 下接口羊 于接收 指令。
步, 上接 羊 可以 居友出的指令生成 指令 下 接 羊 接收到的指令是否符合 , 解析符合 的指令。
以下 本 的 理 統的 休 方式 。
通用文 模型
可參考紙張的特性 所述通用文 模型 是因力以紙張作力 信息的 汞手段是通行至今的 方法 只要 各紙張的所有功 能 就能滿足工作、 生活等 用的需求。
果把 中的 頁 成 張 凡是 到紙上的就 汞下 , 通用文 模型 描述 面上的所有可 容。 現有 木中的 語言 ( POS SC「P )可以描述所有 在紙上的信息 因此 部分 就不再 。 般說未 面上的可 容最終都可以但 文字、 、 固像 。
果 中涉及到特定 休或特殊字符的 , 了 在各 上都能有相同的效果 就需要在 中嵌 相 。 了提高存儲效 率 資源 共享, 即使在多 使用了同 字符 也只需要嵌 介字庫。 像有時也是可能在 出現的 例 每 頁共同的 , 或 出現的公 , 神情況下最好也 共享 像。
然 作力更 先 的信息 理工具 不能 紙張的特性, 近需要增 些增強的數字特性, 例 、 、 、微縮版面。
是 的數 例 作者、 出版社、 出版 、 SB 等 就是 的元 。 是並 通用 , 也不在此贅述。 是 似 汞的信息 也是並 通用 。 信息 了 篇文章所在 的 和 順序, 者 就可以 信息
下 能做到 、 特 , 而不用 者再手工指定位置。 微縮版面是事先生成的各 的微縮 , 者 可以 查看微縮版面未指定 頁。
2是本 的 的通用文 模型。 2所示, 通 用文 模型包含 合 、 、 、 、 、 、 象組、 版面 等多 居次。
其中, 合 由 介或多 組成 間的 相 于 下的居次 同的 相 些, 同可以非常 羊 組合和 , 而不用 本 的數 ,
同往往沒有建立統 索引 (特別是全文索引 ) , 很多 合庫的 操作 般都需要 各 的索引 而沒有統 的索引可用。
由 介或多 組成, 由 介或多 組成 可以包含任意數量的子文 。 所說的 相 于目前普通的 介 文件 (例 OC ) 通用文 模型可以規定 介 只能 于 介 但也可以允許 介 于 。 不是 的 羊組合, 它把 緊密地 , 特別是 容統一建立了各 引 就能 更大的 利性。
由 頁或存在 定順序 ( 前 順序)的 組成, 的 可以不同 而且 也不 定是矩形的 可以是任意形狀, 可以 用 或多 封閉 表示
由 或 定順序 ( 上下順序)的多 組成, 各 同 同玻璃板的 。 由任意數量的版面 和 象組組成 版面 是指 ( 休、 、 顏 、 ROP等) 、 (包括符寺) 、 因 ( 直 、 、 填充了指定顏 的閉合 、 等) 、
TF PEG Bh 、 J G等 、 信息 ( 、 、 等) 、 文件、 本、 、 嵌 、 、 接、 休、 等。 介或 版面 可以組成 介 象組。 象 組也可以包含任意數量的子 象組。
、 、 、 、 都可以近 ( 、 最 修改 阿等, 其 可以 需求 和 或
中近可以包括 信息、 信息、 微縮版面 也可以把微縮版面 在 或者 居次 、 、 、 、 、 象組都可以 近包括數字 信息最好跟看版面信息走, 可以 兔 余, 也比較容 版面建立 、 近可以包括字庫、 像等共享資源。
通用文 模型近可以 介或 角 角 分配 定 。 以文 、 、 、 、 、 象組、 羊 分配 角 羊 是否可 、 是否可 、 是否可 、 是否 打印 等等。
通用文 模型是 介超越以往羊 座車 的方式, 中包含多 、 集中包含 , 而 于 中文 容, 了 度的坊間和安全控制, 可以 休 中 文 字或者矩形, 而不像現在的 管理 統只能 到文件 。
3至 9 了本 的通用文 模型 涉及的各 象的組 示意囤。 所述的各 象的組 是 是 、 化的。
合庫 是由 介或 象組成 ( 中未 ) 。 3所示, 包括 介或 、 任意數量 和任意數量的 共享 。
4所示, 所述的 、 角 、 、 、 索引信息 、 本 、 數字 、 等。 共享 是指 中的不同文 可能共享的 、 像 等。
5所示 括 介或多 。 任意數量 的 和任意數量的 。 包括
、 數字 、 。 包括
, 其 似于資源管理器中的文件 包括 文件 的形式。
6所示 介或多 、 任意數量的 和任意數量的 共享 。 括
、 字庫 、 信息 、 信息 、 微縮版面 、 數字 、 等。 共享 中的不同 可能共 同使用的 像 、 印章 等。
7所示, 包含 介或多 和任意 量的真 面 象組成。 包括 、 數字 、
8所示 包括 介或 版面 、 任意數量的 象組和任意數量的 。 包括 、 數字
、 。 象組包括任意數量的版面 、 任意數量的 象組和可 的數字 。 象組包括 象組 , 其美似于資 源管理器的文件 包括 文件 的形式。
9所示, 版面 包括 、 、 直 、 、 圓弧 、 路徑 、 、 像 、 休 、 、 、 信息 、 文件 、 本 、 、 、 以及 接 。
其中, 包括任意數量的字符 、 休 、 、 文字顏 , 操作 、 背景 、 顏 、 填充 、 、 、 接 、 、 、 顏 、 特 、 、 、 透明 和渲染模式 。 在 休 , 可以在上述通用文 模型 上 步增強或 化。 果在 化模型中省略了 , 則 直接由 象組 如果在 化模型中省略了 , 則 直接由版面 象組成。
可以理解, 最 化的通用文 模型是 包含 、 和 版面 。 其中版面 包括文字 、 直 和 像 。 完整 通用安全模型
了滿足各 安全性的需求, 需要 神通用的 安全模型 以解決由于現有軟件的 安全功能不移 , 或者是安全 管理 的安全 。 本
通用 安全模型包括
1 在 中 置若干 &, 角 是 象的子 。 2. 可以 任意角 任意 (例 、 、 、 、 、 、 版面 等)的 。 果 了 角
象的坊間 , 則 于 象的所有子 。
3. 統 的 包括是否可 、 是否可 、 是否可 再 、 是否可收 及其排列 合。 也可以 其他需要由 軟 件未配合 的 , 不可打印。
4. 角 可以 任意 。 固包括 象的子 , 以及引用到的 。
5. 角 象的指令的 結果是向 軟件返 介 , 作力 軟件以 角 身份 汞的依 , 通常是P 的 , 由 軟件保管, 胡也可以是 汞口令。
6. 軟件以某一 身份 汞 , 通常 " 和 制, 即 統用保存的角 密 決隨和數 軟件, 軟件 返 統, 果 , 則表明 軟件 有 角 的 。 和制也可以用以下方式 , 統將 軟件 軟件 返 統, 統用保存的角 的公 , 如果 , 則表明 軟件 有 角 的 。 力保 ,
可能 。 可以更好 的安全性。
果角 的 是 汞口令 則需要用戶 的 汞 令。
7. 軟件可以同 多 &, 此 有的 是各角 的 。
在 休 可以在上述通用安全模型 上 步增強或 化。 上述安全模型的任何 化模型都是本 的 。
接 的 休
接口 的統 接口 可 通用文 模型、 通用安全模型和 常用的 操作而定 于 通用文 模型中各村 操作的 指令。 所述的 通用文 模型中各村 操作的指令符合接
各 軟件可以 接 居友 指令。
現在介紹接 的 方式。 接 的 可以是上接 羊 按照預先 的 格式生成命令 , 例 < SERT OBJ PA PA T 123.456.789 POS 3)/> 將 命令 下 接 羊 , 下接 羊 接收 統 命令的 或其它 反 信息 或者 接口 的 是下接 羊 提供 些具有林 和參數的接 函數, 例 "BOO O se Page O oc pDoc e , 上接 羊 函數, 操作本身就代表上接 羊 了 指令 或者是上 方法的 合。
接口 操作 十操作 的方式 于 和理解 也 于保持接 的 定性。例 , 70神不同 10 操作, 可以 2 x 200 指令 也可以 20 和 10神功 , 但 然 方式大大減輕了 的 , 而 在 接口
, 增 介 或 也很 羊。 操作 通用文 模型 包 含的 。
例 , 以 7 操作
于 或
于 、
于 列表、 相 和數
于 /修改
插 插 指定 或
刪除 于刪除 象的 介子
查詢 于根 在 中找到符合 的 容 既可以是 的信息 也可以是不准 的信息, 即模糊 。
如下 、 、 、 、 、 象組、 、 固像、 、 路徑 (由 組順序 連接組成 可以是閉合也可以不閉 合的) 、 文件、 腳本、 、 音頻、 視頻、 角 等。
近包括下列 背景 的顏 、 填充 、 、 ROP、 、 、 顏 、 字符高、 字符 特、 透明、 渲 染模式等。
可以理解,在 操作 十操作 方式 接 不能 理解力每 介 和每 介 的所有組合都 定 有 的操作指令, 些組合是沒有意 的。
近可以用非"操作 操作 的函數方式未定 接 例 每 介 象的每 操作都 介接 函數, 各 操作指令 近可以封裝各 , 把 可以 的操作 文成 的方法。
特別地, 果在接口 中 了 版面 的指令 將 保障 版面 致性和 操作性起到非常吳健的作用。
在 查詢指令 除了 的 檢 外 近可以提供更 半 的檢索手段。 在常規的搜索 木 搜索是和 理分 的 搜索 程序只能 中提取 文本信息 而 更多信息 只能 于文 本信息 。但在本 P 查詢功能是集成在 理的 即 統 就可以更充分地利用文 蘊含的信息未提供更 強大的 手段,
1 于 休信息的 休字的 ,T es ewRo a 休的 S se
2. 于 信息的 字的 半生 , 20 以上的 S se" (即 高超 ) 的
3 于顏 的 的 半生 , 藍 的 se
4 于版面位置的 檢索 于 面上半部分的 半生 于 的"S se
. 于特殊修飾效果的 休字的 半生 , 特 至90度 同的"S e 字的 SEP , 字的
6. 似的思路,近可以 一步提供其它 型的 , 反 自 ( 自 )的 , 固的 S se 等 7. 可以 多 版面 象的 合, S se 5 8. 上述 的任意組合
以下是用 操作 十操作 的方式 接 的 介 , 在 中 接口 非結 操作 語言 ( O ) 是用可
言 XM 描述的 列的命令。 都 介 元素, 也都 介 元素 介命令 ,將描述 象的 元素作力 的X 元素的子元素 即可生成 十 象的字 符 。 上接口羊 將 字符 下接口羊 , 就將相虛的操作指令 友 給了 統。 統執行 命令 , 下接口羊 將執行 結果也生成 介符合 O 格式的字符 返 上接 羊 ,使 軟件 操作 結果。
所有 結果都由 OM R T表示, 凡 10 其 下 屬性
S CCESS ( ) 時表明操作成功 否則失 。
子元素
ER 可 操作失 出現, 了相 的 信息。 其它子元素 休命令 可參考各命令說明。
O 包括
1 O OPE 或 11.
1.1
1.1.1 C eae e 是 否則是 已有 。
1.2子元素
1.2 p h 往。 可以是 文件 也可以是 或者 是 或者是 路徑 或者是 的 , 或者其它 指定 的表示方法。 可以用不同特 的字符 各神情 況, 即不用 命令格式, 只要給字符 不同特 就可以用不同 的方法指定 。 例如, 文件 各 ( )和
( "C 、 ) 而 緊跟看 不合是 //, 也不 是 介":
和 // ( tp// ) 指針 E
是指針的字符 表示方式 例 " E 12345678 路徑是"\\ , 是 , 以及服 上的路徑, \\se Ve 北c\ e sep 的 可以用 y ocBas 。在下接口羊 解 析時 果第 介字母是" 就表明核字符 代表 的 否 則 果 字母是 w就表明核字符 代表 往 否則 果 字母是 E 就表明核字符 代表內 指針 否則尋找字符 的第 介 , 果核、 是 就表明字符 代表 R 否則就代表本 地 各上的文件。 于 各 上的 的情形, 可以 介 的 R 未四分 例 " ocbase// yseve/ ydoc2指明 , 只要能給字符 不同特 , 就可以用不同的方式未指定 。 上 說明, 可以 各神不同的字符 特 方式不 于指定 往, 近 于其它物合 特別是用未指定特定資 源位置的 用物合。 在很多情況下, 希望能移用 新方式未指定相 資源 但 不能或不希望 現有的 或函數 就可以 在字 符 中 不同特 的方式 指定, 方法具有最好的通用性 是 因 或 只要支持 文件 或 , 就支持字符 。
1.3返
果成功, 則在 一R T中包含 介 a de子元素, 汞 2 一C OS , 凡 12.
21厲 。
2.2子元素
2.2.1 de , 是 介字符 表示的 象的引用指針。 2.2.2 db de 字符 表示的 的引用指針。 2.3返 返 。
3 GET 凡 13.
3.1屬性
3.1.1 sage 用途, Ge de ( 指定 )、 GeOb ( 指定 ) 、 GePageB p ( 版面 ) 中的一介。
3.2子元素
3.2. p e age 性力 Ge de 使用。 3.2.2 pos 位置順序 sage 性力 Ge de 使用。
3.2.3 de 指定 象的 sage 性力 Ge 使用。 3.24 page 需要 的 的 sage 性力 GePageBmp 使用。
32.5 描述了 的 , 其中可以指定 或 者多 的內容 (可以 的 定是 前角 有 的 ) 也可 以 指定 C p 未指定 的大小。 sage 性 力 GeP e p 使用。
3.2.6 o p 描述了版面 的 方式, sage 屬性 力 GePageB p 使用。
33返
3.31 sage 性力 Ge a de , 執行成功 在 O 一R T 中包含 介 de"子元素 汞pae p s介子 象的 。 3.3.2 sagge屬性力 GeObw , 執行成功 在 O R T中 包含 介 xob 子元素 含有 a de 象的數 的 1表示。 3.3.3 sage屬性力 GePageB p 執行成功 在o p 定 位置 出版面 。
4 O SET , 凡 14
4.1屬性 。
4.2子元素
4.2.1 a de 象的 。
4.2.2 o 象的描述。
4.3返 返 。
5 S
一 RT 插 1
5.1屬性 。 52子元素
52.1 p e 。
5.2.2 Xo 象的描述。
5.2.3 pos 插 位置。
5.3返 果執行成功 則將Xo 參數表示的 插 到p e 中 p s介子 , 在 O R T中包含 介 h de子元素 表示新插 象的 。
6 E ETE 刪除 凡固 16
6.1屬性 。 6.2子元素
6.2.1 de 需要刪除的 象的 。
6.3返 返回 。 7 O Q ERY 查詢 17 7.1屬性 。
7.2子元素
7.2.1 ha de 需要查詢的 。
72.2 Co d o 查詢 。
7.3返回 果成功, 在 O R T中包含 介ha de子元素 代表查詢結果的 , 介 be 子元素代表查詢結果的數量, 可以 用 O GET未 每 介查詢 。
O 包括
文枯 ( CBAS ( C ET
( O OC ( O PAGE ( AY R 象組 ( d BJGR P 文字( O EXT 像 O AG 直 O O EZER) 圓弧 ARC) 路徑 ( M PAT 文 件 ( SRCF E 背 景 M BAC C R 前 景 顏 C R P L R P 、 字 符 寸 C RSZE 、 休 ML TYPEFACE
下文以 O 一 OC O TEXT和 O 一C RSZE 例說 方式
1 O OC
1.1屬性 。
1.2子元素
12.1 meadaa 元教 。
1.2.2 page e 各 。
.2.3 此 嵌 。
1.2.4 avga o : 信息
' 。 12.5 head 信 "息。
12.6 m page 微縮版面。
1.2.7 Sg e: 數字 。
1.2.8 Shaeso ce 共享資源。
2 O TEXT
21屬性
2.1.1 E cod g 文字編碼方式。
2.2子元素
2.2.1 Tex aa 文字內容。
2.2.2 Ch Spac g s 非等同 文字的字 列表。
22.3 S Pos 位置
3 JO C A SZE
3.1屬性
3.11 wd 字符寬度。
3.12 eg 字符高度。
3.2子元素 。
以此 ,可以用同 的方法未描述所有的 O 。 軟 件 操作 , 由上述 O 依照
生成相 的 O 命令 將 O 命令友 統 即代 表向 統 了相 操作指令。
例 建文 操作可以用以下命令未完成
Figure imgf000023_0001
</ OPE >
建文 操作可以用以下命令未完成: p s 插 位置
返 果 行成功 則在 O R T中包含 介 a de 子元素, 表示新插 的
上 就
< SERT OCS
一 一 ET
Figure imgf000025_0001
osVa "1"
</ SERTDOCS T>
命令 是比較繁瑣。
現在介紹 函數 用的方式未 接 的 , 在 中, 通 上接口 下接口的接 函數的方式未 操作指令
統。 以下以 C++ 言 例說明, 。 在 中, 了 O " 、 、
足" 了 介函數" , " " 一O ec作力所有 象的 函數 的參數可以是 的指針或引用, 函數就可這 于所有 。
先 介 返
s c _Re
BOO m bS ccess
CS g m一E O
定 所有 象的
cass
一Ob c
p b c
e Type
TYPE一 OCBASE
TYPE OCSET TYPE OC
TYPE PAGE TYPE AYER TYPE T XT TYPE C ARSZE
Type m Type O Obec
v a ~ O Obec
sa c O Obec CeaeTypeobType
}
O J= " + "TA H ¥J om m M.
O RET O Ope c a pa BOO bCeae A E *p a de)
O RET O Cose A E a de A Edb a de
O R T O Ge a de A E hPae Pos A D E p a de
O R T O GeObType( A a de O Obec Type *pType
O R T O GeOb A D Eha de O Obec pOb
O R T O GePageBmp A E Page R CT ec vod *pB f
O R T O SeOb A D Eha de O Obec pOb
O R T O se A E Pae Pos O Obec pOb A E*p a de - , O R T O Deee(HA Eha de)
O R T O Q ey A E ocbase Co s Cha s Co d oA ph es
然 各 1 , 依然以 O Doc O exO 一C aSZe
cass O oc p b c O Obec t
p b c:
O e
一 a aa m ea aa
m一d ages
O Page Pages
o s
O FFo Fo s
O aVga o m avga o
O T ead T e
一 一 a
O Page p Pages
O Sg a e m Sg a e
hae
O Ob S aed O oc()
v a O DDoc)
cass O Tex p b c O Obec {
p b c
e mE cod g{
E CO E ASC E CO E GB13000 E CO E CO
E cod g m E cod g
cha m pTex
Po m Sa
_C pac Te )
v a O Tex( cass C aSZe P b c O Obec t
p b c
Wd
m eg O C aSze)
v a O C aSze( 以下說明 的使用方法。 首先是 建文 操作
Figure imgf000028_0001
TR h ocBase) 然 是 介 新 象的函數
A se ewOb A E Pae Pos Obec Type ype O一Re e
A ha d
b p ew b O Ob: C eae(ype) P ewOb
e
e O se hPae Po p ewOb a de
deeep ewOb
e e. S ccess? a de J
然 是直接 象的函數
O Ob GeOb( A E a de O Re e
O Obec Type yPe
b p b
e Ge bTypeha de ype)
e.m bS ccess
e
pOb "b :Ceae ype
P b )
e
e Ge"b(ha de pOb
e bS ccess
deeepOb
e NT □ e pOb 在 每 介 象的每 操作都 介接 函數的方式P, 插 的操作指令就是上接 以下列方式 下接 的接口函數未 統的 se Docse P ocbase 0)
在封裝各 d ) 的方式P, 把 可以 的 操作 叉成 的方法, d
cass ocBase p b c b p b c
/
\b e
aa Sz「 h: 全
aa bOve de是否覆蓋
e O ocBase
/
BOO Ceae co s Cha zPah boo bOve de ase * b e
\pa a SzP 庫全 往
e O ocBase
/
BOO Ope (co s Cha *szPah)
/
b e
a
e 元
/
vodCose)
/ b e 角 列表
paam
* Ve O Roe s
* \sa O Roe O Roe s GeRoe s
/
* b e 存儲
am S h 存儲 全 往 e vodSave c a szPa 0) /
b e 插
a Pos插 的位置 * e O ocSe
* sa O ocSe O ocSe se t ocSe( Po ) b e 指定索引的
m dex 列表的索引 e O ocSe
* sa O DocSe O ocSe Ge ocSe( deX
/
b e 的
\pa
e Ge ocSeCo )
/
b e 的
am Le 未 \paa Sz a e
\e vodSe a e e Co s C a Sz a e /
* b e 未
\paam
e 未
/
Ge a e e
/
* b e
\paa
* e
/
co s Cha Ge ame) /
化ne d長度
p a
e 長度 Ge e (
/
比 e
。 a
e d co s Cha*Ge D()
函數
O ocBase(
// 函數
v a ocBase() 插 的操作指令就是上接口以下列方式 下接 的接 函數未 統的
p ocBase. se Docse )
可以用同 的方法力Java C VB eph等各 言 的 軟件 各神不同的接口 。
只要在接 中不含有 特定的操作 統 ( W OW
X ACOS SY BA )或特定的硬件平台 (如x86CP PS POW R PC等)相夫 的特 接口 就可以具有跨平台 , 使得不同平台上 的 軟件和 統都可以統 使用同 的接口 , 特別是可以 介平台上 的 軟件可以 另 介 平台上 的 統未執行相 操作。 例 軟件部署在客戶 使用的是 C , W dOWS操作 統, 統部署在 各 , 使用的是大型 , x操作 統, 但 軟件依然可以像 用本地文 統 各 上的 統未 相 操作。
果在接口 中不含有 特定 語言相 的特 , 則 接 能做到 語言 。 可以看出 用命令 的方式容
平台 、 語言 的接 , 更具有通用性。特別是用 d 命令 的 , 由于目前在各神不同平台、 不同 語言都存在 于 得的 生成解析工具 因此不 接 具有很好的跨平台 和 語言 , 也非常便于工程 上接 羊元和下接 羊 。
也就是說 本 的 中描述的 指令可以 操作 統 的描述方式、硬件平台 的 或 語言 的描述 方式生成。 休 , 所述 方式 可 語言 X , 或者 指令的方式 。
較佳 , 指令是 符合通用 模型的 操作的字符 。 于 指令使用 方式的情況 指令中的數值都 了數值長度和高低位順序 比 數值未 32 、 高低位順序 高位在前。 再有 指令可以 參數 同的間隔方式 比
等。
于 言 的描述方式生成的 指令, 方 式是 指令的參數只使用字符、 有 于整型和/或 整型 等基本 , 其數值長度和高低位順序 近可統 規定 指令的參數順序, 不要使用 等 休語言相 的特性。 以上列 了 接 的 方法, 按照 似的思路 的更 的接 也包含在本 的保 。
理解, 可以在上述 的 上 同 的思路增 操作指令 也可以 化操作指令, 特別是 模型 化 操作指令也 相 化。 最 化情況下只有文 的 、 的 、 各版面 象的
操作指令。
操作
現在 凡 1 依照本 的 理 統的工作 。
軟件是包含符合接 的上接 羊 的軟件 例 O ce軟 件、 內容管理、 資源 集等。 任 座 軟件在需要 操作 , 依照前 方法將指令 統, 統 指令未完成 休操作 。
統可以 由地存儲、 , 例 可以把 介 的文件全部都存儲在 介 文件 可以 介 介 文件, 利用操作 統中的文件 統功能 也可以 頁 介 文件 近可以完全 操作 統, 在 上 出 空間 直接 、 行管理。 的存儲格式 可以用 格式保存, 可以用 X , 近可以用 X 。 描述語言 ( 面上的文字、 、 像等 象的方法)可以 Pos Sc p, 可以 P F SPD (半生公司使用的真面 語言) , 然也可以 的任何 語言 只要 符合統 的接口 。
例 , 可以用 未描述文 模型是居次型的 ,可以完全 建立相 的 。執行 操作 就在 村中 增 介 刪除操作就刪掉相 執行 操作就 相 的 執行 操作就取出相 的 返回 軟 件 執行 操作 就 相 。
以下是 的 步說明
1. 未描述 。 也就是說, 都建立了 介 的X 。有的 比較 羊 其 的X 就只有 有的 比較 , 其 的 有子 。 休描述方法 可以 前面 未定 操作 象的說明。
2. 新建 介 就新建 介根錯 象的 X 文 件。
3. 在 中插 介 文字 就將
的 插 到插 位置的 ( ) 下。 中的 都在 的X 村中有 介 的 。 4. 刪除一介 , 就刪除 的 其下 所有子結 也都 刪除。 刪除 是 子結 下而上 的。
5. 介 將 的 的屬性
。 果核 是用子結 表示的 則 的子結 。
6. 介 , 坊間 的 , 的 和子 得 象的
7. 介 象的 , 返 的 路程。 8. 介 ( )到指定位置 , 就將 的 的 介子 都 到 位置 的 ( ) 下。 果 是 到另 介 中 則需要將核子 引用的 ( 嵌 ) 也 起 。
9.執行 版面信息指令 , 先生成 介指定位固格式的 自 , 其 寸和指定 相同, 然 指定 的所有版面 凡是 于指定 ( 括只有 部分在 ) 的版面 , 都 在版面上相 休 。 休 然比較 比較 並 但均屬 于現有 木 時, 不在此贅述。
安全
在 角 生成 吋隨和公私 (例 512 的RSA ) 將 存儲在角 中 將 返 軟件。
軟件 汞 隨和生成 決 128 ) , 相 角 中的公 軟件, 軟件 比較 果 則表明 軟件 有 角 的 成功。 力保 , 以 三次, 三次全部 才算 汞成功。
某一 時, 也就是 的 的子樹 。 了 名不受 休物理存儲方式的影 需要先做 介 則化 使得 上等 的 化 (例 存儲位置的改 相 指針的 化) 不 有效性。 則化的方法 下
深度 先 以 的子村中的各 ( g 及其各介子 ) 按照 順序依次 的 則結果 連接 未。
其中, 子 的某 則 果的方法力 先 的 子 的 S 然 再依次 及其各 性的 S 順序連接在 的子 的 值的 再 連接結果的 AS 得到 的 則結果。 果需要 子樹 的 引用的 也 起 , 則可以將 引用的 也作力 的 介子 未 , 方法同上。
則化以后 再做 S 角 的 的 可 現 有 木 里不再 。 在上述 則化 中 可以把 介 則結果的方法改成如 下方案 將 的子 、 及其各屬性用分隔 按照順 序連接 , 連接的結果的 S 得到 的 則 。 近可以把 介 則結果的方法改成 下方案 的子 . 及其各屬性的未 用分隔 按照順序連接 未 再 子予 、 、 各屬性 接 , 即得到 的 則結果。
介 則結果的方法可以 用以下各 方案申的任意
的某 其子 、 、 各 , 子 各 性 的未 (可 的) 或 特定 ( S 、 ) 按照預定 順序連接 未 (直接連接或用分隔
上述預定順序的意思是, 子 長度、 、 各 長度、 子 、 、各 可以 任意順序 , 只要是預定的順序即可。
另外, 在 子樹中各 既可以 深度 先 也可以 寬度 先 。
不 出上述方案的各 化方式 的子結 用分隔 按照深度 先的順序連接 未 再 各 其它 的 則 連接 未。 , 只要 核子樹中的所有錯 的子結 、 和各 按照 的方法排列在 起就 于本 的 化。
某 最 羊的 方式是 羊 各角 ( 其子 )的 在 各角 以比較, 符合 的則 相 操作 否則 返 。 更好的 方式是 相
未控制 果核角 沒有相 就沒有 的 方式 能力 更強。 休方案
a) 的數 通常 介子樹 及其所 有子 ) 有 吋 的P , 其中的 密密 。
b) 具有 的角 , 授予其解密密 , 角 可以用
, 而 。
C 具有 的 &, 將授予 密密 角 可以將修 改 的數 , 而可以 核四 的數 。
) 于 P 的 效率較低, 提高 行效率, 也可以 用 未 域 , 密密 于
, 密密 于 的 , 而 得 的 。 防止只有 的角 在 得 修改 可以用 密密 未 數字 每次 有 的角 修改 都重新做 次 , 而 不 沒有 的角 。
e) 授予某 角 密密 或 密密 可以用 角 的公 存儲 只有 有 角 的 才能取出 需要說明的是 本 明中所說明的 安全技木 于角 的 管理、 角 的 方式、 重角 、 的 則化技木、 度的 管理羊 、 于 密的 等 都不 這 于本 的 理 統, 可以 于更 的其它 吻合。
的管理
在本 明中, 了 本文 理 統 很好 紙張的特性, 提 供了一 只 不 的 木方案。 也就是說, 軟件都只在現有 文 內容 上添 新的 容 但不修改、 不刪除已有的 容 使 的 介 就 張 , 可以由不同的 用不同的 在紙上不 但雄都不能修改、 刪除已有 容。 休方法是每 介 軟件 在 其它軟件生成的 都在現有文 上新增 將本 軟件新 的 容都 到 , 不修改和刪除前面各 的 容。 的每 只由 介 軟件未管理和 , 其他 軟件 不能 編輯。 由于現有 就是 于紙張未 特的 因此只要 符合紙張的特性就能滿足現有座用的需求 各足 的 。
了 每 內容在生成 沒有被修改、 刪除, 可以利用每 的數字 數字 可以是 本居內容 , , 可以 是 本居以及本居 前生成的所有 的內容 起 。 以后 不妨 得 一步的 等 只要新的 容是位于新建的 沒有 修改 存在的各 , 依然是有效的, 但 者只 以 前的 容 責 不 以后的 容 責。 是 介非常符合 需求 的 木方案 具有很大的 。 相比 下 現有的其它 木或者 不允許 或者編輯 ( 是只 不改的 ) 。 前 木方案不 修改 中的已有 容 即使不考慮 紙張特 性的兼容以及數字 需要修改的 也只能做版面 編輯 即 版面 象的 ( 、 、 )都不 其它版面 戶生 ( 是由于通用文 模型是 于可凡部分力 的, 不包含大量不可 的、 于版面 象 間的 , 因此修改任何 介版面 , 其它版 面 不 戶生相 的 ,例 刪掉 介 ,就 在其位置留下 自, 右 的文字不合 左 ) 。 如果用戶需要 中的已有 容
, 且近希望能像在 未那 的 , 有 介 木方案可以很好 滿足 需求。 方案是 軟件完成 編輯 , 除了新建 存 前 的內容外 將 文件(按照 軟件 有的格式存儲 汞了各 象 同完整 的文件, 例 OC文件)嵌 到 中。 下次需要 編輯 , 中取出 文件, 使用 文件 編輯。編輯完成 清除 軟件 管理的那 ,重新生成 的 容, 將新修改的 文件嵌 到 中。
休方法 下
1 軟件第 次 , 新建 將新編輯 容 的 版面 插 到新建 同 身格式 份新 的內容 ( 文件) 。
2.在 中新建 介 子 , 嵌 文件 (例
的方式 休嵌 ) 汞是 文件 。 3 同 座 軟件再次 的 文件 中取出 的 文件。
4.使用 文件 編輯 內容。 由于 文件是 軟件自 的格式 可以按照 軟件 身的功能 鎳 容 。
5.再次編輯結束 新編輯 的 更新 內容 (例 全 部清除 全部重新生成的方式) 同 將新修改 的 重新嵌 到 中。
6. 此 往 , 就可以用原有座 軟件按照原有方式 中的 已有內容 編輯。
上述 木方案, 可以最大程度地 的 操作 。 在座 軟件、 都 用本 明技木 , 在有足 安全校 的前提下, 可以 以下功能
1. 任何 任何 軟件都可以 、 、 打印。
任何 , 任何 軟件都可以新添 任何內容, 而 不 已有 。
3 任何 , 在不必考慮 已有 (沒有 或者置有 但 )的前提下 任何 軟件都可以 已有內容 版 面 編輯。 4. 任何 使用文 已有 容的原始編輯軟件可以 容 常 。
由此可凡 通 本 明中 的管理, 的管理、 操作、 安 全 都 未 大的便利。
下面以A軟件 介 B軟件 編輯 例說明 工 作 。 在本 中 作力接口
. A軟件 指令 建文 c\sa pe ydocbase.sep 將 存 在 ocBase
O Ope ( c sa pe\ ydocba e.sep TR ocBase
2. A軟件 指令在 oc ase中新建 ,將 存放在 ocSe
h ocSe se ewOb(h ocBase b TYPE OC ET 在本 P, 中只有 介 , 即第 介
3. A軟件 指令在 。 ase中新建文 將 存 放在 c
h oc se ewOb h ocSe Ob TYPE OC) 在本 中, 只有 介 , 即第 介
4. A軟件 指令在 c中新建 頁 大小是 w , 將 存 在 age
Pagepage
Page.S Ze.W W
page.sze.
se c 及page hPage) 在本 中 中只有 頁 即
. A軟件 指令在 age 中 將 存 在 aye
h aye e ewOb hPag b TY E AY R 在本 , 只有 即第
6. A軟件 指令 s
O C aSze Cha Sze
chaSze. Wdh C aSze egh S
se aVe h Sze 在本 P, 的第 介版面 是
7. A軟件 指令在 x y 位置插 文字 半生意 O Tex ex
ex Tex p c e 半生意 )
ex.m E cod g Tex: E C DE GB13000
ex. Sa .x X
ex Sa .y y
O se ay 1 ex 在本 中 的第二 是文字 8. A軟件 指令 ocBase
O Co e( ocBase
g. B軟件 指令, c:\sampe ydocbase.ep 將 存 在1 ocBase
O pe c sa pe ydocba e.sep FA SE h ocBase
1 軟件 指令 o ase第一介 的 , 將 存放在 ocSe
O Ge a deh ocBase oc et)
1 . B軟件 指令 ocSe 第 介 的指針 將 存 在 oc
O Ge a de ocSe hDoc)
12. B軟件 指令 oc第 頁的指針,將 存 在 Page
Ge a deh oc Page)
13. B軟件 版面 于
O GePageB p(hPage ec b
14. B軟件 指令 hPage第 的指針 將 存放在 e
O Ge a dehPage h aye)
15. B軟件 指令 第 介版面 象的 hO
O Ge a de(h aye b
16. B軟件 指令 hO 的
O Ge bType b ype
17 B軟件 是 介
O Ge b b c aSze)
18. B軟件將 高放大 倍
c aSze eg 2
O Se b h b chaSze)
B軟件重新 版面 , 屏幕上的 半生意
成衣休 了
下面, 參照 10描述依照本 的 操作 統 行一操作的 介 。在 , 軟件 統 的接 (例 O 接 ) 的操作。 統可能 有不同 的不同型于, 但是 于 未說面向的都是同 介接口 , 因此都可以 配套 使用。 e ce OCR、 生成軟件、 軟件、 半生 、 O ce 、其他 等 O 接口指示 統 操 作 統可以有 在 中 統 1、 統 2和 統3, 統 O 未的統 指令 符合 通用文 模型的 操作 例 、 保存、 、 呈現 。 在 本 不同的 軟件可以同 或不同 同 介 統, 同 座 軟件可以同 或不同 不同的 統。
依照本 使得 和數 使得同 文 能在不 同的 軟件 間通用 使不同 軟件 同具有良好的 操作 。
依照本 形成 並分工, 減少 , 更 並、 各、 的基本操作都在 統中 , 各 軟件不必 。 而且由于 統是由 , 相夫 木的 並 、 各 、 較有保障, 而 軟件 和用戶可以 的最好的 家 統 而 效果的 和 致性。
依照本 提供多 甚至海量 的管理和制 使 間 有效 未, 便于 、 查詢、 保管, 便于嵌 較強的信息安全和 制。
依照本 , 提供更好的安全和制, 可以 角 度地 角 的 。 其中 是 重的, 方面可以 或 的 介細微 , 另 方面可以 非常 的 , 而不 是 統的 不可 。
依照本 鼓勵 新 合理 。 形成合理的 並分工 , 各 統 和各 軟件 就合在領域 而不 再出現 c osoH Wo「d 格式未 軟件的情形 。 各 統 也可以在 外增 新的功能以吸引用戶, 不合 新形成 。
依照本 便于 化性能, 有更好的可移植 和可伸縮性。 是 的性能 都可以遵循同 的 接 , 使得在不改 接 的情況下可以不 化性能, 移植到不同的平台。
以上所述 力本 的較佳 而已, 不用以限制本 凡 在本 的精神和原則 所作的任何修改、 等同替換和 等 包含在本 的保 固 。

Claims

要求
1、 神文 理方法, 其特 在于 方法包括
座用軟件向 統 符合通用文 模型的 操 作的 指令, 所述 指令 操作 統 的描述方式生成 統 指令 行文 操作。
2、 要求 1 所述的方法 其特 在于 所述 指令 步 硬件平台 的描述方式生成。
3、 要求 1 所述的方法 其特 在于 所述 指令 步 語言 的 方式生成。
4、 要求 1至 3任 項所述的方法 其特 在于, 所述 指令 符合通用 模型的 操作的字符 。
5、 要求 4 的方法 其特 在于 所述描述方式 可 語言X
6、 要求 1 所述的方法, 其特 在于 所述 指令中 的數值都 了數值未度和高低位順序。
7、 要求 1 的方法 其特 在于, 所述 指令 了參數 同的同 方式。
8、 要求 1 所述的方法 其特 在于 所述 指 令的方式 同 。
9、 要求 3所述的方法, 其特 在于, 所述 指令中 的數 字符、有 整型、 整型組成的 集合中
所述 指令有統 規定的 順序。
PCT/CN2006/003296 2005-12-05 2006-12-05 Procede de traitement documentaire WO2007065356A1 (fr)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP06828250A EP1965310A4 (en) 2005-12-05 2006-12-05 DOCUMENTARY PROCESSING METHOD
US12/133,280 US20080263333A1 (en) 2005-12-05 2008-06-04 Document processing method
US13/645,382 US20130031085A1 (en) 2005-12-05 2012-10-04 Docbase management system and implenting method thereof

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
CNB2005101266836A CN100547590C (zh) 2005-12-05 2005-12-05 文档处理系统
CN200510131073.5 2005-12-09
CN2005101310735A CN1979479B (zh) 2005-12-09 2005-12-09 文档处理系统和文档处理方法
CN200510126683.6 2006-12-05

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US12/133,280 Continuation-In-Part US20080263333A1 (en) 2005-12-05 2008-06-04 Document processing method

Publications (1)

Publication Number Publication Date
WO2007065356A1 true WO2007065356A1 (fr) 2007-06-14

Family

ID=38122485

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2006/003296 WO2007065356A1 (fr) 2005-12-05 2006-12-05 Procede de traitement documentaire

Country Status (3)

Country Link
US (1) US20080263333A1 (zh)
EP (1) EP1965310A4 (zh)
WO (1) WO2007065356A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109976764A (zh) * 2019-03-28 2019-07-05 深圳市创联时代科技有限公司 一种句柄转换方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007065357A1 (fr) * 2005-12-05 2007-06-14 Beijing Sursen Co., Ltd Système et procédé de traitement de documents
EP2069972A1 (en) 2006-09-12 2009-06-17 International Business Machines Corporation System and method for dynamic context-sensitive integration of content into a web portal application
US7814054B2 (en) * 2008-04-03 2010-10-12 Laurion James E System and method for providing common operators across multiple applications
US20100145955A1 (en) * 2008-12-10 2010-06-10 Solidfx Llc Method and system for virtually printing digital content to a searchable electronic database format
US9053085B2 (en) * 2012-12-10 2015-06-09 International Business Machines Corporation Electronic document source ingestion for natural language processing systems
US10585989B1 (en) 2018-09-07 2020-03-10 International Business Machines Corporation Machine-learning based detection and classification of personally identifiable information

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1488111A (zh) * 2001-01-19 2004-04-07 �����ɷ� 编辑与创建者软件应用无关的计算机生成的文档的系统和方法
US20050086584A1 (en) 2001-07-09 2005-04-21 Microsoft Corporation XSL transform
JP2005122398A (ja) * 2003-10-15 2005-05-12 Fujitsu Ltd 動的文書生成プログラム、その記録媒体、動的文書生成装置、及び動的文書生成方法

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5434962A (en) * 1990-09-07 1995-07-18 Fuji Xerox Co., Ltd. Method and system for automatically generating logical structures of electronic documents
US6006242A (en) * 1996-04-05 1999-12-21 Bankers Systems, Inc. Apparatus and method for dynamically creating a document
JP3915331B2 (ja) * 1999-08-10 2007-05-16 富士ゼロックス株式会社 共有ドキュメントの編集装置及び編集方法
US7043637B2 (en) * 2001-03-21 2006-05-09 Microsoft Corporation On-disk file format for a serverless distributed file system
US20030055871A1 (en) * 2001-07-31 2003-03-20 Javier Roses Document/poster composition and printing
US7203900B2 (en) * 2001-09-14 2007-04-10 Canon Kabushiki Kaisha Apparatus and method for inserting blank document pages in a print layout application
US20040205656A1 (en) * 2002-01-30 2004-10-14 Benefitnation Document rules data structure and method of document publication therefrom
US7035837B2 (en) * 2002-01-30 2006-04-25 Benefitnation Document component management and publishing system
US7532340B2 (en) * 2002-04-19 2009-05-12 Toshiba Tec Kabushiki Kaisha Document management system rule-based automation
US20040003248A1 (en) * 2002-06-26 2004-01-01 Microsoft Corporation Protection of web pages using digital signatures
JP2004252665A (ja) * 2003-02-19 2004-09-09 Canon Inc 文書処理方法
US7562215B2 (en) * 2003-05-21 2009-07-14 Hewlett-Packard Development Company, L.P. System and method for electronic document security
GB2405730A (en) * 2003-09-03 2005-03-09 Business Integrity Ltd Cross-reference generation
US20050216886A1 (en) * 2004-03-12 2005-09-29 Onfolio, Inc. Editing multi-layer documents
US7406599B1 (en) * 2004-04-06 2008-07-29 Adobe Systems Incorporated Indicating status for digital signatures
US8661332B2 (en) * 2004-04-30 2014-02-25 Microsoft Corporation Method and apparatus for document processing
US7797354B2 (en) * 2004-07-09 2010-09-14 Sap Ag Method and system for managing documents for software applications
US7672003B2 (en) * 2004-09-01 2010-03-02 Eric Morgan Dowling Network scanner for global document creation, transmission and management
US20070226204A1 (en) * 2004-12-23 2007-09-27 David Feldman Content-based user interface for document management
EP1965327A4 (en) * 2005-12-05 2015-11-11 Sursen Corp METHOD AND SYSTEM FOR DOCUMENT DATA SECURITY MANAGEMENT
WO2007065357A1 (fr) * 2005-12-05 2007-06-14 Beijing Sursen Co., Ltd Système et procédé de traitement de documents

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1488111A (zh) * 2001-01-19 2004-04-07 �����ɷ� 编辑与创建者软件应用无关的计算机生成的文档的系统和方法
US20050086584A1 (en) 2001-07-09 2005-04-21 Microsoft Corporation XSL transform
JP2005122398A (ja) * 2003-10-15 2005-05-12 Fujitsu Ltd 動的文書生成プログラム、その記録媒体、動的文書生成装置、及び動的文書生成方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP1965310A4 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109976764A (zh) * 2019-03-28 2019-07-05 深圳市创联时代科技有限公司 一种句柄转换方法

Also Published As

Publication number Publication date
US20080263333A1 (en) 2008-10-23
EP1965310A1 (en) 2008-09-03
EP1965310A4 (en) 2009-02-11

Similar Documents

Publication Publication Date Title
WO2007065355A1 (fr) Systeme et procede de traitement hierarchise de documents
WO2007065356A1 (fr) Procede de traitement documentaire
CA2424713C (en) Simultaneous multi-user document editing system
CN101561826B (zh) 基于节点粒度语义的在线非结构化文档共享协同方法及其应用
JP5807142B2 (ja) 表示システム及び管理装置
US6014668A (en) Document information management system and method of generating a human-computer interactive document sheet allowing relevant information retrieval from a remote site
CN101599011B (zh) 文档处理系统和方法
WO2007065354A1 (fr) Procede et systeme de gestion de la securite des donnees d&#39;un document
WO2007065353A1 (fr) Systeme et procede de traitement de documents
JP5530101B2 (ja) 文書処理システム及びその方法
JP2004259300A (ja) 文書情報管理システム
JP2005056039A (ja) 情報処理システムおよび方法、プログラム、並びに記録媒体
US11182745B2 (en) Data processing apparatus, data processing system, data processing method, and non-transitory computer readable medium
JP2003233525A (ja) ネットワークを利用した文書ファイル閲覧システム
JP3691628B2 (ja) 文書情報管理システム
JP2004199406A (ja) 情報表示処理方法、情報表示処理システム、クライアント端末、管理サーバ、プログラム
JP2005056041A (ja) 情報処理装置および方法、プログラム、並びに記録媒体
TWI283374B (en) Font providing system, font switching system, character retrieval system, font managing server, and client thereof, font providing method, font switching method, character code converting method, character retrieving method and program therefor
CN107066437B (zh) 数字作品标注的方法及装置
JPH1125077A (ja) 文書管理装置及びシステム及び方法
Naffah Multimedia applications
KR20210093621A (ko) 템플릿기반 웹(sns)컨텐츠 pdf 출판시스템
JP2008059528A (ja) 携帯メール用装飾素材の作成装置及びこれを備えた携帯メール用装飾素材の配信システム
CN102043821B (zh) 一种显示文档的方法
JP2005056042A (ja) 情報処理装置および方法、プログラム、並びに記録媒体

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application
NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2006828250

Country of ref document: EP

WWP Wipo information: published in national office

Ref document number: 2006828250

Country of ref document: EP