WO2012174971A1 - 信息摘录方法及基于云计算的摘录信息网络存储管理系统 - Google Patents

信息摘录方法及基于云计算的摘录信息网络存储管理系统 Download PDF

Info

Publication number
WO2012174971A1
WO2012174971A1 PCT/CN2012/076041 CN2012076041W WO2012174971A1 WO 2012174971 A1 WO2012174971 A1 WO 2012174971A1 CN 2012076041 W CN2012076041 W CN 2012076041W WO 2012174971 A1 WO2012174971 A1 WO 2012174971A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
module
content
excerpt
multimedia
Prior art date
Application number
PCT/CN2012/076041
Other languages
English (en)
French (fr)
Inventor
匡晓明
Original Assignee
Kuang Xiaoming
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kuang Xiaoming filed Critical Kuang Xiaoming
Publication of WO2012174971A1 publication Critical patent/WO2012174971A1/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/60Subscription-based services using application servers or record carriers, e.g. SIM application toolkits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/48Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually

Definitions

  • the invention relates to information excerpt, information storage and information management technology, and particularly relates to an information excerpting method and a cloud computing-based excerpt information network storage management system.
  • the current method of extracting and entering information is mainly to save the entire webpage or web address, or to enter the original way of copying and copying, or to manually type and input according to the content of the webpage, and it is necessary to extract and save multimedia (picture, audio, video, etc.).
  • multimedia picture, audio, video, etc.
  • Use specialized software Users are not only extremely cumbersome when saving, but also difficult to accurately select the information they want to save.
  • There is no suitable method for extracting and inputting offline information such as paper media. It can only be manually cut and pasted, or manually scanned, which is time consuming and laborious, and difficult to retrieve and save.
  • the network hard disk storage management method solves some of the disadvantages of the above information storage, but the input means are limited, and the ease of use is poor. It is simply a simple stacking of information, no effective classification and association of information, and no analysis of text and multimedia information. Extraction, which makes it difficult to retrieve and query.
  • Cloud computing is a new concept that has emerged in recent years. The goal is to simplify computing and storage into resources that are as easy to use as public water and electricity. Users can easily use it by simply connecting to the network.
  • Narrow cloud computing refers to the delivery and usage patterns of IT infrastructure, and the required resources are obtained through the network in an on-demand and scalable manner;
  • Generalized cloud computing refers to the delivery and use of services, which means that the required services are obtained on the network in an on-demand and easily scalable manner.
  • This service can be IT and software, Internet related, or other services.
  • Cloud computing transfers most of the computations of digital terminals from the terminal to the server, thereby weakening the hardware requirements for digital terminals and further enriching the use of terminals.
  • one of the objects of the present invention is to provide an information excerpting method, which realizes information classification and storage of complex web pages, is convenient to use, and saves time and effort.
  • An information extracting method comprising the following steps:
  • the user selects the list information to be saved in the multimedia list, the list information including the first text content and/or the first multimedia content;
  • step A1 is preceded by the step A1: the user activates the selection tool module, and the selection tool module includes a webpage information area selection module and an offline information excerpt module;
  • step A If the user selects the webpage information area selection module, then to step A;
  • step A2 includes: the user inputs the feature code of the offline information, and the cloud server uses the signature code from the data database (including the cloud server) Retrieving the complete content information corresponding to the feature code in the database, the offline media network database, etc., and storing the complete content information to the cloud server;
  • the feature code includes an ISSN number of the magazine, a page number, a location, an ISBN number of the book, a page number, a bar code of the article, and the like;
  • the complete content information includes second text content and/or second multimedia content; the list information and the complete content information are recorded as excerpt information.
  • the step C further includes: the user editing the list information to be saved in the multimedia list, where the editing includes the first text content and/or the first plurality of the list information respectively.
  • the subject matter is added to the media content, and the subjective storage factors include reasons for saving, purpose of saving, notes, tags, keywords, and the like.
  • a second object of the present invention is to provide a cloud computing-based excerpt information network storage management system, which realizes storage, effective management and rational utilization after information extraction and entry.
  • a cloud computing-based excerpt information network storage management system includes a user end and a cloud server; the user end includes an information excerpt uploading device and an information reproducing device; and the user end may be a digital terminal such as an electronic computer, a mobile phone, or a PDA .
  • the information excerpt uploading device includes a selection tool module, an analysis module, an editing module, and an uploading module;
  • the selection tool module includes a webpage information area selection module, and the webpage information area selection module: an area for the user to select information to be saved in the webpage;
  • the analyzing module traverses the source code of the information content of the selected area of the user, filters out the multimedia label appearing in the source code, and extracts the first multimedia content corresponding to the link address in the multimedia label to obtain the separated first text.
  • Content and first multimedia content and forming a multimedia list, said The media list includes a first text content list and a first multimedia content list;
  • the editing module is configured to select, in the multimedia list, list information that needs to be saved, where the list information includes the first text content and/or the first multimedia content;
  • the uploading module is configured to upload and store the inventory information to the cloud server
  • the cloud server includes a storage module, an acquisition module, and a finishing module;
  • the storage module is configured to save the excerpt information uploaded by the user, where the excerpt information includes the list information;
  • the collecting module is configured to: obtain first content content of the inventory information, first objective storage factors corresponding to the first multimedia content, and/or subjective storage factors, where the first objective storage factor includes a source IP address, a uploading device , the source RSS address, the uploaded geographic location, the upload time, the data format data, the subjective storage factors include preservation reasons, preservation purposes, notes, tags, keywords;
  • the collating module classifying the inventory information according to the first text content of the manifest information, the first objective storage factor corresponding to the first multimedia content, and/or the subjective storage factor, and creating a classification database, where the classification database Each record corresponds to corresponding inventory information and a first objective storage factor and/or a subjective storage factor corresponding to the list information, the classification database being stored in the storage module;
  • the information reproducing apparatus includes a display module and a query module.
  • the query module performs a search according to a first objective storage factor and/or a subjective storage factor of the classification database, and outputs a search result to the display module;
  • the display module selects the required list information in the storage module according to the retrieval result, and displays the corresponding first text content and/or the first multimedia content.
  • the editing module of the information excerpt uploading device is further configured to: edit the list information to be saved in the multimedia list, where the editing includes the first text content and/or the A multimedia content adds subjective storage factors.
  • the selection tool module of the information excerpt uploading device further includes an offline information excerpt module;
  • the offline information excerpt module a feature code for inputting offline information, where the signature code includes an ISSN number, a page number, a location of the magazine, an ISBN number of the book, a page number, a barcode of the item, and the like;
  • the cloud server further includes a comparison module, where the comparison module is configured to retrieve complete content information corresponding to the feature code from the data database (including the cloud server database, the offline media network database, etc.) according to the feature code, and the complete content information is complete
  • the content information is stored in a storage module of the cloud server, the complete content information includes second text content and/or second multimedia content; and the excerpt information further includes complete content information;
  • the collection module of the cloud server is further configured to: acquire second text content of the complete content information and/or second objective storage factor and/or subjective storage factor corresponding to the second multimedia content, the second objective storage factor Including data such as uploading device, uploaded geographic location, upload time, data format, signature, etc.;
  • the collating module is further configured to classify the complete content information according to the second text content of the complete content information and/or the subjective storage factor corresponding to the second multimedia content and/or the second objective storage factor, and add to the a classification database, each record in the classification database further corresponding to corresponding complete content information and subjective storage factors and/or second objective storage factors corresponding to the complete content information;
  • the query module of the information reproducing apparatus is further configured to perform a retrieval according to a second objective storage factor and/or a subjective storage factor of the classification database, and output a retrieval result to the display module;
  • the display module of the information reproducing apparatus is further configured to: read the complete content information required in the storage module according to the retrieval result, and display the corresponding second text content and/or the second multimedia content.
  • the information reproduction apparatus further includes a modification module, the modification module is configured to re-edit the excerpt information, and the re-editing includes deleting the excerpt information.
  • Interest rate modify subjective storage factors, add subjective storage factors, etc.
  • the invention has the beneficial effects that: the user can automatically extract the classified information on the complex webpage, distinguish the text, picture, audio, video and other multimedia files and classify and upload using the information extracting and uploading device provided by the present invention, thereby greatly improving the extracting efficiency.
  • the user can use the information reproducing device provided by the invention to perfectly realize the overall reproduction of the uploaded webpage; the user can input the feature code of the offline media, and the system obtains the complete information content through the comparison between the database and the network, and classifies and stores; the user can utilize
  • the automatic sorting and sorting function provided by the invention makes more reasonable and effective use of the excerpt information for the recommendation of the associated information. Since the excerpt information is stored in the cloud server, the information is properly saved and managed.
  • the storage of information on the cloud server is not only conducive to long-term preservation, but also facilitates the cloud server to classify, organize, and correlate all the saved information, and create a related classification database.
  • the creation of such a classification database greatly facilitates the user. Effective management and utilization of excerpted information.
  • FIG. 1 is a flowchart of an information excerpt method according to an embodiment of the present invention
  • FIG. 2 is a structural connection block diagram of a cloud computing-based excerpt information network storage management system according to an embodiment of the present invention.
  • an information excerpt method includes the following steps:
  • Step 101 The sensing module senses the user's excerpting action, the excerpting action may be a specific moving direction, and the selection tool module is activated by the user, and the selection tool module includes a webpage information area selection module and an offline information excerpting module;
  • step 101A If the user selects the webpage information area selection module, then step 101A;
  • Step 101A The user selects an area of the webpage that needs to be saved, and proceeds to step 101B.
  • Step 101B Extract the analysis module of the information uploading device, analyze the user to save the information content, retrieve and identify the key code, and automatically classify according to the text data, the picture data, the image data, the audio data, etc., and the working principle is: traversing the selected area of the user The source code of the information content, filtering out the multimedia tag appearing in the source code, extracting the first multimedia content corresponding to the link address in the multimedia tag, and obtaining the separated first text content and the first multimedia content, And forming a multimedia list, the multimedia list includes a first text content list, a first multimedia content list, and proceeds to step 101C.
  • Step 101C The user may select, in the multimedia list, the list information to be saved according to the needs of the user, the list information includes the first text content and/or the first multimedia content.
  • the user may also edit the list information in the multimedia list, the editing includes adding a subjective storage factor to the first text content of the list information and/or the first multimedia content, and the subjective storage factor may be saving One or more combinations of reasons, save destinations, notes, tags, keywords, etc., for example, the user may add a reason for saving or a reason for saving and a purpose of saving for an audio data in the first multimedia content. Go to step 101D.
  • Step 101D After the user confirms, upload and store the inventory information to the cloud server.
  • the list information belongs to the required excerpt information.
  • Step 102A After inputting the feature code of the offline information through the offline information excerpt module, the user proceeds to step 102B.
  • Step 102B The comparison module of the cloud server retrieves the complete content information corresponding to the feature code from the data database (including the cloud server database, the offline media network database, and the like) according to the feature code, and stores the complete content information to the cloud server;
  • the feature code may be an ISSN number of the magazine, a page number, a location, an ISBN number of the book, a page number, a barcode of the item, etc.;
  • the complete content information includes the second text content and/or the second multimedia content;
  • the content information also belongs to the required excerpt information.
  • the comparison module of the cloud server searches in the data database according to the ISSN number, and obtains the magazine content (ie, the complete content information) corresponding to the ISSN number, and the magazine content may be
  • the text data format which may also be a multimedia data format, may also be a combination of a text data format and a multimedia data format.
  • Step 102C The comparison module automatically stores the complete content information to the storage module of the cloud server.
  • a cloud computing-based excerpt information network storage management system uses the above information excerpt method.
  • the structure setting, structure connection relationship, and information flow process are as follows:
  • the system includes a client end and a cloud server 3;
  • the user terminal includes an information excerpt uploading device 1 and an information reproducing device 2; the user terminal may be a digital terminal such as an electronic computer, a mobile phone, or a PDA.
  • the information extracting and uploading device 1 includes an automatic sensing module 11, a selection tool module 12, an analysis module 14, an editing module 15, and an uploading module 16.
  • the automatic sensing module 11 is configured to sense an excerpt action of the user on the webpage, and activate the selection tool module 12.
  • the selection tool module 12 includes a webpage information area selection module 13 and an offline information excerpt module.
  • the webpage information area selection module 13 an area for the user to select information to be saved in the webpage.
  • the analyzing module 14 traverses the source code of the information content of the selected area of the user, filters out the multimedia tag that appears in the source code, and extracts the first multimedia content corresponding to the link address in the multimedia tag to obtain the first separated content.
  • the text content is combined with the first multimedia content and forms a multimedia list, and the multimedia list includes a first text content list and a first multimedia content list.
  • the editing module 15 is configured to select, in the multimedia list, list information that needs to be saved, where the clearing The single information includes the first text content and/or the first multimedia content; and is further used by the user to edit the list information that needs to be saved in the multimedia list, the editing including the first text content of the list information and/or the first multimedia
  • the subjective storage factor is added to the volume content, and the subjective storage factor includes one or more combinations of saving reasons, saving purposes, notes, tags, keywords, etc.; and is also used for filtering invalid information, adding invalid information to the multimedia list and performing
  • the invalid information includes ultra-small pictures (such as pictures with a resolution lower than 10*10 pixels), invalid link addresses, etc., and the user may also select the filtered invalid information in the multimedia list.
  • the uploading module 16 is used for uploading and storing the inventory information to the cloud server.
  • the offline information excerpt module 17 a feature code for inputting offline information, the signature code including an ISSN number, a page number, a location of the magazine, an ISBN number of the book, a page number, a barcode of the item, and the like;
  • the cloud server 3 includes a storage module 31, an acquisition module 34, a sorting module 36, a processing module 33, a comparison module 32, and a background processing module 35.
  • the storage module 31 is configured to save the excerpt information uploaded by the user, where the excerpt information includes the manifest information and the complete content information; and is further configured to save the classification database created by the collation module 36.
  • the acquiring module 34 is configured to: acquire first text content of the manifest information and/or first objective storage factor and/or subjective storage factor corresponding to the first multimedia content; and second text for acquiring complete content information a second objective storage factor and/or a subjective storage factor corresponding to the content and/or the second multimedia content;
  • the first objective storage factor includes a source IP address, a uploading device, a source RSS address, a uploaded geographic location, and an uploading time Data of the data format, etc.
  • the second objective storage factor includes data of the uploading device, the uploaded geographic location, the uploading time, the data format, the feature code, and the like;
  • the comparison module 32 is configured to retrieve complete content information corresponding to the feature code from the data database (including the cloud server database, the offline media network database, etc.) according to the feature code input by the user, and store the complete content information in the cloud.
  • a storage module of the server the complete content information including second text content and/or second multimedia content.
  • the collating module 36 classify the inventory information according to the first text content of the manifest information and/or the first objective storage factor and/or the subjective storage factor corresponding to the first multimedia content, and create a classification database, the classification Each record in the database corresponds to corresponding inventory information and a first objective storage factor and/or subjective storage factor corresponding to the list information, the classification database is stored to the storage module; and the second text is further used according to the complete content information.
  • the content and/or the subjective storage factor corresponding to the second multimedia content and/or the second objective storage factor classify the complete content information, and add to the classification database, each record in the classification database also corresponding to the corresponding Complete content information and subjective storage factors and/or second objective storage factors corresponding to the complete content information; the first objective storage factor, the subjective storage factor, and the second objective storage factor may be unified into storage factors, and the classification database pairs have the same Excerpt information of storage factors, correlate and sort.
  • the processing module 33 invokes the OCR technology to textize the first multimedia content in the storage module and the image data in the second multimedia content, that is, the image data is converted into text data.
  • the background processing module 35 is configured to: search for the same excerpt information uploaded by different users, and delete redundant excerpt information; and track the update of the excerpt information according to the storage factor of the excerpt information, and recommend the updated excerpt information to the user. ; Used to recommend other relevant information that may be useful to the user.
  • the information reproducing apparatus 2 includes a display module 21, a query module 22, a modification module 23, and a sharing module 24.
  • the query module 22 performs a search according to a storage factor of the classification database, and outputs a search result to the display module;
  • the modifying module 23 re-editing the excerpt information, the re-editing includes deleting the excerpt information in the storage module (the corresponding record in the classification database is also deleted), modifying the subjective in the classification database
  • the storage factor (the subjective storage factor corresponding to the excerpt information also automatically changes accordingly), the subjective storage factor in the classification database is added (the subjective storage factor corresponding to the excerpt information is also automatically changed accordingly) and the like.
  • the user modifies the purpose of saving a record in the classification database, and the content of the original save purpose corresponding to the save destination is also changed.
  • the sharing module 24 for forwarding or sharing the excerpt information to the target object user.
  • the specific manifestation of the system may be a computer software program, which is described in detail by way of example.
  • the source of information to be extracted by the system may be pictures, animations, movies, audio, texts or other forms of content on a webpage or other network source, or articles or pictures in a magazine, or a chapter in a book. Paragraph, or other form of information.
  • the working method of the information excerpt uploading device of the system can be expressed as a browser plug-in (which can also be a computer program, a web interface, a mobile phone software, other digital terminal applications, etc.). After selecting the content to be excerpted on the webpage, it can be automatically started. It can intelligently analyze and extract different types of information, and automatically generate tags and keywords.
  • the plug-in can be effective in web pages of any complicated structure. In order to support excerpts in web pages with complex structures, the system does not use the traditional method of embedding front-end DHTML code in a single page, but enhances the execution level of the code and analyzes the multiple documents between the complex structure web pages.
  • the complex includes the display relationship, and through the high-level cross-document method call way to complete the transfer of the parameter information related to the excerpt action, and finally complete the correct display and save action of the excerpt interface.
  • the plug-in includes the following modules: 1) The auto-sensing module senses that the user wants to extract information actions and areas. When the user selects the part to be collected with the mouse (can include pictures, text, video, audio, etc.), the plug-in is activated. The collection selection toolbar appears on the web page; 2) The analysis module analyzes the user's intention to save the information content, extracts keywords, recognizes and automatically classifies according to text data, picture data, image data, audio data, and the like. It works by traversing the contents of the selected area and filtering out the media that appears between them.
  • Label extract the link address of the media content, obtain the separated text and media content, and form a media list for the user to check;
  • filter the editing module can automatically filter the useless information such as ultra-small pictures, the user can also filter out as needed
  • the information is restored, the user selects or edits the information to be saved, and the subjective factors such as the reason and purpose of the information collection may be selected, and the remarks and additional keywords may be written;
  • the uploading module will first extract the information extracted by the user and other related information. Features are saved to a separate storage space outside of the browser's document and then uploaded and stored to the cloud server at once.
  • the feature code of the offline information can be input through the plug-in, and the cloud server retrieves the corresponding complete content from the relevant database (including the server database, the offline media network database, and other databases) according to the signature, and automatically storage. Users can also edit and other related content.
  • Each piece of excerpt information corresponds to a favorite record on the server side, and multiple transferred multimedia (picture, audio, video, etc.).
  • the fields of the excerpt record include: time when the upload occurred, location, IP address, upload device, content of the message, note, importance, reason and purpose of the excerpt, title of the original information page, keyword, RSS address, tag, information
  • the OCR information of the included image Based on the objective factors and the subjective factors provided by the user, the server comprehensively classifies all uploaded information and generates a related classification database.
  • the information reproducing device is also a browser plug-in, which can be integrated in the information excerpt uploading device, or can be independent of the information excerpt uploading device, and the information can be used in the current device, and the user can conveniently use the sorted excerpt information, including querying and editing. , forwarding, browsing, sharing, and more.
  • the information reproducing apparatus comprises: 1) a display module, and the excerpt information is presented in a separate, scalable window in an arrangement substantially identical to the original source of the excerpt. 2) Query module, the user can see the information classified according to the cause and destination, or search according to the time, location, label, keyword, expression, number of visits and other elements. 3) Editing module, the user can further edit, delete, write and annotate the excerpt information, establish a new relationship between the information, and change the visibility of the information. 4) Forward the sharing module, use The user can conveniently forward or share the excerpt information to the target object.
  • offline information excerpt function of the system can also be independent, and is not attached to the information extracting and uploading device.
  • the classification database proposed by the present invention has the same working process as the prior art, and those skilled in the art are aware of the working principle. Therefore, the working process of the database will not be described in the present invention.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明涉及一种信息摘录方法,其通过过滤复杂网页的源代码中出现的多媒体标签,对多媒体标签中的链接地址对应的第一多媒体内容进行提取,得到分离的第一文本内容与第一多媒体内容;本发明还涉及一种基于云计算的摘录信息网络存储管理系统,其通过对复杂网页的信息摘录、对线下媒体特征的网络对比、对摘录信息进行后台关联分类并创建相关分类数据库,实现了分类提取复杂网页上的信息,极大的提高了摘录效率,能够方便的摘录保存线下媒体信息,分类数据库的创建,极大的方便了用户对摘录信息的有效管理及利用。

Description

说 明 书 信息摘录方法及基于云计算的摘录信息网络存储管理系统
技术领域
本发明涉及信息摘录、 信息存储、 信息管理技术, 具体涉及一种信息摘录 方法及基于云计算的摘录信息网络存储管理系统。
背景技术
当前信息摘取和录入的方式主要是保存整体网页或网址, 或者通过粘贴复 制的原始方式录入, 或者根据网页内容手工打字输入, 对多媒体(图片、 音频、 视频等) 的提取和保存更是需要使用专门软件进行。 用户不仅在保存时极度繁 瑣, 而且很难准确选择想要保存的信息。 对于纸质媒体等线下信息的摘取和录 入更是没有合适的方法, 只能通过手工剪切后粘贴成本, 或者手工扫描, 费时 费力, 还难以检索和保存。
当前信息存储管理的方式主要是本地存储管理和网络硬盘存储管理。 采取 本地信息存储管理方式时, 信息保存在本地信息终端上, 随着信息的不断增加, 对信息终端的要求会越来越高, 本地设备的硬件和软件条件以及用户本身的熟 练程度也限制了对信息的分析和管理能力, 同时还不能实现信息在不同的数字 终端上的及时流转, 而本地终端的物理损坏还^艮可能导致信息的丟失。 网络硬 盘存储管理方式解决了上述信息存储的一些弊端, 但录入手段受局限, 易用性 差, 只是对信息的简单堆砌, 没有对信息进行有效的分类和关联, 不能对文本 和多媒体信息进行分析和提取, 导致难以检索和查询。
云计算是近年来兴起的新理念, 目标是将计算和存储简化为像公共的水和 电一样易用的资源, 用户只要连上网络即可方便地使用。 其中狭义云计算指 IT 基础设施的交付和使用模式, 通过网络以按需、 易扩展的方式获得所需资源; 广义云计算指服务的交付和使用模式, 指通过网络以按需、 易扩展的方式获得 所需服务。 这种服务可以是 IT和软件、 互联网相关, 也可是其他服务。 云计算 将数字终端实现功能时的大部分计算从终端转移到服务器端, 从而弱化对数字 终端的硬件要求, 并进一步丰富终端的运用。
发明内容
为了克服现有技术的不足, 本发明的目的之一, 提出了一种信息摘录方法, 实现了对复杂网页的信息分类保存, 使用方便, 省时省力。
为了达到目的之一, 本发明所采用的技术方案如下:
一种信息摘录方法, 其包括以下步骤:
A.用户选择网页中需要保存的信息的区域;
B .遍历用户选中区域的信息内容的源代码,过滤出源代码中出现的多媒体标 签, 对多媒体标签中的链接地址对应的第一多媒体内容进行提取, 得到分离的 第一文本内容与第一多媒体内容, 并形成多媒体列表, 所述多媒体列表包括第 一文本内容清单、 第一多媒体内容清单;
C.用户在多媒体列表中选择需要保存的清单信息,所述清单信息包括第一文 本内容和 /或第一多媒体内容;
D.将清单信息上传并存储至云端服务器。
为了方便纸质媒体等线下信息的摘取和录入,所述步骤 A之前还有步骤 A1: 用户激活选择工具模块, 所述选择工具模块包括网页信息区域选择模块、 线下 信息摘录模块;
若用户选择网页信息区域选择模块, 则至步骤 A;
若用户选择线下信息摘录模块, 则至步骤 A2, 所述步骤 A2包括: 用户输 入线下信息的特征码, 云端服务器梠据特征码从资料数据库(包括云端服务器 数据库、 线下媒体网络数据库等) 中检索与特征码相应的完整内容信息, 将完 整内容信息存储至云端服务器;
所述特征码包括杂志的 ISSN号、 页码、 位置, 书籍的 ISBN号、 页码, 物 品的条码等;
所述完整内容信息包括第二文本内容和 /或第二多媒体内容;所述清单信息、 完整内容信息记为摘录信息。
为了方便云端服务器对摘录信息的分类管理, 所述步骤 C中, 还包括: 用 户编辑多媒体列表中需要保存的清单信息, 所述编辑包括分别对清单信息的第 一文本内容和 /或第一多媒体内容添加主观存储因素, 所述主观存储因素包括保 存原因、 保存目的、 备注、 标签、 关键字等。
本发明的目的之二, 还提出了一种基于云计算的摘录信息网络存储管理系 统, 实现信息的摘取和录入后的存储、 有效管理及合理利用。
为了达到目的之二, 本发明所采用的技术方案如下:
一种基于云计算的摘录信息网络存储管理系统, 包括用户端及云端服务器; 所述用户端包括信息摘录上传装置及信息再现装置; 所述用户端可为电子计算 机、 移动电话、 PDA等数字终端。
所述信息摘录上传装置包括选择工具模块、 分析模块、 编辑模块、 上传模 块;
所述选择工具模块包括网页信息区域选择模块, 所述网页信息区域选择模 块: 用于用户选择网页中需要保存的信息的区域;
所述分析模块: 遍历用户选中区域的信息内容的源代码, 过滤出源代码中 出现的多媒体标签, 对多媒体标签中的链接地址对应的第一多媒体内容进行提 取, 得到分离的第一文本内容与第一多媒体内容, 并形成多媒体列表, 所述多 媒体列表包括第一文本内容清单、 第一多媒体内容清单;
所述编辑模块: 用于在多媒体列表中选择需要保存的清单信息, 所述清单 信息包括第一文本内容和 /或第一多媒体内容;
所述上传模块: 用于将清单信息上传并存储至云端服务器;
所述云端服务器包括存储模块、 采集模块、 整理模块;
所述存储模块: 用于保存用户上传的摘录信息, 所述摘录信息包括清单信 息;
所述采集模块: 用于获取清单信息的第一文本内容、 第一多媒体内容对应 的第一客观存储因素和 /或主观存储因素,所述第一客观存储因素包括来源 IP地 址、 上传设备、 来源 RSS地址、 上传的地理位置、 上传时间、 数据格式的数据, 所述主观存储因素包括保存原因、 保存目的、 备注、 标签、 关键字;
所述整理模块: 根据清单信息的第一文本内容、 第一多媒体内容对应的第 一客观存储因素和 /或主观存储因素, 对清单信息进行分类并创建分类数据库, 所述分类数据库中的每一条记录对应相应的清单信息及与该清单信息相应的第 一客观存储因素和 /或主观存储因素, 所述分类数据库存储于存储模块;
所述信息再现装置包括显示模块、 查询模块,
所述查询模块: 根据分类数据库的第一客观存储因素和 /或主观存储因素进 行检索, 并向显示模块输出检索结果;
所述显示模块: 根据检索结果, 选择存储模块中所需的清单信息, 并展示 相应的第一文本内容和 /或第一多媒体内容。
为了方便云端服务器对摘录信息的分类管理, 所述信息摘录上传装置的编 辑模块还用于: 编辑多媒体列表中需要保存的清单信息, 所述编辑包括对清单 信息的第一文本内容和 /或第一多媒体内容添加主观存储因素。 为了方便纸质媒体等线下信息的摘取和录入, 所述信息摘录上传装置的选 择工具模块还包括线下信息摘录模块;
所述线下信息摘录模块: 用于输入线下信息的特征码, 所述特征码包括杂 志的 ISSN号、 页码、 位置, 书籍的 ISBN号、 页码, 物品的条码等;
所述云端服务器还包括比对模块, 所述比对模块: 用于根据特征码从资料 数据库(包括云端服务器数据库、 线下媒体网络数据库等) 中检索与特征码相 应的完整内容信息, 将完整内容信息存储至云端服务器的存储模块, 所述完整 内容信息包括第二文本内容和 /或第二多媒体内容; 所述摘录信息还包括完整内 容信息;
所述云端服务器的采集模块: 还用于获取完整内容信息的第二文本内容和 / 或第二多媒体内容对应的第二客观存储因素和 /或主观存储因素, 所述第二客观 存储因素包括上传设备、 上传的地理位置、 上传时间、 数据格式、 特征码等的 数据;
所述整理模块: 还用于根据完整内容信息的第二文本内容和 /或第二多媒体 内容对应的主观存储因素和 /或第二客观存储因素, 对完整内容信息进行分类, 并添加至分类数据库, 所述分类数据库中的每一条记录还对应相应的完整内容 信息及与该完整内容信息相应的主观存储因素和 /或第二客观存储因素;
所述信息再现装置的查询模块: 还用于根据分类数据库的第二客观存储因 素和 /或主观存储因素进行检索, 并向显示模块输出检索结果;
所述信息再现装置的显示模块: 还用于根据检索结果, 读取存储模块中所 需的完整内容信息, 并展示相应的第二文本内容和 /或第二多媒体内容。
为了云端服务器对摘录信息的分类管理, 所述信息再现装置还包括修改模 块, 所述修改模块: 用于对摘录信息进行再编辑, 所述再编辑包括删除摘录信 息, 修改主观存储因素, 添加主观存储因素等。
本发明的有益效果在于: 用户可以使用本发明提供的信息摘录上传装置, 自动提取复杂网页上的分类信息, 区分文字、 图片、 音频、 视频等多媒体文件 并分类上传, 极大的提高了摘录效率; 用户可以使用本发明提供的信息再现装 置, 完美实现上传网页的整体重现; 用户可以输入线下媒体的特征码, 系统经 数据库和网络对比后获取完整信息内容, 并分类存储; 用户可以利用本发明提 供的自动分类整理功能, 对相关联信息的推荐, 更合理更有效的利用摘录信息。 由于摘录信息保存在云端服务器内, 信息得到了妥善的保存和管理。 用户不仅 不用随身携带信息, 而且可以通过不同的信息终端利用相关信息。 信息在云端 服务器上的存储不仅有利于长期保存, 而且有利于云端服务器对所有保存的信 息进行分类、 整理、 关联, 并创建相关分类数据库, 这种分类数据库的创建, 极大的方便了用户对摘录信息的有效管理及利用。
附图说明
图 1为本发明实施例的信息摘录方法的流程图;
图 2为本发明实施例的基于云计算的摘录信息网络存储管理系统的结构连 接方框图。
具体实施方式
如图 1所示, 一种信息摘录方法, 其包括以下步骤:
步骤 101: 感应模块感应用户的摘录动作, 所述摘录动作可以是一特定的移 动方向等, 选择工具模块被用户激活, 所述选择工具模块包括网页信息区域选 择模块、 线下信息摘录模块;
若用户选择网页信息区域选择模块, 则至步骤 101A;
若用户选择线下信息摘录模块, 则至步骤 102A。 步骤 101A: 用户选择网页中需要保存的信息的区域, 转至步骤 101B。 步骤 101B: 摘录信息上传装置的分析模块, 分析用户拟保存信息内容, 检 索并识别关键代码, 并按文本数据、 图片数据、 影像数据、 音频数据等自动分 类, 其工作原理为, 遍历用户选中区域的信息内容的源代码, 过滤出源代码中 出现的多媒体标签, 对多媒体标签中的链接地址对应的第一多媒体内容进行提 取, 得到分离的第一文本内容与第一多媒体内容, 并形成多媒体列表, 所述多 媒体列表包括第一文本内容清单、 第一多媒体内容清单, 转至步骤 101C。
步骤 101C: 用户可在多媒体列表中, 根据自己的需要, 选择需要保存的清 单信息, 所述清单信息包括第一文本内容和 /或第一多媒体内容; 为了方便云端 服务器对摘录信息的分类管理, 用户还可以对多媒体列表中的清单信息进行编 辑, 所述编辑包括可对清单信息的第一文本内容和 /或第一多媒体内容添加主观 存储因素, 所述主观存储因素可以是保存原因、 保存目的、 备注、 标签、 关键 字等中的一项或多项组合, 例如, 用户可对第一多媒体内容中的某个音频数据 添加保存原因或者保存原因和保存目的的标注, 转至步骤 101D。
步骤 101D: 用户确认后, 将清单信息上传并存储至云端服务器。 所述清单 信息属于所需的摘录信息。
步骤 102A: 用户通过线下信息摘录模块输入线下信息的特征码后, 转至步 骤 102B。
步骤 102B: 云端服务器的比对模块根据特征码从资料数据库(包括云端服 务器数据库、 线下媒体网络数据库等) 中检索与特征码相应的完整内容信息, 将完整内容信息存储至云端服务器; 所述特征码可以是杂志的 ISSN号、 页码、 位置, 书籍的 ISBN号、 页码, 物品的条码等; 所述完整内容信息包括第二文本 内容和 /或第二多媒体内容; 当然, 所述完整内容信息也属于所需的摘录信息。 例如,用户输入杂志的 ISSN号后, 云端服务器的比对模块根据该 ISSN号, 在资料数据库内进行检索, 得到与该 ISSN号相对应的杂志内容(即完整内容信 息), 该杂志内容可能是文本数据格式, 也可能是多媒体数据格式, 也可能是文 本数据格式与多媒体数据格式兼有。 检索完成后, 转至步骤 102C。
步骤 102C:比对模块自动地把完整内容信息存储至云端服务器的存储模块。 如图 2所示, 一种基于云计算的摘录信息网络存储管理系统, 本系统采用 了上述信息摘录方法。 结构设置、 结构连接关系、 信息流过程如下:
本系统包括用户端及云端服务器 3;
所述用户端包括信息摘录上传装置 1及信息再现装置 2;所述用户端可为电 子计算机、 移动电话、 PDA等数字终端。
所述信息摘录上传装置 1包括自动感应模块 11、 选择工具模块 12、 分析模 块 14、 编辑模块 15、 上传模块 16。
所述自动感应模块 11: 用于感应用户于网页上的摘录动作, 并激活选择工 具模块 12。
所述选择工具模块 12包括网页信息区域选择模块 13及线下信息摘录模块
17。
所述网页信息区域选择模块 13: 用于用户选择网页中需要保存的信息的区 域。
所述分析模块 14: 遍历用户选中区域的信息内容的源代码, 过滤出源代码 中出现的多媒体标签 , 对多媒体标签中的链接地址对应的第一多媒体内容进行 提取, 得到分离的第一文本内容与第一多媒体内容, 并形成多媒体列表, 所述 多媒体列表包括第一文本内容清单、 第一多媒体内容清单。
所述编辑模块 15: 用于在多媒体列表中选择需要保存的清单信息, 所述清 单信息包括第一文本内容和 /或第一多媒体内容; 还用于用户编辑多媒体列表中 需要保存的清单信息, 所述编辑包括对清单信息的第一文本内容和 /或第一多媒 体内容添加主观存储因素, 所述主观存储因素包括保存原因、 保存目的、 备注、 标签、 关键字等中的一项或多项组合; 还用于过滤无效信息, 把无效信息加入 多媒体列表并进行标注, 所述无效信息包括超小图片 (如分辨率低于 10*10像 素的图片)、失效链接地址等,用户还可在多媒体列表中选择过滤掉的无效信息。
所述上传模块 16: 用于将清单信息上传并存储至云端服务器。
所述线下信息摘录模块 17: 用于输入线下信息的特征码, 所述特征码包括 杂志的 ISSN号、 页码、 位置, 书籍的 ISBN号、 页码, 物品的条码等;
所述云端服务器 3包括存储模块 31、 采集模块 34、 整理模块 36、 加工模块 33、 比对模块 32、 后台处理模块 35。
所述存储模块 31: 用于保存用户上传的摘录信息, 所述摘录信息包括清单 信息及完整内容信息; 还用于保存整理模块 36创建的分类数据库。
所述采集模块 34: 用于获取清单信息的第一文本内容和 /或第一多媒体内容 对应的第一客观存储因素和 /或主观存储因素; 还用于获取完整内容信息的第二 文本内容和 /或第二多媒体内容对应的第二客观存储因素和 /或主观存储因素; 所述第一客观存储因素包括来源 IP地址、 上传设备、 来源 RSS地址、 上传 的地理位置、 上传时间、 数据格式等的数据; 所述第二客观存储因素包括上传 设备、 上传的地理位置、 上传时间、 数据格式、 特征码等的数据;
所述比对模块 32: 用于根据用户输入的特征码从资料数据库(包括云端服 务器数据库、 线下媒体网络数据库等) 中检索与特征码相应的完整内容信息, 并将完整内容信息存储至云端服务器的存储模块, 所述完整内容信息包括第二 文本内容和 /或第二多媒体内容。 所述整理模块 36: 根据清单信息的第一文本内容和 /或第一多媒体内容对应 的第一客观存储因素和 /或主观存储因素, 对清单信息进行分类并创建分类数据 库, 所述分类数据库中的每一条记录对应相应的清单信息及与该清单信息相应 的第一客观存储因素和 /或主观存储因素, 所述分类数据库存储至存储模块; 还 用于根据完整内容信息的第二文本内容和 /或第二多媒体内容对应的主观存储因 素和 /或第二客观存储因素, 对完整内容信息进行分类, 并添加至分类数据库, 所述分类数据库中的每一条记录还对应相应的完整内容信息及与该完整内容信 息相应的主观存储因素和 /或第二客观存储因素; 第一客观存储因素、 主观存储 因素、 第二客观存储因素可统一为存储因素, 分类数据库对具有相同的存储因 素的摘录信息, 进行关联并分类整理。
所述加工模块 33: 调用 OCR技术, 把存储模块中的第一多媒体内容、 第二 多媒体内容中的图片数据文本化, 即图片数据转换为文本数据。
所述后台处理模块 35: 用于查找不同用户上传的相同摘录信息, 并删减多 余的摘录信息; 用于根据摘录信息的存储因素, 跟踪摘录信息的更新, 并向用 户推荐更新后的摘录信息; 用于向用户推荐其他可能有用的相关信息。
所述信息再现装置 2包括显示模块 21、 查询模块 22、 修改模块 23、 共享模 块 24。
所述查询模块 22: 根据分类数据库的存储因素进行检索, 并向显示模块输 出检索结果;
所述显示模块 21 : 根据检索结果, 读取存储模块中所需的摘录信息, 并展 示相应的清单信息或完整内容信息, 摘录信息的排布方式与原始来源基本一致。
所述修改模块 23: 对摘录信息进行再编辑, 所述再编辑包括删除存储模块 中的摘录信息(分类数据库中相应的记录也被删除), 修改分类数据库中的主观 存储因素(与摘录信息相对应的主观存储因素也自动作出相应改变), 添加分类 数据库中的主观存储因素 (与摘录信息相对应的主观存储因素也自动作出相应 改变)等。
例如, 用户通过修改模块 23, 修改分类数据库中某条记录的保存目的, 与 该保存目的相对应的摘录信息的原保存目的的内容也随之更改。
所述共享模块 24: 用于将摘录信息转发或共享至目标对象用户。
本系统的具体表现形式可以是计算机软件程序, 现举例详细说明。
本系统所要摘录的信息来源, 可以是网页或其他网络来源中的图片、 动画、 电影、 音频、 文本或其他形式的内容, 也可以是 刊杂志中的文章、 图片, 也 可以是书籍中的篇章段落, 或其他形式的信息。
本系统的信息摘录上传装置的工作方式, 可以表现为浏览器插件 (也可以 是计算机程序、 网页界面、 手机软件、 其他数字终端应用程序等)。 在网页上选 择想摘录的内容后自动启动, 可以智能分析提取不同类型的信息, 并自动生成 标签和关键字, 该插件可以在任意复杂结构的网页中生效。 为了能支持在复杂 结构的网页之中进行摘录, 本系统并没有采用传统的在单个页面嵌入前端 DHTML代码的做法, 而是提升了代码的执行级别, 分析复杂结构网页中多个文 档之间的复杂包含与显示关系, 并通过高层的跨文档的方法调用方式来完成摘 录动作相关参数信息的传递, 最终完成摘录界面的正确显示和保存动作。 插件 中包括以下模块: 1 ) 自动感应模块, 感应用户想要摘录信息动作和区域, 当用 户用鼠标选中想要收藏的部分时(可以包括图片、 文字、 视频、 音频等), 插件 被激活, 在网页上浮动出现收藏选择工具条; 2 )分析模块, 分析用户拟保存信 息内容, 提取关键字, 识别并按文字数据、 图片数据、 影像数据、 音频数据等 自动分类。 其工作原理是, 遍历选中区域的内容, 分别过滤出其间出现的媒体 标签, 提取媒体内容的链接地址, 得到分离的文字与媒体内容, 并形成媒体列 表供用户勾选; 3 )过滤编辑模块, 能自动过滤超小图片等无用信息, 用户也可 根据需要将过滤掉的信息重新恢复, 用户选择或编辑拟保存信息, 可选择信息 收藏原因、 目的等主观性因素, 也可写备注及标注附加关键字; 4 )上传模块, 会先将用户摘录的信息及其他相关要素保存到浏览器文档之外单独的存储空 间, 然后一次性上传并存储至云端服务器。 有摘录线下信息需求时, 可通过插 件输入线下信息的特征码, 云端服务器根据特征码从相关数据库(包括服务器 数据库、 线下媒体网络数据库、 其他数据库) 中检索相应的完整内容, 并自动 存储。 用户还可对相关内容进行编辑和其他处理。
云端服务器的数据处理方式: 每一条摘录信息在服务器端都对应一条收藏 记录, 以及多个转存的多媒体(图片、 音频、 视频等)。 摘录记录的字段包括: 上传发生的时间、 位置、 IP地址、 上传设备, 信息的内容、 备注、 重要性, 摘 录的原因、 目的, 原始信息页面的标题、 关键词、 RSS 地址、 标签, 信息中所 包含图片的 OCR信息。服务器按照客观性因素结合用户提供的主观性因素, 对 所有上传信息进行综合分类, 并生成相关分类数据库。
信息再现装置也为浏览器插件, 可于信息摘录上传装置整合在一起, 也可 以独立于信息摘录上传装置, 通过信息在现装置, 用户可方便的使用经过整理 后的摘录信息, 包括查询、 编辑、 转发、 浏览、 共享等。 信息再现装置包括: 1 ) 显示模块, 摘录信息将以一种与摘录原始来源基本一致的排布方式, 在一个独 立的、 可缩放的窗口中呈现。 2 )查询模块, 用户可以看到按照原因和目的筒单 分类的信息, 也可以按照时间、 位置、 标签、 关键字、 表现形式、 回访次数等 要素进行检索。 3 )编辑模块, 用户可以对摘录信息进行进一步编辑, 删除, 写 批注, 建立信息之间新的关联关系, 更改信息的可见性。 4 )转发共享模块, 用 户可以方便的将摘录信息转发或共享至目标对象。
此外, 本系统的线下信息摘录功能还可以独立出来, 并不附加在信息摘录 上传装置内。
本发明提出的分类数据库, 其工作过程都与现有技术相同, 本领域技术人 员都知晓其工作原理, 因此, 本发明不再赘述数据库的工作过程。
上述实施例只是本发明较为优选的一种, 本领域技术人员在本发明的保护 范围内作出的筒单变化或替换, 均落在本发明的保护范围内。

Claims

权 利 要 求 书
1.一种信息摘录方法, 其特征在于, 其包括以下步骤:
A.用户选择网页中需要保存的信息的区域;
B.遍历用户选中区域的信息内容的源代码,过滤出源代码中出现的多媒体标 签, 对多媒体标签中的链接地址对应的第一多媒体内容进行提取, 得到分离的 第一文本内容与第一多媒体内容, 并形成多媒体列表, 所述多媒体列表包括第 一文本内容清单、 第一多媒体内容清单;
C.用户在多媒体列表中选择需要保存的清单信息,所述清单信息包括第一文 本内容和 /或第一多媒体内容;
D.将清单信息上传并存储至云端服务器。
2.如权利要求 1所述的信息摘录方法, 其特征在于, 所述步骤 A之前还有 步骤 A1:
用户激活选择工具模块, 所述选择工具模块包括网页信息区域选择模块、 线下信息摘录模块;
若用户选择网页信息区域选择模块, 则至步骤 A;
若用户选择线下信息摘录模块, 则至步驟 A2, 所述步骤 A2包括: 用户输 应的完整内容信息, 将完整内容信息存储至云端服务器;
所述完整内容信息包括第二文本内容和 /或第二多媒体内容;所述清单信息、 完整内容信息记为摘录信息。
3. 如权利要求 1所述的信息摘录方法, 其特征在于, 所述步骤 C中, 还包 括: 用户编辑多媒体列表中需要保存的清单信息, 所述编辑包括分别对清单信 息的第一文本内容、 第一多媒体内容添加主观存储因素。
4.一种基于云计算的摘录信息网络存储管理系统, 其特征在于, 包括用户端 及云端服务器; 所述用户端包括信息摘录上传装置及信息再现装置; 所述信息摘录上传装置包括选择工具模块、 分析模块、 编辑模块、 上传模 块;
所述选择工具模块包括网页信息区域选择模块, 所述网页信息区域选择模 块: 用于用户选择网页中需要保存的信息的区域;
所述分析模块: 遍历用户选中区域的信息内容的源代码, 过滤出源代码中 出现的多媒体标签, 对多媒体标签中的链接地址对应的第一多媒体内容进行提 取, 得到分离的第一文本内容与第一多媒体内容, 并形成多媒体列表, 所述多 媒体列表包括第一文本内容清单、 第一多媒体内容清单;
所述编辑模块: 用于在多媒体列表中选择需要保存的清单信息, 所述清单 信息包括第一文本内容和 /或第一多媒体内容;
所述上传模块: 用于将清单信息上传并存储至云端服务器; 所述云端服务器包括存储模块、 采集模块、 整理模块;
所述存储模块: 用于保存用户上传的摘录信息, 所述摘录信息包括清单信 息;
所述采集模块: 用于获取清单信息的第一文本内容和 /或第一多媒体内容对 应的第一客观存储因素和 /或主观存储因素;
所述整理模块: 根据清单信息的第一文本内容和 /或第一多媒体内容对应的 第一客观存储因素和 /或主观存储因素,对清单信息进行分类并创建分类数据库, 所述分类数据库中的每一条记录对应相应的清单信息及与该清单信息相应的第 一客观存储因素和 /或主观存储因素, 所述分类数据库存储于存储模块; 所述信息再现装置包括显示模块、 查询模块,
所述查询模块: 根据分类数据库的第一客观存储因素和 /或主观存储因素进 行检索, 并向显示模块输出检索结果;
所述显示模块: 根据检索结果, 读取存储模块中所需的清单信息, 并展示 相应的第一文本内容和 /或第一多媒体内容。
5.如权利要求 4所述的基于云计算的摘录信息网络存储管理系统,其特征在 于, 所述信息摘录上传装置还包括感应模块, 所述感应模块: 用于感应用户于 网页上的摘录动作, 并激活选择工具模块。
6. 如权利要求 4所述的基于云计算的摘录信息网络存储管理系统, 其特征 在于, 所述信息摘录上传装置的编辑模块: 还用于编辑多媒体列表中需要保存 的清单信息, 所述编辑包括对清单信息的第一文本内容和 /或第一多媒体内容添 加主观存储因素。
7. 如权利要求 4所述的基于云计算的摘录信息网络存储管理系统, 其特征 在于, 所述云端服务器还包括加工模块, 所述加工模块: 调用 OCR技术, 将存 储模块中的第一多媒体内容的图片数据文本化。
8. 如权利要求 4所述的基于云计算的摘录信息网络存储管理系统, 其特征 在于, 所述云端服务器还包括后台处理模块, 所述后台处理模块: 用于查找不 同用户上传的相同清单信息, 并删减多余的清单信息; 和 /或用于根据清单信息 的第一客观存储因素, 跟踪清单信息的更新, 并向用户推荐更新后的清单信息。
9. 如权利要求 4所述的基于云计算的摘录信息网络存储管理系统, 其特征 在于, 所述信息摘录上传装置的选择工具模块还包括线下信息摘录模块;
所述线下信息摘录模块: 用于输入线下信息的特征码;
所述云端服务器还包括比对模块, 所述比对模块: 用于根据特征码从资料 数据库中检索与特征码相应的完整内容信息, 将完整内容信息存储至云端服务 器的存储模块, 所述完整内容信息包括第二文本内容和 /或第二多媒体内容; 所 述摘录信息还包括完整内容信息;
所述云端服务器的采集模块: 还用于获取完整内容信息的第二文本内容和 / 或第二多媒体内容对应的第二客观存储因素和 /或主观存储因素;
所述整理模块: 还用于根据完整内容信息的第二文本内容和 /或第二多媒体 内容对应的主观存储因素和 /或第二客观存储因素, 对完整内容信息进行分类, 并添加至分类数据库, 所述分类数据库中的每一条记录还对应相应的完整内容 信息及与该完整内容信息相应的主观存储因素和 /或第二客观存储因素; 所述信息再现装置的查询模块: 还用于根据分类数据库的第二客观存储因 素和 /或主观存储因素进行检索, 并向显示模块输出检索结果;
所述信息再现装置的显示模块: 还用于根据检索结果, 读取存储模块中所 需的完整内容信息, 并展示相应的第二文本内容和 /或第二多媒体内容。
10. 如权利要求 9所述的基于云计算的摘录信息网络存储管理系统,其特征 在于, 所述信息再现装置还包括修改模块, 所述修改模块: 用于对摘录信息进 行再编辑, 所述再编辑包括删除存储模块中的摘录信息, 修改分类数据库中的 主观存储因素, 添加分类数据库中的主观存储因素。
11. 如权利要求 5-9任一项所述的基于云计算的摘录信息网络存储管理系 统, 其特征在于, 所述信息摘录上传装置的工作方式, 包括浏览器插件、 计算 机程序、 网页界面、 手机软件、 数字终端应用程序。
PCT/CN2012/076041 2011-06-24 2012-05-25 信息摘录方法及基于云计算的摘录信息网络存储管理系统 WO2012174971A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201110173782.5A CN102624770B (zh) 2011-06-24 2011-06-24 信息摘录方法及基于云计算的摘录信息网络存储管理系统
CN201110173782.5 2011-06-24

Publications (1)

Publication Number Publication Date
WO2012174971A1 true WO2012174971A1 (zh) 2012-12-27

Family

ID=46564453

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2012/076041 WO2012174971A1 (zh) 2011-06-24 2012-05-25 信息摘录方法及基于云计算的摘录信息网络存储管理系统

Country Status (2)

Country Link
CN (1) CN102624770B (zh)
WO (1) WO2012174971A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107247772A (zh) * 2017-06-06 2017-10-13 合肥创旗信息科技有限公司 一种基于互联网的图文搜索引擎

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103294748A (zh) * 2013-01-22 2013-09-11 北京旭宁信息技术有限公司 摘录并编辑互联网内容的方法
CN103744609B (zh) * 2014-01-20 2018-10-19 华为终端(东莞)有限公司 一种数据提取方法及装置
CN104978340B (zh) * 2014-04-08 2020-05-15 北京奇虎科技有限公司 一种链接地址生成方法、设备和服务器
CN104794233B (zh) * 2015-05-06 2019-03-15 陈川川 一种基于一种纪念品结构的文件收集分类方法
CN109036499A (zh) * 2018-07-04 2018-12-18 莫毓昌 一种基于hl7标准的电子病历智能编辑器
CN113761237A (zh) * 2021-09-11 2021-12-07 黄冈师范学院 一种用于云计算系统的数据处理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101202754A (zh) * 2007-12-04 2008-06-18 腾讯科技(深圳)有限公司 一种网络信息的保存方法及保存系统
CN101419617A (zh) * 2008-12-10 2009-04-29 深圳市迅雷网络技术有限公司 一种确定网页对象的方法及装置
CN101674329A (zh) * 2009-09-27 2010-03-17 卓望数码技术(深圳)有限公司 一种互联网访问方法和互联网访问系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6735623B1 (en) * 2000-02-09 2004-05-11 Mitch Prust Method and system for accessing a remote storage area

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101202754A (zh) * 2007-12-04 2008-06-18 腾讯科技(深圳)有限公司 一种网络信息的保存方法及保存系统
CN101419617A (zh) * 2008-12-10 2009-04-29 深圳市迅雷网络技术有限公司 一种确定网页对象的方法及装置
CN101674329A (zh) * 2009-09-27 2010-03-17 卓望数码技术(深圳)有限公司 一种互联网访问方法和互联网访问系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107247772A (zh) * 2017-06-06 2017-10-13 合肥创旗信息科技有限公司 一种基于互联网的图文搜索引擎

Also Published As

Publication number Publication date
CN102624770B (zh) 2014-05-28
CN102624770A (zh) 2012-08-01

Similar Documents

Publication Publication Date Title
US12008032B2 (en) Automatic detection and transfer of relevant image data to content collections
WO2012174971A1 (zh) 信息摘录方法及基于云计算的摘录信息网络存储管理系统
CN105706080B (zh) 扩增并呈现捕获的数据
CN103530652A (zh) 一种基于人脸聚类的视频编目方法、检索方法及其系统
WO2021120818A1 (en) Methods and systems for managing image collection
US20140355907A1 (en) Photo and video search
US10878020B2 (en) Automated extraction tools and their use in social content tagging systems
CN102682082B (zh) 基于内容结构特征的网络Flash搜索系统及搜索方法
TW200849044A (en) Database files-management system, integration module and browsing interface of database files-management system, database files-management method
US6694302B2 (en) System, method and article of manufacture for personal catalog and knowledge management
CN102457817A (zh) 一种手机报中新闻内容的抽取方法及系统
Ishiguro et al. Towards automatic image understanding and mining via social curation
JP4714710B2 (ja) 自動タグ付与装置、自動タグ付与方法、自動タグ付与プログラムおよびそのプログラムを記録した記録媒体
Liu et al. Event analysis in social multimedia: a survey
Amato et al. Searching and annotating 100M Images with YFCC100M-HNfc6 and MI-File
US20100169318A1 (en) Contextual representations from data streams
US10719492B1 (en) Automatic reconciliation and consolidation of disparate repositories
KR101471522B1 (ko) 콘텐츠의 생성 및 소비에 기반한 개인 정보 제공 시스템
KR20220079073A (ko) 멀티미디어 변환 콘텐츠 제작 서비스 제공장치의 제작 인터페이스 장치
Seenivasan ETL in a World of Unstructured Data: Advanced Techniques for Data Integration
CN103853730A (zh) 控制网络链接快捷方式分类的方法和系统
Veena et al. A Personalized and Scalable Machine Learning-Based File Management System
CN111984807B (zh) 一种内容筛选存储方法及系统
Garcia et al. A mobile platform for on-the-move user-generated tourist contents
Liu et al. Linking socially contributed media with events

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 12802283

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205N DATED 16/05/2014)

122 Ep: pct application non-entry in european phase

Ref document number: 12802283

Country of ref document: EP

Kind code of ref document: A1