WO2021219066A1 - 文档处理方法、装置及电子设备 - Google Patents

文档处理方法、装置及电子设备 Download PDF

Info

Publication number
WO2021219066A1
WO2021219066A1 PCT/CN2021/090886 CN2021090886W WO2021219066A1 WO 2021219066 A1 WO2021219066 A1 WO 2021219066A1 CN 2021090886 W CN2021090886 W CN 2021090886W WO 2021219066 A1 WO2021219066 A1 WO 2021219066A1
Authority
WO
WIPO (PCT)
Prior art keywords
document
data information
keyword
image
target
Prior art date
Application number
PCT/CN2021/090886
Other languages
English (en)
French (fr)
Inventor
易玮玮
Original Assignee
维沃移动通信有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 维沃移动通信有限公司 filed Critical 维沃移动通信有限公司
Priority to EP21797263.7A priority Critical patent/EP4145334A4/en
Publication of WO2021219066A1 publication Critical patent/WO2021219066A1/zh
Priority to US17/975,590 priority patent/US20230062959A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities

Definitions

  • This application belongs to the field of communication technology, and specifically relates to a document processing method, device, and electronic equipment.
  • the user when users need to migrate an old form that has been filled out or a form with errors in the format to a new form with the correct format, the user is generally required to transfer the old form
  • the filled-in items are selected one by one, copied and pasted into the corresponding items to be filled in the new form; the other scheme is that the user compares the filled-in old form and re-edits and fills in the new form one by one; the other scheme is comparison
  • the new form adjusts the format of the previously filled form to meet the requirements of the new form.
  • the existing methods for transplanting similar table contents have shortcomings.
  • the user needs to manually select and copy and paste one by one.
  • the user performs operations on the mobile terminal, it is very inconvenient to select and copy item by item.
  • Open the second table The same is true for pasting, and it is easy to change the format of the new table, which is inefficient.
  • the user needs to fill in all or most of the previously filled-in form content in the new form again.
  • the process is repeated and time-consuming and labor-intensive.
  • it is operated on the mobile terminal of the mobile phone, due to the limitations of the screen size and the form editing software, it is already very difficult to open two forms at the same time, and the operation is even more inconvenient.
  • the format adjustment of the form requires a lot of time for the user, and the operation on the computer may cause the format to be not exactly the same, and the subsequent material submission is not standardized.
  • the format adjustment of the table on the mobile terminal of the mobile phone is limited by the functions and visual experience of the mobile phone software, which is inconvenient to operate.
  • the purpose of the embodiments of the present application is to provide a document processing method, device, and electronic equipment, which can solve the problems of the existing similar table content migration solution, which is complicated and cumbersome and time-consuming and labor-intensive.
  • an embodiment of the present application provides a document processing method, including:
  • the first keyword in the second data information obtain a second keyword matching the first keyword and target data associated with the second keyword in the first data information information;
  • the target document is displayed.
  • an embodiment of the present application provides a document processing apparatus, including:
  • the first obtaining module is configured to obtain the first data information of the first document and the second data information of the second document;
  • the second obtaining module is configured to obtain, in the first data information, a second keyword that matches the first keyword and a second keyword that matches the second keyword in the first data information according to the first keyword in the second data information.
  • the first generating module is configured to synthesize the second data information and the target data information in a preset format to generate an editable target document;
  • the first display module is used to display the target document.
  • an embodiment of the present application provides an electronic device that includes a processor, a memory, and a program or instruction stored on the memory and capable of running on the processor.
  • the program or instruction is The processor implements the steps of the method described in the first aspect when executed.
  • an embodiment of the present application provides a readable storage medium, on which a program or instruction is stored, and when the program or instruction is executed by a processor, the steps of the method described in the first aspect are implemented .
  • an embodiment of the present application provides a chip, the chip includes a processor and a communication interface, the communication interface is coupled to the processor, and the processor is used to run a program or an instruction to implement the chip as in the first aspect The method described.
  • embodiments of the present application provide a computer program product, wherein the program product is stored in a nonvolatile storage medium, and the program product is executed by at least one processor to implement the computer program product described in the first aspect. The method described.
  • an embodiment of the present application provides an electronic device, wherein the electronic device is configured to execute the method described in the first aspect.
  • the first data information is obtained
  • a second keyword that matches the first keyword and the target data information associated with the second keyword is obtained in the first data information
  • the second data information is combined with the target data
  • the information is synthesized in a preset format to generate an editable target document, which can solve the problem of complicated, cumbersome, time-consuming and labor-intensive operations when the user transplants the content of the document, and the transplantation process can be completed with one click, which improves work efficiency and reduces Consumption of labor and time.
  • Fig. 1 is a flowchart of a document processing method according to an embodiment of the present application
  • FIG. 2 is one of the first image display schematic diagrams according to an embodiment of the present application.
  • FIG. 3 is the second schematic diagram of the first image display according to the embodiment of the present application.
  • FIG. 4 is one of the first document display schematic diagrams according to an embodiment of the present application.
  • FIG. 5 is a schematic diagram of a list of to-be-selected forms in an embodiment of the present application.
  • FIG. 6 shows a schematic diagram of the structure of a document processing apparatus according to an embodiment of the present application.
  • FIG. 7 shows a schematic diagram of the structure of an electronic device according to an embodiment of the present application.
  • Items to be filled the items that need to be filled in the word form, in the following table 1, the blank box after the "name" box;
  • Item name the name before the item to be filled, as shown in the "Name” box in Table 1 below;
  • Table 1 Exemplary table of to-be-filled items and project names
  • an embodiment of the present application provides a document processing method, including:
  • Step 101 Acquire first data information of a first document and second data information of a second document.
  • the first data information of the first document may include item names and information content corresponding to the item names; the second data information of the second document may include item names and items to be filled, or the second data
  • the information may include the project name and the information content corresponding to the project name.
  • the preset format may be a dictionary format, which facilitates traversal, comparison, and query of the first data information and the second data information.
  • the content of the first document is as shown in Table 2 below:
  • the item names of the first data information of the first file include: name, gender, date of birth, contact information, educational background, whether full-time or not, work unit, working years, etc.
  • the information content corresponding to the name is A1
  • the information content corresponding to the gender is A2
  • the information content corresponding to the date of birth is A3, etc., which will not be listed here.
  • the content of the second document may be as shown in Table 3 below:
  • the item name of the second data information of the second file includes: name, gender, contact information, ID number, work unit, unit nature, unit address, unit legal person, etc.
  • Step 102 Obtain, in the first data information, a second keyword that matches the first keyword and is associated with the second keyword according to the first keyword in the second data information The target data information.
  • the second keyword that matches the first keyword is obtained in the first data information, and the second keyword that is associated with the second keyword is obtained in the first data information.
  • the target data information in the first document is compared with the second data information in the second document one by one, and the first keyword in the second document is traversed. For each first The keyword is searched in the first document, the second keyword that matches the first keyword is obtained, and the second keyword and the target data information associated with the second keyword are recorded or mark.
  • the first keyword may be an item name of a second document
  • the second keyword may be an item name of the first document.
  • the second keyword that matches the first keyword is ["name", “gender”, “contact information”, “work unit” "]
  • the target data information is: A1 corresponding to the name, A2 corresponding to the gender, A4 corresponding to the contact information, and A7 corresponding to the work unit.
  • Step 103 Synthesize the second data information and the target data information in a preset format to generate an editable target document.
  • the second data information and the target data information are synthesized in the same preset format, that is, the format of the second data information and the target data information are consistent, which is convenient for combining the data in the first document and the second document.
  • the content is automatically synthesized, saving manpower and time, with higher efficiency and higher accuracy.
  • the preset format may be a dictionary format and the like.
  • the dictionary format of the first data information can be: dictionary A: ⁇ "name”: “A1”, “sex”: “A2”, “date of birth”: “A3”, etc. ⁇ ;
  • the dictionary format of the second data information may be: dictionary B: ⁇ "name”: "", “sex”: “”, “contact information”: "”, etc. ⁇ .
  • Step 104 Display the target document.
  • the user can modify and write the target document as needed, which is convenient for the user to operate.
  • the present application by acquiring the first data information of the first document and the second data information of the second document, according to the first keyword in the second data information, in the first data information Acquire a second keyword that matches the first keyword and target data information associated with the second keyword in the first data information, and combine the second data information with the target data information Synthesize in a preset format to generate an editable target document, which can solve the problem of complicated and cumbersome operations and time-consuming and labor-intensive operations when the user transplants the content of the document.
  • the document processing method in the above embodiment can be completed with one click The transplantation process improves work efficiency and reduces labor and time consumption.
  • the method further includes:
  • step 103 includes:
  • the target data information in the stored first data information and the stored second data information are synthesized in the preset format and filled into the third document to generate an editable target document.
  • the third document is a copied second document, that is, the content and format of the third document and the second document are all the same, and the first data information and the second data information are combined
  • Storing in the same preset format not only facilitates the synthesis of the first data information and the second data information, but also facilitates the extraction of data information.
  • an editable target document can be generated without changing the format and content of the second document , It can also automatically perform information migration on similar first and second documents, saving time and improving work efficiency.
  • step of storing the first data information and the second data information in a preset format and other steps is not limited, and the first data can also be stored in step 103.
  • the information and the second data information are stored in a preset format, which is not specifically limited here.
  • first copy form B ie, the second document
  • a new form C ie, third document
  • traverse all matching item names ie, the first keyword
  • the dictionary B information traverse all matching item names (ie, the first keyword) searched in step 102, for each A matching item name, fill in the item content (ie target data information) corresponding to the item name in the information dictionary A into the information dictionary C of the form C, and get the filled form C: ⁇ "name”: "A1", “gender” ": “A2”, “Contact Information”: "A4", "ID Number”: "", “Work Unit”: “A7”, etc. ⁇ , return and open Form C, as shown in Table 4 below:
  • the step 101 includes:
  • N is a positive integer greater than or equal to 2;
  • the user can select a first document and a second document of similar documents, and input the first document and the second document as a program, identify and extract the first data information in the first document, and identify and extract
  • the first document may be a document in which the information content corresponding to the item name has been filled in
  • the second document may be a document in which the item to be filled is empty.
  • the first input is a selective input, and the first document and the second document are selected from N documents.
  • the first input may be the user's input such as pressing, clicking, sliding on the first document and the second document, and the first input may also be the first operation, which is not specifically limited here.
  • the data information migration between two similar documents is realized.
  • the relevant data information that has been filled in can be automatically transplanted to the corresponding position of the new form. Users only need to edit and fill in the unique parts of the new form, which greatly improves work efficiency.
  • the step 101 may include:
  • the user can take photos of the form that needs to be transplanted as needed, obtain the first image about the form, and through the user’s second input to the first image, the first control can be displayed on the current interface.
  • Buttons such as the "Form Recognition” button in Figure 3
  • the first image can be processed through the target detection network to detect the form part in the first image, And use the text recognition network to extract the text content and the corresponding row and column information in the table, obtain the item name and the information content corresponding to each item name through the row and column information, and rebuild the table according to the obtained item name and the information content corresponding to each item name, get
  • the reconstructed electronic form A that is, the first document, as shown in FIG. 4, the display mode of the first document may be horizontal screen display, of course, it may also be vertical screen display, which is not specifically limited here.
  • the first data information can be identified and extracted.
  • a second control button (such as the "Compare and Merge” button under Table A in Figure 4) can be displayed on the interface that displays the first document.
  • the user can click and press the second control button to display the table to be selected.
  • the user can select the appropriate table according to the needs.
  • a selection button can be displayed behind each table to be selected. Select, as shown in Figure 5, Form 1 is the selected form, that is, Form 1 is the second document, and then use the back-end program to read Form 1 and extract row-by-row data information to get the project name and the dictionary of items to be filled B.
  • Fill the target data information in the first document into the third document through step 102 and step 103 that is, complete the migration of the target data information in the first document, automatically complete the migration process, improve work efficiency, and reduce labor and time consumption .
  • the second input may be an input such as a user pressing, clicking, or sliding on the first image, and the second input may also be a second operation, which is not specifically limited here.
  • the step 101 includes:
  • the user can take a photo of the form that needs to be transplanted according to needs, obtain the second image about the form, and through the user's third input to the second image, the first control button can be displayed on the current interface, and the first control button can be displayed on the current interface by the user.
  • Clicking, pressing, and other operations of a control button can process the second image through the target detection network, detect the table part in the second image, and use the text recognition network to extract the text content and the corresponding row and column information in the table.
  • the form is reconstructed according to the project name and the to-be-filled information corresponding to each project name, and the reconstructed electronic form B, that is, the second document, is obtained.
  • the display mode of the document can be horizontal screen display or vertical screen display, which is not specifically limited here.
  • the second control button can be displayed on the interface for displaying the second document.
  • the user can click and press the second control button to display the list of forms to be selected.
  • the user can select the appropriate form according to his needs and in the list of forms to be selected ,
  • a selection button can be displayed behind each table to be selected.
  • the selection button behind the table selected by the user has a " ⁇ " shape display, indicating that the table has been selected, and then the back-end program is used to read and step by step the selected table.
  • the data information of the row is extracted, and the dictionary A of the item name and the item to be filled is obtained.
  • Fill the target data information in the first document into the third document through step 102 and step 103 that is, complete the migration of the target data information in the first document, automatically complete the migration process, improve work efficiency, and reduce labor and time consumption .
  • data information migration between two similar documents can be realized.
  • relevant data information that has been filled in can be automatically transplanted to the corresponding position of the new form.
  • the user only needs to edit and fill in the unique part of the new form, which greatly improves the work efficiency; in addition, it can also compare the form images taken by the user of the electronic device, and fill in the filled-in content on paper In the electronic form to be filled, the function of digitizing paper materials is realized, reducing the time for users to query the form.
  • the second keyword that matches the first keyword and the second keyword that match the first keyword and the target data information is synthesized by synthesizing the second data information and the target data information in a preset format to generate an editable target document, and the content of similar tables can be transplanted completely programmatically , Users only need to select two similar tables to complete the content migration with one click, without opening and editing operations by themselves, which improves work efficiency and reduces labor and time consumption.
  • the execution subject of the document processing method provided by the embodiment of the present application may be a document processing apparatus, or a control module in the document processing apparatus for executing the loading document processing method.
  • the document processing method executed by the document processing apparatus is taken as an example to illustrate the document processing method provided in the embodiment of the present application.
  • an embodiment of the present application also provides a document processing device 60, including:
  • the first obtaining module 61 is configured to obtain first data information of a first document and second data information of a second document;
  • the second obtaining module 62 is configured to obtain, in the first data information, a second keyword that matches the first keyword and a second keyword that matches the first keyword in the first data information according to the first keyword in the second data information.
  • Target data information associated with two keywords;
  • the first generating module 63 is configured to synthesize the second data information and the target data information in a preset format to generate an editable target document;
  • the first display module 64 is configured to display the target document.
  • the device further includes:
  • the first storage module is configured to store the first data information and the second data information in a preset format
  • the first processing module is configured to copy the second document to obtain the copied third document
  • the first generating module includes:
  • the first generating unit is configured to synthesize the target data information in the stored first data information and the stored second data information in the preset format, and fill in the third document to generate Editable target document.
  • the first obtaining module 61 includes:
  • the first receiving unit is configured to receive a user's first input to N documents, where N is a positive integer greater than or equal to 2;
  • the first response unit is configured to obtain the first document and the second document among the N documents in response to the first input;
  • the first processing unit is configured to identify and extract the first data information in the first document and the second data information in the second document.
  • the first obtaining module 61 includes:
  • the first acquiring unit is used to acquire the first image
  • the second receiving unit is configured to receive a second input of the user to the first image
  • the second response unit is configured to convert the content in the first image into a first document through image recognition technology in response to the second input;
  • the second processing unit is used to identify and extract the first data information in the first document.
  • the first obtaining module 61 includes:
  • the second acquiring unit is used to acquire a second image
  • the third receiving unit is configured to receive a user's third input to the second image
  • the third response unit is configured to convert the content in the second image into a second document through image recognition technology in response to the third input;
  • the third processing unit is used to identify and extract the second data information in the second document.
  • the document processing device in the embodiment of the present application may be a device, or a component, an integrated circuit, or a chip in a terminal.
  • the device can be a mobile electronic device or a non-mobile electronic device.
  • the mobile electronic device may be a mobile phone, a tablet computer, a notebook computer, a handheld computer, a vehicle electronic device, a wearable device, an ultra-mobile personal computer (UMPC), a netbook, or a personal digital assistant (personal digital assistant). assistant, PDA), etc.
  • Non-mobile electronic devices can be servers, network attached storage (NAS), personal computers (PC), televisions (television, TV), teller machines or self-service machines, etc., this application The embodiments are not specifically limited.
  • the document processing device in the embodiment of the present application may be a device with an operating system.
  • the operating system may be an Android operating system, an ios operating system, or other possible operating systems, which are not specifically limited in the embodiment of the present application.
  • the document processing device provided by the embodiment of the present application can implement each process implemented by the document processing device in the method embodiments of FIGS. 1 to 5, and to avoid repetition, details are not described herein.
  • the first acquisition module 61 acquires the first data information of the first document and the second data information of the second document
  • the second acquisition module 62 acquires the first data information in the second data information according to the A keyword, obtaining a second keyword matching the first keyword and target data information associated with the second keyword from the first data information
  • the first generating module 63 converts the The second data information and the target data information are synthesized in a preset format to generate an editable target document.
  • the content of similar tables can be transplanted completely programmatically. The user only needs to select two similar tables to complete the content with one click The transplantation does not need to open editing and other operations by yourself, which improves work efficiency and reduces labor and time consumption.
  • an embodiment of the present application further provides an electronic device, including a processor, a memory, and a program or instruction that is stored in the memory and can run on the processor.
  • an electronic device including a processor, a memory, and a program or instruction that is stored in the memory and can run on the processor.
  • the electronic devices in the embodiments of the present application include the above-mentioned mobile electronic devices and non-mobile electronic devices.
  • FIG. 7 is a schematic diagram of the hardware structure of an electronic device that implements an embodiment of the present application.
  • the electronic device 70 includes, but is not limited to: a radio frequency unit 71, a network module 72, an audio output unit 73, an input unit 74, a sensor 75, a display unit 76, a user input unit 77, an interface unit 78, a memory 79, a processor 80, etc. part.
  • the electronic device 70 may also include a power source (such as a battery) for supplying power to various components.
  • the power source may be logically connected to the processor 80 through a power management system, so as to manage charging, discharging, and power management through the power management system. Consumption management and other functions.
  • the structure of the electronic device shown in FIG. 7 does not constitute a limitation on the electronic device.
  • the electronic device may include more or less components than those shown in the figure, or some components may be combined, or different component arrangements, which will not be repeated here. .
  • the input unit 74 is configured to obtain the first data information of the first document and the second data information of the second document;
  • the processor 80 is configured to obtain, in the first data information, a second keyword that matches the first keyword and a second keyword that matches the second keyword in the first data information according to the first keyword in the second data information.
  • the processor 80 is configured to synthesize the second data information and the target data information in a preset format to generate an editable target document;
  • the display unit 76 is configured to display the target document.
  • the first data information of the first document and the second data information of the second document are obtained through the input unit 74, and the processor 80 uses the first keyword in the second data information to enter the Acquire a second keyword matching the first keyword and target data information associated with the second keyword from the first data information, and compare the second data information with the target data information in advance Set the format to synthesize and generate editable target documents, which can solve the problem of complicated, cumbersome and time-consuming operations when users transplant the content of the document. One-click completion of the transplantation process improves work efficiency and reduces labor and time consumption. .
  • the memory 79 is configured to: store the first data information and the second data information in a preset format
  • the processor 80 is configured to copy the second document to obtain the copied third document
  • the processor 80 is specifically configured to:
  • the stored target data information in the first data information and the stored second data information are synthesized in the preset format and filled into the third document to generate an editable target document.
  • the input unit 74 is specifically configured to:
  • N is a positive integer greater than or equal to 2;
  • the processor 80 is specifically configured to:
  • the processor 80 is specifically configured to:
  • the input unit 74 is specifically configured to:
  • the processor 80 is specifically configured to:
  • the processor 80 is specifically configured to:
  • the input unit 74 is specifically configured to:
  • the processor 80 is specifically configured to:
  • the processor 80 is specifically configured to:
  • the processor 80 obtains the second key that matches the first keyword from the first data information according to the first keyword in the second data information.
  • Words and the target data information associated with the second keyword, the second data information and the target data information are synthesized in a preset format to generate an editable target document, and the contents of similar tables can be transplanted Fully programmed, users only need to select two similar tables to complete the content migration with one click, without opening and editing operations by themselves, improving work efficiency and reducing labor and time consumption.
  • the embodiments of the present application also provide a readable storage medium with a program or instruction stored on the readable storage medium.
  • the program or instruction is executed by a processor, each process of the above-mentioned document processing method embodiment is realized, and the same can be achieved. In order to avoid repetition, I won’t repeat them here.
  • the processor is the processor in the electronic device described in the foregoing embodiment.
  • the readable storage medium includes a computer readable storage medium, such as a computer read-only memory (Read-Only Memory, ROM), random access memory (Random Access Memory, RAM), magnetic disk, or optical disk.
  • An embodiment of the present application further provides a chip, the chip includes a processor and a communication interface, the communication interface is coupled with the processor, and the processor is used to run a program or an instruction to implement the above-mentioned document processing method embodiment
  • the chip includes a processor and a communication interface
  • the communication interface is coupled with the processor
  • the processor is used to run a program or an instruction to implement the above-mentioned document processing method embodiment
  • chips mentioned in the embodiments of the present application may also be referred to as system-level chips, system-on-chips, system-on-chips, or system-on-chips.
  • the division of the various modules of the above device is only a division of logical functions, and may be fully or partially integrated into a physical entity in actual implementation, or may be physically separated.
  • These modules can all be implemented in the form of software called by processing elements; they can also be implemented in the form of hardware; part of the modules can also be implemented in the form of calling software by processing elements, and some of the modules can be implemented in the form of hardware.
  • the first acquisition module may be a separately established processing element, or it may be integrated in a certain chip of the above-mentioned device for implementation.
  • it may also be stored in the memory of the above-mentioned device in the form of program code, which is used by one of the above-mentioned devices.
  • the processing element calls and executes the function of the above first acquisition module.
  • the implementation of other modules is similar.
  • all or part of these modules can be integrated together or implemented independently.
  • the processing element described here may be an integrated circuit with signal processing capability.
  • each step of the above method or each of the above modules can be completed by an integrated logic circuit of hardware in the processor element or instructions in the form of software.
  • each module, unit, sub-unit or sub-module may be one or more integrated circuits configured to implement the above method, for example: one or more application specific integrated circuits (ASIC), or one or Multiple microprocessors (digital signal processor, DSP), or one or more field programmable gate arrays (Field Programmable Gate Array, FPGA), etc.
  • ASIC application specific integrated circuit
  • DSP digital signal processor
  • FPGA Field Programmable Gate Array
  • the processing element may be a general-purpose processor, such as a central processing unit (CPU) or other processors that can call program codes.
  • these modules can be integrated together and implemented in the form of a system-on-a-chip (SOC).
  • SOC system-on-a-chip
  • the technical solution of this application essentially or the part that contributes to the existing technology can be embodied in the form of a software product, and the computer software product is stored in a storage medium (such as ROM/RAM, magnetic disk, The optical disc) includes several instructions to make a terminal (which may be a mobile phone, a computer, a server, an air conditioner, or a network device, etc.) execute the methods described in the various embodiments of the present application.
  • a terminal which may be a mobile phone, a computer, a server, an air conditioner, or a network device, etc.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)
  • Processing Or Creating Images (AREA)

Abstract

一种文档处理方法、装置及电子设备,属于通信技术领域。该方法包括:获取第一文档的第一数据信息和第二文档的第二数据信息(101);根据所述第二数据信息中的第一关键字,在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息(102);将所述第二数据信息与所述目标数据信息以预设格式进行合成,生成可编辑的目标文档(103);显示所述目标文档(104)。

Description

文档处理方法、装置及电子设备
相关申请的交叉引用
本申请主张在2020年4月29日在中国提交的中国专利申请No.202010354321.7的优先权,其全部内容通过引用包含于此。
技术领域
本申请属于通信技术领域,具体涉及一种文档处理方法、装置及电子设备。
背景技术
目前,在电脑及移动终端用户编辑和填写表格的过程中,当用户需要将一个填写过的旧表格或格式存在错误的表格迁移到新的格式正确的表格中时,一般需要用户将旧表格中填写好的项目逐一进行选择、复制和粘贴到新表格的对应待填项中;另一种方案是用户对照填写好的旧表格在新表格中逐一进行重新编辑和填写;还有一种方案是对照新的表格对之前填写的表格进行格式调整,达到新表格的要求。
现有的相似表格内容移植方法存在不足之处,对于第一种方案,需要用户手动逐一选择和复制粘贴,当用户在移动端进行操作时逐项的选择和复制十分不便,打开第二个表格进行粘贴也是如此,且容易造成新表格的格式改变,效率低下。
对于第二种方案,需要用户对之前已经填写过的表格内容在新的表格中全部或者大部分重新再填写一遍,过程重复,耗时耗力。且如果在手机移动端操作,由于屏幕大小和表格编辑软件的限制,同时打开两个表格已经十分困难,操作就更加不便。
对于第三种方案,对于表格的格式调整需要消耗用户大量时间,在电脑上进行操作可能造成格式不完全一样,后续材料提交不规范的情况。而在手机移动端进行表格的格式调整则受限于手机软件功能和视觉体验,不方便操作。
因此,现有的相似表格内容移植方案,存在操作复杂繁琐、耗时耗力的缺陷。
发明内容
本申请实施例的目的是提供一种文档处理方法、装置及电子设备,能够解决现有的相似表格内容移植方案,存在操作复杂繁琐且耗时耗力的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种文档处理方法,包括:
获取第一文档的第一数据信息和第二文档的第二数据信息;
根据所述第二数据信息中的第一关键字,在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息;
将所述第二数据信息与所述目标数据信息以预设格式进行合成,生成可编辑的目标文档;
显示所述目标文档。
第二方面,本申请实施例提供了一种文档处理装置,包括:
第一获取模块,用于获取第一文档的第一数据信息和第二文档的第二数据信息;
第二获取模块,用于根据所述第二数据信息中的第一关键字,在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息;
第一生成模块,用于将所述第二数据信息与所述目标数据信息以预设格式进行合成,生成可编辑的目标文档;
第一显示模块,用于显示所述目标文档。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。
第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的 方法的步骤。
第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。
第六方面,本申请实施例提供了一种计算机程序产品,其中,所述程序产品被存储在非易失的存储介质中,所述程序产品被至少一个处理器执行以实现如第一方面所述的方法。
第七方面,本申请实施例提供了一种电子设备,其中,所述电子设备被配置为执行如第一方面所述的方法。
在本申请实施例中,通过获取第一文档的第一数据信息和第二文档的第二数据信息,根据所述第二数据信息中的第一关键字,在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及在所述第一数据信息中获取与所述第二关键字相关联的目标数据信息,将所述第二数据信息与所述目标数据信息以预设格式进行合成,生成可编辑的目标文档,能够解决用户对文档的内容进行移植时存在操作复杂繁琐且耗时耗力的问题,并且可以一键完成移植过程,提升工作效率,减少人工和时间的消耗。
附图说明
图1是本申请实施例的文档处理方法流程图;
图2是本申请实施例的第一图像显示示意图之一;
图3是本申请实施例的第一图像显示示意图之二;
图4是本申请实施例的第一文档显示示意图之一;
图5是本申请实施例的待选表格列表示意图;
图6表示本申请实施例的文档处理装置的结构示意图;
图7表示本申请实施例的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是 全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
在进行本发明实施例的说明时,首先对下面描述中所用到的一些概念进行解释说明。
待填项:word表格中需要填写的项目,如下表1中,“姓名”格后的空白格;
项目名:待填项前的名称,如下表1中的“姓名”格;
相似表格:若两个表格中,待填项的项目名存在许多重复,例如AB两个表格中都需要填写“姓名”、“性别”、“身份证”等,则AB两个表格称之为相似表格。
表1待填项与项目名的示例性表格
姓名  
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的文档处理方法、装置及电子设备进行详细地说明。
如图1所示,本申请实施例提供了一种文档处理方法,包括:
步骤101,获取第一文档的第一数据信息和第二文档的第二数据信息。
需要说明的是,所述文档包括但不限于word表格等。下面可以以文档为表格的情况对本申请实施例进行详细说明。
具体的,所述第一文档的第一数据信息可以包括项目名以及与项目名对应的信息内容;所述第二文档的第二数据信息可以包括项目名和待填项,或者所述第二数据信息可以包括项目名以及与项目名对应的信息内容。其中,所述预设格式可以为字典格式,便于对第一数据信息和第二数据信息的遍历、对比、查询等。
例如:在第一文档为表格A时,所述第一文档的内容如下表2所示:
表2第一文档
姓名 A1 性别 A2
出生日期 A3 联系方式 A4
学历 A5 是否全日制 A6
工作单位 A7 工作年限 A8
其中,所述第一文档的第一数据信息的项目名包括:姓名、性别、出生日期、联系方式、学历、是否全日制、工作单位、工作年限等。与姓名对应的信息内容为A1,与性别对应的信息内容为A2,与出生日期对应的信息内容为A3等,在此不再一一列举。
在第二文档为表格B、且表格B中无填充内容时,所述第二文档的内容可以如下表3所示:
表3第二文档
姓名   性别  
联系方式   身份证号  
工作单位   单位性质  
单位地址   单位法人  
其中,所述第二文档的第二数据信息的项目名包括:姓名、性别、联系方式、身份证号、工作单位、单位性质、单位地址、单位法人等。
需要说明的是,所述第二文档中每一个项目名对应的信息内容不一定为待填项,表3仅为示例性说明,在此不做具体限定。
步骤102,根据所述第二数据信息中的第一关键字,在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息。
具体的,根据第二数据信息中的第一关键字,在第一数据信息中获取与第一关键字相匹配的第二关键字,以及在第一数据信息中获取与第二关键字相关联的目标数据信息,即:对所述第一文档中的第一数据信息和第二文档中的第二数据信息进行逐一比对,遍历第二文档中的第一关键字,对于每一个第一关键字在所述第一文档中进行搜索,获取与所述第一关键字匹配的第二关键字,并对第二关键字以及与所述第二关键字相关联的目标数据信息进 行记录或标记。其中,所述第一关键字可以为第二文档的项目名,所述第二关键字为所述第一文档的项目名。
例如:如上表2和表3中,在所述第一文档中,与所述第一关键字相匹配的第二关键字为[“姓名”,“性别”,“联系方式”,“工作单元”],所述目标数据信息为:与姓名对应的A1,与性别对应的A2,与联系方式对应的A4,与工作单元对应的A7。
步骤103,将所述第二数据信息与所述目标数据信息以预设格式进行合成,生成可编辑的目标文档。
具体的,将所述第二数据信息与所述目标数据信息以相同的预设格式进行合成,即让第二数据信息与目标数据信息的格式一致,便于将第一文档和第二文档中的内容进行自动合成,节省人力和时间,效率更高,准确性更高。其中,预设格式可以为字典格式等。
例如:如表2所示,第一数据信息的字典格式可以为:字典A:{“姓名”:“A1”,“性别”:“A2”,“出生日期”:“A3”等};如表3所示,第二数据信息的字典格式可以为:字典B:{“姓名”:“”,“性别”:“”,“联系方式”:“”等}。
步骤104,显示所述目标文档。
具体的,在目标文档生成之后,用户可以根据需要对目标文档进行修改和编写,便于用户操作。
在本申请上述实施例中,通过获取第一文档的第一数据信息和第二文档的第二数据信息,根据所述第二数据信息中的第一关键字,在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及所述第一数据信息中与所述第二关键字相关联的目标数据信息,将所述第二数据信息与所述目标数据信息以预设格式进行合成,生成可编辑的目标文档,能够解决用户对文档的内容进行移植时存在操作复杂繁琐且耗时耗力的问题,通过上述实施例中的文档处理方法,可以一键完成移植过程,提升工作效率,减少人工和时间的消耗。
可选的,在所述步骤101之后,所述方法还包括:
将所述第一数据信息和所述第二数据信息以预设格式进行储存;
将所述第二文档进行复制,获取复制后的第三文档;
其中,所述步骤103,包括:
将储存的所述第一数据信息中的目标数据信息与储存的所述第二数据信息以所述预设格式进行合成,并并填充至所述第三文档中,生成可编辑的目标文档。
具体的,所述第三文档为复制后的第二文档,即所述第三文档与所述第二文档的内容、格式等全部相同,将所述第一数据信息和所述第二数据信息以相同的预设格式进行储存,不仅便于第一数据信息和所述第二数据信息的合成,而且便于提取数据信息。并且,将储存的第一数据信息中的目标数据信息与储存的第二数据信息合成,填充至第三文档中,即可生成可编辑的目标文档,不仅不会改变第二文档的格式和内容,还能够自动对相似的第一文档和第二文档进行信息移植,节省时间,提高工作效率。
需要说明的是,将所述第一数据信息和所述第二数据信息以预设格式进行储存的步骤与其他步骤的前后关系并不限定,也可以在步骤103之中将所述第一数据信息和所述第二数据信息以预设格式进行储存,在此不做具体限定。
例如:首先复制表格B(即第二文档)为新的表格C(即第三文档),同时复制字典B信息,遍历步骤102中搜索的所有匹配项目名(即第一关键字),对于每一个匹配项目名,将信息字典A中项目名对应的项目内容(即目标数据信息)填写到表格C的信息字典C中,得到填充后的表格C:{“姓名”:“A1”,“性别”:“A2”,“联系方式”:“A4”,“身份证号”:“”,“工作单位”:“A7”等},返回并打开表格C,如下表4所示:
表4目标文档
姓名 A1 性别 A2
联系方式 A4 身份证号  
工作单位 A7 单位性质  
单位地址   单位法人  
可选的,所述步骤101,包括:
接收用户对N个文档的第一输入,所述N为大于或等于2的正整数;
响应于所述第一输入,获取所述N个文档中的第一文档和第二文档;
识别并提取所述第一文档中的第一数据信息以及所述第二文档中的第二数据信息。
具体的,用户可以选择相似文档的第一文档和第二文档,并将所述第一文档和第二文档作为程序输入,识别并提取所述第一文档中的第一数据信息以及识别并提取所述第二文档中的第二数据信息,所述第一文档可以为已经填写项目名对应的信息内容的文档,所述第二文档可以为待填项目为空的文档。
需要说明的是,第一输入为选择性输入,在N个文档中选择第一文档和第二文档。所述第一输入可以为用户对第一文档和第二文档的按压、点击、滑动等输入,所述第一输入也可以为第一操作,在此不做具体限定。
例如:如上表2和表3所示,对表格A、表格B分别进行数据信息的提取,使用python中的扩展包docx,对表格A、表格B使用docx.Document()命令读取表格,遍历表格中的所有行,对于每一行,根据列位置区分项目名和待填项等,进行字典存储。并且,可以对目标数据信息对应的项目名通过加粗、标黄等形式显示出来,方便用户观看。
本申请上述实施例中,实现两个相似文档(如相似表格)之间的数据信息移植,对于具有一些相同项目名的表格,能够自动将已经填写的相关数据信息移植到新表格的对应位置,用户只需对新表格中特有的部分进行编辑填写即可,极大提升了工作效率。
可选的,所述步骤101可以包括:
获取第一图像;
接收用户对所述第一图像的第二输入;
响应于所述第二输入,通过图像识别技术将所述第一图像中的内容转换为第一文档;
识别并提取所述第一文档中的第一数据信息。
具体的,如图2所示,用户可以根据需要,对需要移植的表格进行拍照,获取关于表格的第一图像,并通过用户对第一图像的第二输入,可以在当前界面显示第一控制按钮(如:图3中的“表格识别”按钮),通过用户对第一控制按钮的点击、按压等操作,可以通过目标检测网络对第一图像进行处理, 检测第一图像中的表格部分,并使用文字识别网络提取表格中的文字内容以及对应的行列信息,通过行列信息得到项目名和每一个项目名对应的信息内容,根据得到的项目名和每一个项目名对应的信息内容进行表格重建,得到重建后的电子表格A,即第一文档,如图4所示,所述第一文档的显示方式可以为横屏显示,当然,也可以为竖屏显示,在此不做具体限定。在得到第一文档之后,可以识别并提取所述第一数据信息。
在显示第一文档的界面上可以显示第二控制按钮(如:图4中的表格A下方的“对比合并”按钮),通过用户对第二控制按钮的点击、按压等操作,显示待选表格列表,用户可以根据需要选择合适的表格,在待选表格列表中,每一个表格待选项后面可以显示选择按钮,用户选择的表格后面的选择按钮中有“√”形显示,表示该表格已被选中,如图5所示,表格1为已选中表格,即表格1为第二文档,然后利用后端程序对表格1进行读取和逐行的数据信息提取,得到项目名和待填项的字典B。通过步骤102和步骤103将第一文档中的目标数据信息填充至第三文档中,即完成第一文档中的目标数据信息的移植,自动完成移植过程,提升工作效率,减少人工和时间的消耗。
需要说明的是,第二输入可以为用户对所述第一图像的按压、点击、滑动等输入,所述第二输入也可以为第二操作,在此不做具体限定。
可选的,所述步骤101包括:
获取第二图像;
接收用户对所述第二图像的第三输入;
响应于所述第三输入,通过图像识别技术将所述第二图像中的内容转换为第二文档;
识别并提取第二文档中的第二数据信息。
具体的,用户可以根据需要,对需要移植的表格进行拍照,获取关于表格的第二图像,并通过用户对第二图像的第三输入,可以在当前界面显示第一控制按钮,通过用户对第一控制按钮的点击、按压等操作,可以通过目标检测网络对第二图像进行处理,检测第二图像中的表格部分,并使用文字识别网络提取表格中的文字内容以及对应的行列信息,通过行列信息得到项目名和每一个项目名对应的待填项信息,根据得到项目名和每一个项目名对应 的待填项信息进行表格重建,得到重建后的电子表格B,即第二文档,所述第二文档的显示方式可以为横屏显示也可以为竖屏显示,在此不做具体限定。在得到第二文档之后,可以识别并提取所述第二数据信息。
在显示第二文档的界面上可以显示第二控制按钮,通过用户对第二控制按钮的点击、按压等操作,显示待选表格列表,用户可以根据需要选择合适的表格,在待选表格列表中,每一个表格待选项后面可以显示选择按钮,用户选择的表格后面的选择按钮中有“√”形显示,表示该表格已被选中,然后利用后端程序对已选中的表格进行读取和逐行的数据信息提取,得到项目名和待填项的字典A。通过步骤102和步骤103将第一文档中的目标数据信息填充至第三文档中,即完成第一文档中的目标数据信息的移植,自动完成移植过程,提升工作效率,减少人工和时间的消耗。
本申请上述实施例中,能够实现两个相似文档(如相似表格)之间的数据信息移植,对于具有一些相同项目名的表格,能够自动将已经填写的相关数据信息移植到新表格的对应位置,用户只需对新表格中特有的部分进行编辑填写即可,极大提升了工作效率;并且,还能够对电子设备端用户自行拍摄的表格图像进行对比,将纸质的填写过的内容填充到待填的电子表格中,实现了纸质材料电子化的功能,减少用户查询表格的时间。
综上所述,本申请实施例中,根据所述第二数据信息中的第一关键字,在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息,将所述第二数据信息与所述目标数据信息以预设格式进行合成,生成可编辑的目标文档,可以将相似表格的内容移植完全程序化,用户只需选择两个相似表格,即可一键完成内容的移植,无需自行打开编辑等操作,提升工作效率,减少人工和时间消耗。
需要说明的是,本申请实施例提供的文档处理方法,执行主体可以为文档处理装置,或者该文档处理装置中的用于执行加载文档处理方法的控制模块。本申请实施例中以文档处理装置执行加载文档处理方法为例,说明本申请实施例提供的文档处理方法。
如图6所示,本申请实施例还提供了一种文档处理装置60,包括:
第一获取模块61,用于获取第一文档的第一数据信息和第二文档的第二 数据信息;
第二获取模块62,用于根据所述第二数据信息中的第一关键字,在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息;
第一生成模块63,用于将所述第二数据信息与所述目标数据信息以预设格式进行合成,生成可编辑的目标文档;
第一显示模块64,用于显示所述目标文档。
可选的,所述装置还包括:
第一储存模块,用于将所述第一数据信息和所述第二数据信息以预设格式进行储存;
第一处理模块,用于将所述第二文档进行复制,获取复制后的第三文档;
其中,所述第一生成模块,包括:
第一生成单元,用于将储存的所述第一数据信息中的目标数据信息与储存的所述第二数据信息以所述预设格式进行合成,并填充至所述第三文档中,生成可编辑的目标文档。
可选的,所述第一获取模块61,包括:
第一接收单元,用于接收用户对N个文档的第一输入,所述N为大于或等于2的正整数;
第一响应单元,用于响应于所述第一输入,获取所述N个文档中的第一文档和第二文档;
第一处理单元,用于识别并提取所述第一文档中的第一数据信息以及所述第二文档中的第二数据信息。
可选的,所述第一获取模块61,包括:
第一获取单元,用于获取第一图像;
第二接收单元,用于接收用户对所述第一图像的第二输入;
第二响应单元,用于响应于所述第二输入,通过图像识别技术将所述第一图像中的内容转换为第一文档;
第二处理单元,用于识别并提取所述第一文档中的第一数据信息。
可选的,所述第一获取模块61,包括:
第二获取单元,用于获取第二图像;
第三接收单元,用于接收用户对所述第二图像的第三输入;
第三响应单元,用于响应于所述第三输入,通过图像识别技术将所述第二图像中的内容转换为第二文档;
第三处理单元,用于识别并提取第二文档中的第二数据信息。
本申请实施例中的文档处理装置可以是装置,也可以是终端中的部件、集成电路、或芯片。该装置可以是移动电子设备,也可以为非移动电子设备。示例性的,移动电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、可穿戴设备、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本或者个人数字助理(personal digital assistant,PDA)等,非移动电子设备可以为服务器、网络附属存储器(Network Attached Storage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。
本申请实施例中的文档处理装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为ios操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。
本申请实施例提供的文档处理装置能够实现图1至图5的方法实施例中文档处理装置实现的各个过程,为避免重复,这里不再赘述。
综上所述,本申请实施例中,第一获取模块61获取第一文档的第一数据信息和第二文档的第二数据信息,第二获取模块62根据所述第二数据信息中的第一关键字,在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息,第一生成模块63将所述第二数据信息与所述目标数据信息以预设格式进行合成,生成可编辑的目标文档,可以将相似表格的内容移植完全程序化,用户只需选择两个相似表格,即可一键完成内容的移植,无需自行打开编辑等操作,提升工作效率,减少人工和时间消耗。
可选的,本申请实施例还提供一种电子设备,包括处理器,存储器,存储在存储器上并可在所述处理器上运行的程序或指令,该程序或指令被处理器执行时实现上述文档处理方法实施例的各个过程,且能达到相同的技术效 果,为避免重复,这里不再赘述。
需要注意的是,本申请实施例中的电子设备包括上述所述的移动电子设备和非移动电子设备。
图7为实现本申请实施例的一种电子设备的硬件结构示意图。
该电子设备70包括但不限于:射频单元71、网络模块72、音频输出单元73、输入单元74、传感器75、显示单元76、用户输入单元77、接口单元78、存储器79、以及处理器80等部件。
本领域技术人员可以理解,电子设备70还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器80逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图7中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。
其中,输入单元74,用于获取第一文档的第一数据信息和第二文档的第二数据信息;
处理器80,用于根据所述第二数据信息中的第一关键字,在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息;
处理器80,用于将所述第二数据信息与所述目标数据信息以预设格式进行合成,生成可编辑的目标文档;
显示单元76,用于显示所述目标文档。
本申请上述实施例中,通过输入单元74获取第一文档的第一数据信息和第二文档的第二数据信息,处理器80根据所述第二数据信息中的第一关键字,在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息,将所述第二数据信息与所述目标数据信息以预设格式进行合成,生成可编辑的目标文档,能够解决用户对文档的内容进行移植时存在操作复杂繁琐且耗时耗力的问题,一键完成移植过程,提升工作效率,减少人工和时间的消耗。
可选的,所述存储器79用于:将所述第一数据信息和所述第二数据信息以预设格式进行储存;
所述处理器80,用于将所述第二文档进行复制,获取复制后的第三文档;
所述处理器80具体用于:
将储存的所述第一数据信息中的目标数据信息与储存的所述第二数据信息以所述预设格式进行合成,并填充至所述第三文档中,生成可编辑的目标文档。
可选的,所述输入单元74具体用于:
接收用户对N个文档的第一输入,所述N为大于或等于2的正整数;
所述处理器80具体用于:
响应于所述第一输入,获取所述N个文档中的第一文档和第二文档;
所述处理器80具体用于:
识别并提取所述第一文档中的第一数据信息以及所述第二文档中的第二数据信息。
可选的,所述输入单元74具体用于:
获取第一图像;
接收用户对所述第一图像的第二输入;
所述处理器80具体用于:
响应于所述第二输入,通过图像识别技术将所述第一图像中的内容转换为第一文档;
所述处理器80具体用于:
识别并提取所述第一文档中的第一数据信息。
可选的,所述输入单元74具体用于:
获取第二图像;
接收用户对所述第二图像的第三输入;
所述处理器80具体用于:
响应于所述第三输入,通过图像识别技术将所述第二图像中的内容转换为第二文档;
所述处理器80具体用于:
识别并提取第二文档中的第二数据信息。
综上所述,本申请实施例中,处理器80根据所述第二数据信息中的第一 关键字,在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息,将所述第二数据信息与所述目标数据信息以预设格式进行合成,生成可编辑的目标文档,可以将相似表格的内容移植完全程序化,用户只需选择两个相似表格,即可一键完成内容的移植,无需自行打开编辑等操作,提升工作效率,减少人工和时间消耗。
本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述文档处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述文档处理方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。
需要说明的是,应理解以上设备的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,第一获取模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上第一获取模块的功能。其它模块的实现与之类似。此外,这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指 令完成。
例如,各个模块、单元、子单元或子模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,ASIC),或,一个或多个微处理器(digital signal processor,DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(Central Processing Unit,CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,SOC)的形式实现。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求 所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

Claims (15)

  1. 一种文档处理方法,包括:
    获取第一文档的第一数据信息和第二文档的第二数据信息;
    根据所述第二数据信息中的第一关键字,在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息;
    将所述第二数据信息与所述目标数据信息以预设格式进行合成,生成可编辑的目标文档;
    显示所述目标文档。
  2. 根据权利要求1所述的方法,其中,在所述获取第一文档的第一数据信息和第二文档的第二数据信息之后,所述方法还包括:
    将所述第一数据信息和所述第二数据信息以预设格式进行储存;
    将所述第二文档进行复制,获取复制后的第三文档;
    其中,所述将所述第二数据信息与所述目标数据信息以预设格式进行合成,生成可编辑的目标文档,包括:
    将储存的所述第一数据信息中的目标数据信息与储存的所述第二数据信息以所述预设格式进行合成,并填充至所述第三文档中,生成可编辑的目标文档。
  3. 根据权利要求1所述的方法,其中,所述获取第一文档的第一数据信息和第二文档的第二数据信息,包括:
    接收用户对N个文档的第一输入,所述N为大于或等于2的正整数;
    响应于所述第一输入,获取所述N个文档中的第一文档和第二文档;
    识别并提取所述第一文档中的第一数据信息以及所述第二文档中的第二数据信息。
  4. 根据权利要求1所述的方法,其中,所述获取第一文档的第一数据信息,包括:
    获取第一图像;
    接收用户对所述第一图像的第二输入;
    响应于所述第二输入,通过图像识别技术将所述第一图像中的内容转换为第一文档;
    识别并提取所述第一文档中的第一数据信息。
  5. 根据权利要求1所述的方法,其中,获取第二文档的第二数据信息,包括:
    获取第二图像;
    接收用户对所述第二图像的第三输入;
    响应于所述第三输入,通过图像识别技术将所述第二图像中的内容转换为第二文档;
    识别并提取所述第二文档中的第二数据信息。
  6. 一种文档处理装置,包括:
    第一获取模块,用于获取第一文档的第一数据信息和第二文档的第二数据信息;
    第二获取模块,用于根据所述第二数据信息中的第一关键字,在所述第一数据信息中获取与所述第一关键字相匹配的第二关键字以及与所述第二关键字相关联的目标数据信息;
    第一生成模块,用于将所述第二数据信息与所述目标数据信息以预设格式进行合成,生成可编辑的目标文档;
    第一显示模块,用于显示所述目标文档。
  7. 根据权利要求6所述的文档处理装置,还包括:
    第一储存模块,用于将所述第一数据信息和所述第二数据信息以预设格式进行储存;
    第一处理模块,用于将所述第二文档进行复制,获取复制后的第三文档;
    其中,所述第一生成模块,包括:
    第一生成单元,用于将储存的所述第一数据信息中的目标数据信息与储存的所述第二数据信息以所述预设格式进行合成,并填充至所述第三文档中,生成可编辑的目标文档。
  8. 根据权利要求6所述的文档处理装置,其中,所述第一获取模块,包括:
    第一接收单元,用于接收用户对N个文档的第一输入,所述N为大于或等于2的正整数;
    第一响应单元,用于响应于所述第一输入,获取所述N个文档中的第一文档和第二文档;
    第一处理单元,用于识别并提取所述第一文档中的第一数据信息以及所述第二文档中的第二数据信息。
  9. 根据权利要求6所述的文档处理装置,其中,所述第一获取模块,包括:
    第一获取单元,用于获取第一图像;
    第二接收单元,用于接收用户对所述第一图像的第二输入;
    第二响应单元,用于响应于所述第二输入,通过图像识别技术将所述第一图像中的内容转换为第一文档;
    第二处理单元,用于识别并提取所述第一文档中的第一数据信息。
  10. 根据权利要求6所述的文档处理装置,其中,所述第一获取模块,包括:
    第二获取单元,用于获取第二图像;
    第三接收单元,用于接收用户对所述第二图像的第三输入;
    第三响应单元,用于响应于所述第三输入,通过图像识别技术将所述第二图像中的内容转换为第二文档;
    第三处理单元,用于识别并提取第二文档中的第二数据信息。
  11. 一种电子设备,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,其中,所述程序或指令被所述处理器执行时实现如权利要求1-5任一项所述的文档处理方法的步骤。
  12. 一种可读存储介质,其中,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1-5任一项所述的文档处理方法的步骤。
  13. 一种芯片,包括处理器和通信接口,其中,所述通信接口和所述处理器耦合,所述处理器用于运行程序,实现如权利要求1-5任一项所述的文档处理方法的步骤。
  14. 一种计算机程序产品,其中,所述程序产品被存储在非易失的存储介质中,所述程序产品被至少一个处理器执行以实现如权利要求1-5任一项所述的文档处理方法的步骤。
  15. 一种电子设备,其中,所述电子设备被配置为执行如权利要求1-5任一项所述的文档处理方法的步骤。
PCT/CN2021/090886 2020-04-29 2021-04-29 文档处理方法、装置及电子设备 WO2021219066A1 (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
EP21797263.7A EP4145334A4 (en) 2020-04-29 2021-04-29 DOCUMENT PROCESSING METHOD AND APPARATUS AND ELECTRONIC DEVICE
US17/975,590 US20230062959A1 (en) 2020-04-29 2022-10-27 Document processing method, apparatus and electronic device

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010354321.7 2020-04-29
CN202010354321.7A CN111563366A (zh) 2020-04-29 2020-04-29 文档处理方法、装置及电子设备

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US17/975,590 Continuation US20230062959A1 (en) 2020-04-29 2022-10-27 Document processing method, apparatus and electronic device

Publications (1)

Publication Number Publication Date
WO2021219066A1 true WO2021219066A1 (zh) 2021-11-04

Family

ID=72074466

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2021/090886 WO2021219066A1 (zh) 2020-04-29 2021-04-29 文档处理方法、装置及电子设备

Country Status (4)

Country Link
US (1) US20230062959A1 (zh)
EP (1) EP4145334A4 (zh)
CN (1) CN111563366A (zh)
WO (1) WO2021219066A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115562192A (zh) * 2022-09-27 2023-01-03 北京虎蜥信息技术有限公司 一种装配工艺图形化管理方法、系统、终端及存储介质

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111563366A (zh) * 2020-04-29 2020-08-21 维沃移动通信有限公司 文档处理方法、装置及电子设备
CN112380476A (zh) * 2020-11-17 2021-02-19 北京字跳网络技术有限公司 信息显示方法、装置和电子设备
CN112711936A (zh) * 2020-12-30 2021-04-27 维沃移动通信有限公司 信息显示方法、装置、设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101702242A (zh) * 2009-11-23 2010-05-05 中兴通讯股份有限公司 一种自动填写固定格式文件的方法及终端
US20100329577A1 (en) * 2009-06-24 2010-12-30 Fuji Xerox Co., Ltd. Image processing device
CN104933020A (zh) * 2015-07-17 2015-09-23 北京奇虎科技有限公司 基于模板生成目标文档的方法及装置
CN105740217A (zh) * 2014-12-08 2016-07-06 珠海金山办公软件有限公司 一种基于文档模板的文档生成方法及装置
CN111563366A (zh) * 2020-04-29 2020-08-21 维沃移动通信有限公司 文档处理方法、装置及电子设备

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7685144B1 (en) * 2005-12-29 2010-03-23 Google Inc. Dynamically autocompleting a data entry
US9785627B2 (en) * 2014-01-23 2017-10-10 Xerox Corporation Automated form fill-in via form retrieval
CN105205117B (zh) * 2015-09-09 2019-03-05 郑州悉知信息科技股份有限公司 一种数据表迁移方法和装置
US10095452B2 (en) * 2017-02-15 2018-10-09 Xerox Corporation Method and system for providing assistance by multi-function device for document preparation
CN110019478B (zh) * 2017-12-28 2020-04-03 贵州白山云科技股份有限公司 数据导入方法、介质、设备及装置
JP7353771B2 (ja) * 2019-02-28 2023-10-02 キヤノン株式会社 プログラム、記憶媒体、情報処理装置の制御方法、及び情報処理装置
CN110472209B (zh) * 2019-07-04 2024-02-06 深圳同奈信息科技有限公司 基于深度学习的表格生成方法、装置和计算机设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100329577A1 (en) * 2009-06-24 2010-12-30 Fuji Xerox Co., Ltd. Image processing device
CN101702242A (zh) * 2009-11-23 2010-05-05 中兴通讯股份有限公司 一种自动填写固定格式文件的方法及终端
CN105740217A (zh) * 2014-12-08 2016-07-06 珠海金山办公软件有限公司 一种基于文档模板的文档生成方法及装置
CN104933020A (zh) * 2015-07-17 2015-09-23 北京奇虎科技有限公司 基于模板生成目标文档的方法及装置
CN111563366A (zh) * 2020-04-29 2020-08-21 维沃移动通信有限公司 文档处理方法、装置及电子设备

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115562192A (zh) * 2022-09-27 2023-01-03 北京虎蜥信息技术有限公司 一种装配工艺图形化管理方法、系统、终端及存储介质

Also Published As

Publication number Publication date
US20230062959A1 (en) 2023-03-02
CN111563366A (zh) 2020-08-21
EP4145334A1 (en) 2023-03-08
EP4145334A4 (en) 2023-10-11

Similar Documents

Publication Publication Date Title
WO2021219066A1 (zh) 文档处理方法、装置及电子设备
US20140146200A1 (en) Entries to an electronic calendar
CN110659527B (zh) 电子表单中的表格检测
CN108108342B (zh) 结构化文本的生成方法、检索方法及装置
US20130191732A1 (en) Fixed Format Document Conversion Engine
US20170220858A1 (en) Optical recognition of tables
US8467613B2 (en) Automatic retrieval of object interaction relationships
CN107679208A (zh) 一种图片的搜索方法、终端设备及存储介质
WO2022134583A1 (zh) 一种保险数据信息的生成方法、装置、服务器及存储介质
US20150278248A1 (en) Personal Information Management Service System
WO2019042349A1 (zh) 操作系统框架的翻译方法、移动终端和存储装置
CN112667415B (zh) 数据调用方法、装置、可读存储介质及电子设备
CN107615270A (zh) 一种人机交互方法及其装置
CN104765849A (zh) 一种获取拷贝数据来源信息的方法和系统
CN111611813A (zh) 文档翻译方法、装置、电子设备及存储介质
CN107423291A (zh) 一种数据翻译方法以及客户端设备
CN107506407B (zh) 一种文件分类、调用的方法及装置
CN110647573B (zh) 基于数据库技术的图表可视化编辑方法和系统
CN106293658A (zh) 一种界面组件生成方法及其设备
CN105988986A (zh) 一种信息处理方法及装置
CN110597765A (zh) 一种大零售呼叫中心异构数据源数据处理方法及装置
US7848919B2 (en) Method and system of editing a language communication sheet
CN113238686B (zh) 文档处理方法、装置和电子设备
KR20220079029A (ko) 문서 기반 멀티 미디어 콘텐츠 자동 제작 서비스 제공 방법
CN108021648B (zh) 一种搜题的方法、装置及智能终端

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21797263

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2021797263

Country of ref document: EP

Effective date: 20221129