WO2019205308A1 - 信息的输入方法、装置、终端设备及介质 - Google Patents

信息的输入方法、装置、终端设备及介质 Download PDF

Info

Publication number
WO2019205308A1
WO2019205308A1 PCT/CN2018/096270 CN2018096270W WO2019205308A1 WO 2019205308 A1 WO2019205308 A1 WO 2019205308A1 CN 2018096270 W CN2018096270 W CN 2018096270W WO 2019205308 A1 WO2019205308 A1 WO 2019205308A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
input
character string
text
data entry
Prior art date
Application number
PCT/CN2018/096270
Other languages
English (en)
French (fr)
Inventor
孙成
叶俊锋
赖云辉
罗先贤
Original Assignee
平安科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 平安科技(深圳)有限公司 filed Critical 平安科技(深圳)有限公司
Publication of WO2019205308A1 publication Critical patent/WO2019205308A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Definitions

  • the present application belongs to the field of information processing technologies, and in particular, to a method, an apparatus, a terminal device, and a computer readable storage medium for inputting information.
  • the background server classifies the received data information to accurately determine the information category corresponding to each information. For example, the data information with the mailing address "Nanshan District” is taken as one information category, and the data information with the mailing address "Futian District” is taken as another information category.
  • the background server will identify it as “Nanshan Honghai Town” and cannot locate the data information.
  • the corresponding information category is “Nanshan District”. Therefore, in the prior art, the custom input mode of information has a problem that data maintenance is difficult.
  • the embodiment of the present application provides a method, an apparatus, a terminal device, and a computer readable storage medium for inputting information, so as to solve the problem that the data input difficulty is high in the custom input mode of the information in the prior art.
  • a first aspect of the embodiment of the present application provides a method for inputting information, including:
  • the character string being a reference character string provided by the information collecting party for different information categories, the character string including at least one of a single character, a phrase, and a phrase;
  • a second aspect of an embodiment of the present application provides an information input device, the identification device comprising means for performing an input method of the information described in the above first aspect.
  • a third aspect of the embodiments of the present application provides a terminal device, including a memory and a processor, where the computer stores computer readable instructions executable on the processor, the processor executing the computer The step of implementing the input method of the information as described in the first aspect when the instruction is read.
  • a fourth aspect of the embodiments of the present application provides a computer readable storage medium storing computer readable instructions, the computer readable instructions being executed by a processor to implement the first aspect as described in the first aspect The steps of the input method of the information.
  • each character string having a specification format provided by the information collecting party is collected in advance, and the character strings are stored in different data partition tables according to the information category to which each character string belongs, so that even if it is displayed
  • the text received by the user in the page can also quickly enter the corresponding data partition table to perform the search operation of the associated string according to the input box to which the text belongs, thereby avoiding the increase of the number of strings in the information database.
  • the resource consumption generated during the data search process improves the search efficiency of the associated string.
  • the text By replacing the text entered by the user in the input box with a matching character string, when the user inputs the customized text, the text can be automatically completed or formatted, thereby ensuring the statistical data.
  • the information category of the information is obtained, more accurate data classification results can be obtained, thereby reducing the difficulty of data maintenance.
  • FIG. 3 is a specific implementation flowchart of an input method S106 of information provided by an embodiment of the present application.
  • FIG. 5 is a structural block diagram of an input device for information provided by an embodiment of the present application.
  • FIG. 6 is a schematic diagram of a terminal device according to an embodiment of the present application.
  • FIG. 1 shows an implementation flow of an input method of information provided by an embodiment of the present application, and the method flow includes steps S101 to S107.
  • the specific implementation principles of each step are as follows:
  • S101 Acquire a character string pre-stored in the information database, the character string is a reference character string provided by the information collecting party for different information categories, and the character string includes at least one of a single character, a phrase, and a phrase.
  • the information database is used to store a plurality of character strings collected in advance.
  • These strings are reference strings provided by the information collector for different information categories, and are formatted data information, that is, each string has a data format in which the background server can accurately identify its information category. That is to say, the background server can determine one or more information categories corresponding to the string in a plurality of preset information categories. For example, if the character string is “Nanshan District” and the two preset information categories are “Region” and “Telephone”, it can be identified that the information category corresponding to the character string “Nanshan District” is “Region”.
  • the character string in the information database may be collected from the historical receiving information of the information input page, or collected from the historical input information of other business systems that are pre-connected, and the history is determined by a preset algorithm.
  • the information is received for format conversion processing to obtain a character string for storage in the information database.
  • the strings in the information database can also be determined based on text input instructions issued by the information collector.
  • each information category corresponding to each input box is created, and each information category is tagged according to the setting instruction issued by the information collection and release.
  • each character string in the information database is identified and processed by a preset matching algorithm, so that the information categories to which the respective character strings belong are detected in the plurality of information categories that have been created.
  • Each character string is associated with the tag according to the tag corresponding to the information category to which it belongs, so that the user can determine each tag based on the tag associated with the string. The category of information to which the string belongs.
  • S104 Store the character string into the corresponding data partition table according to the label associated with the character string.
  • the storage space of the information database is divided into a plurality of data partition tables by using a table partitioning function provided by the information database.
  • the number of data partition tables is the same as the number of created information categories, so that each data partition table corresponds to an information category.
  • the information category to which the string belongs is determined, and the string is stored to a data partition table corresponding to the information category. For example, if a character string is “Guangdong City” and the information category to which it belongs is a province, the “Guangdong City” is stored in a data partition table corresponding to the “province”.
  • the character string is added to the data partition table corresponding to each of the information categories.
  • S105 Acquire text input by the information input party in an input box of the display page; wherein the input box is associated with one type of information category.
  • the display page is used to display various browsing information for the user, and there are multiple input boxes in the display page, and each input box is used to provide an input interface for various types of text information for the user.
  • the function attribute of the currently displayed page multiple input boxes corresponding to the function attributes are respectively loaded. For example, if the function attribute of the currently displayed page is the express order page, an input box for obtaining the order number information, an input box for obtaining the sender information, and an input box for obtaining the recipient information are loaded. It can be understood that each input box is associated with any of the previously established categories of information.
  • the label corresponding to the information category is displayed in the vicinity of the input box, so that the user can determine the current required input in the input box based on the label.
  • Text information is displayed in the vicinity of the input box, so that the user can determine the current required input in the input box based on the label.
  • each character included in the input box is read, and each character is determined as the current time information input party is input in the input box of the display page. Text.
  • FIG. 2 shows a specific implementation flow of the information input method S105 provided by the embodiment of the present application, which is described in detail as follows:
  • S1051 Generate a first data entry template according to each of the input boxes included in the display page, and create an information field corresponding to each of the input boxes in the first data entry template.
  • the data entry template is used to obtain the text that the information entry party needs to enter.
  • the data entry template includes multiple information fields, and each information field corresponds to an input box in the display page, and the header attribute value of the information field is the same as the label of the input box.
  • the above data entry template may be a file template displayed in a tabular form, for example, an Excel file containing a plurality of columns of data.
  • an information field included in the Excel file is a list field in the Excel file, and the attribute values of the other table fields are null except for the header field.
  • S1052 Publish the first data entry template, so that the information input party downloads the first data entry template, and causes the information input party to input text into each of the first data entry templates. After the information field is described, the second data entry template is obtained.
  • the created data is entered into a template for publishing, so that the data entry template is displayed on the display page as an attachment.
  • the information input party issues an attachment download instruction in the display page, the information input party can download and open the data entry template.
  • the data entry template including multiple information fields, according to the attribute value of the header field, the information input party determines the input box corresponding to each information field, and inputs the text originally required to be input in the input box into the current The data is entered into the template.
  • the sender will be present in the data entry template downloaded by the information input party.
  • the attribute value of the first field in the information field A is "sender address”
  • the attribute values of the remaining fields are null values, so that the information input party can sequentially in each information field A whose attribute value is null, respectively Enter multiple different sender address information.
  • the attribute value of the first field in the information field B is "sender phone", and the attribute values of the remaining fields are null, so that the information entry party can sequentially perform the information field B with the attribute value as a null value. In the middle, enter multiple different sender phone information.
  • the attribute value of each information field having the same number of rows corresponds to a complete data record, that is, the attribute values of each information field with the same number of rows are respectively indicated in an information input process, and the information input party is respectively in each input box.
  • the data entry template including the respective texts is saved.
  • the data entry template originally published in the display page becomes the first data entry template, and the updated data entry template is saved as the second data entry template.
  • S1053 Acquire the second data entry template imported by the information input party in the display page.
  • the second data entry template uploaded by the information input party is obtained.
  • S1054 In the second data entry template, extract the text in each of the information fields, and fill the text into the input box corresponding to the information field.
  • Parsing the received second data entry template Specifically, each data record in the second data entry template is sequentially read, and attribute values of respective information fields in the data record are obtained. The attribute value of the information field is filled into the input box according to the input box corresponding to each information field in the display page.
  • each attribute value in the corresponding information field is displayed in the form of a pull-down table in each input box of the display page.
  • the information input party can manually import a plurality of data records that are required to be input into the display page in the data entry template, thereby improving information. Input efficiency; since each information field in the data entry template is pre-associated with an input box, thereby ensuring that the information input party can accurately locate each input box in the display page after inputting the text in the data entry template The filled text, therefore, improves the accuracy of the information entered.
  • the data partition table corresponding to the information category For each text included in the input box, according to the information category associated with the input box, in the data partition table corresponding to the information category, it is searched whether the character string matching the text exists. Specifically, according to the preset text similarity calculation algorithm, it is determined whether the similarity between any of the character strings in the data partition table and the current text is greater than a preset threshold. If the result of the determination is yes, it is determined that the string is a string that matches the current text.
  • the above text similarity calculation algorithms include, but are not limited to, a cosine similarity algorithm, a probability distribution distance algorithm, and a Euclidean distance algorithm.
  • FIG. 3 shows a specific implementation process of the input method S106 of the information provided by the embodiment of the present application, which is described in detail as follows:
  • S1061 Perform conversion processing on each of the character strings in the data partition table corresponding to the information category associated with the input box, to obtain a first vector matrix corresponding to each of the character strings.
  • S1062 Generate a second vector matrix corresponding to the text.
  • each of the pre-stored character strings is read in the data partition table corresponding to the information category associated with the input box.
  • Each of these strings is subjected to word segmentation to obtain the respective participles constituting the string.
  • the above participles can be single characters or multiple characters.
  • the column vectors of each participle are respectively searched, and the column vectors of each participle are composed into a vector matrix.
  • Each column of the vector matrix corresponds to a column vector
  • the word vector database is a database for recording the correspondence between words and column vectors.
  • the column vector may be, for example, a corresponding word vector obtained by training words according to the word2vec model.
  • the text contained in the current input box is converted to obtain a vector matrix corresponding to the text.
  • the vector matrix corresponding to the character string is the first vector matrix
  • the vector matrix corresponding to the text is referred to as the second vector matrix.
  • S1063 Calculate a coupling degree of the second vector matrix and each of the first vector matrix respectively, and determine the character string corresponding to the first vector matrix in which the coupling degree is the highest.
  • the degree of similarity between the character string and the text is measured by the degree of coupling of the first vector matrix and the second vector matrix.
  • N N is an integer greater than zero
  • the second vector matrix and the N of the N first vector matrices may be separately calculated. Coupling degree. After finding a first vector matrix with the highest degree of coupling, the string corresponding to the first vector matrix is determined to match the text string.
  • the foregoing step S1063 specifically includes: calculating a coupling degree of the second vector matrix and the first vector matrix sorted to n according to the following formula:
  • tanh is a hyperbolic tangent function
  • BkWdWt is a preset weight coefficient
  • WdLength n is a total number of word lengths of the character string corresponding to the first vector matrix sorted as n
  • WdLength input is the second vector matrix
  • the total number of word lengths of the corresponding string, VecTol input and VecTol n are respectively the first vector matrix and the total number of elements included in the first vector matrix sorted as n
  • Vec input, i is the i-th in the first vector matrix
  • the element values, Vec n,j are the j-th element values in the first vector matrix; i, j, and n are integers greater than zero.
  • the degree of coupling between the character string and the text is accurately calculated in a digital form, thereby improving characters.
  • the accuracy of the similarity calculation between the string and the text is determined by determining the character string corresponding to the first vector matrix having the highest degree of coupling as a string matching the text, thereby ensuring that the retrieved character string is input by the current information input party.
  • the text can have a stronger degree of relevance, thereby enabling a more accurate information entry effect when subsequently performing a text replacement operation.
  • the text included in the current input box is replaced with a string matching the text, that is, the text displayed in the input box in real time is changed to the character string.
  • the text in the input box is replaced with any matching string, and the remaining strings are sequentially displayed in the form of bubble prompts above the input box.
  • the candidate text for the current input box is made.
  • the information recorder When the information recorder sees the text displayed in the input box, it can be determined whether the text is the same as the text semantics that it needs to express. If yes, the information input party issues a determination command; if not, the information input party issues a rejection instruction.
  • the character string included in the input box is determined as the input information received from the input box at the current time. If the rejection instruction issued by the information input party is received, the next candidate text of the input box is used as the character string matched by the current time, and the execution of the above-mentioned text in the input box is replaced with the matched character string, and When the confirmation command issued by the information input party is received, the matched character string is determined as the step of inputting the information in the input box.
  • each character string having a specification format provided by the information collecting party is collected in advance, and the character strings are stored in different data partition tables according to the information category to which each character string belongs, so that even if it is displayed
  • the text received by the user in the page can also quickly enter the corresponding data partition table to perform the search operation of the associated string according to the input box to which the text belongs, thereby avoiding the increase of the number of strings in the information database.
  • the resource consumption generated during the data search process improves the search efficiency of the associated string.
  • the method further includes:
  • S1055 Generate the error prompt information if the character string matching the text does not exist in the text included in any of the input boxes.
  • the text included in any input box is determined to match the text only when the data partition table determines a character string whose similarity with the text is greater than a preset threshold. If there is no string with the similarity of the text in the data partition table that is greater than the preset threshold, it means that there is no string matching the text. At this time, it is determined that the text included in the second data entry template has a format error. The problem, therefore, generates an error message.
  • the above error prompt information is used to describe the cause of the current error.
  • the text length exceeds the preset range value, or there is no address information or the like corresponding to the text.
  • S1056 Add the error prompt information to the second data entry template, and mark the information field to which the text belongs in the second data entry template to obtain a third data entry template.
  • the second data entry template uploaded by the information input party is reloaded, and the text that does not match any of the character strings is located in the second data entry template.
  • the entire column of information fields is marked according to the information field to which the text belongs in the second data entry template.
  • the marking methods include, but are not limited to, color marking, font bold marking, and field background color marking.
  • the positioned text is annotated to add the above error prompt information to the annotation content.
  • S1057 Output the third data entry template, so that the information input party returns to perform the obtaining the information based on the error prompt information included in the third data entry template and the information field of the markup.
  • the modified data entry template is obtained, and the data entry template is referred to as a third data entry template.
  • the third data entry template is posted on the display page, so that the information input party downloads the third data entry template after receiving the error prompt information popped up in the display page.
  • the information value of each information field is re-entered, and the data created again is entered into the template for import. At this time, the execution is returned. The above S1053.
  • the embodiment of the present application when it is detected that the character string matching the text does not exist in the data partition table, the error prompt information is added to the data entry template, and the information field to which the text belongs is marked, so that the information input party The information input error can be accurately understood, and the position of the error text can be accurately located, so that the input of the text can be quickly corrected, and the information input operation is performed again. Therefore, the embodiment of the present application also improves the batch text to a certain extent. Input efficiency.
  • FIG. 5 is a structural block diagram of the input device of the information provided by the embodiment of the present application. For the convenience of explanation, only the parts related to the present embodiment are shown.
  • the apparatus includes:
  • the first obtaining unit 51 is configured to acquire a character string pre-stored in the information database, where the character string is a reference character string provided by the information collecting party for different information categories, where the character string includes a single character, a phrase, and a phrase. At least one of them.
  • the association unit 52 is configured to associate, for the character string, a label for indicating the information category to which the character string belongs.
  • the establishing unit 53 is configured to respectively establish a corresponding data partition table for each of the information categories.
  • the storage unit 54 is configured to store the character string to the corresponding data partition table according to the label associated with the character string.
  • the second obtaining unit 55 is configured to obtain text input by the information input party in an input box of the display page; wherein the input box is associated with one type of information category.
  • the retrieval unit 56 is configured to retrieve the character string matching the text in the data partition table corresponding to the information category associated with the input box.
  • a replacing unit 57 configured to replace the text in the input box with the matched character string, and determine the matched character string when receiving the confirmation instruction sent by the information input party The information entered in the input box.
  • the retrieving unit 56 includes:
  • a conversion subunit configured to perform conversion processing on each of the character strings in the data partition table corresponding to the information category associated with the input box, to obtain a first vector corresponding to each of the character strings respectively matrix.
  • Calculating a subunit configured to separately calculate a degree of coupling between the second vector matrix and each of the first vector matrices, and determine the character string corresponding to the first vector matrix in which the degree of coupling is the highest.
  • the calculating subunit is specifically configured to:
  • tanh is a hyperbolic tangent function
  • BkWdWt is a preset weight coefficient
  • WdLength n is a total number of word lengths of the character string corresponding to the first vector matrix sorted as n
  • WdLength input is the second vector matrix
  • the total number of word lengths of the corresponding string, VecTol input and VecTol n are respectively the first vector matrix and the total number of elements included in the first vector matrix sorted as n
  • Vec input, i is the i-th in the first vector matrix
  • the element values, Vec n,j are the j-th element values in the first vector matrix; i, j, and n are integers greater than zero.
  • the second obtaining unit 55 includes:
  • a sub-unit is configured to generate a first data entry template according to each of the input boxes included in the display page, and create an information field corresponding to each of the input boxes in the first data entry template.
  • a publishing subunit configured to publish the first data entry template, so that the information input party downloads the first data entry template, and causes the information input party to input text into the first data entry After each of the information fields of the template, a second data entry template is obtained.
  • the obtaining subunit is configured to obtain the second data entry template imported by the information input party in the display page.
  • a padding unit configured to extract, in the second data entry template, the text in each of the information fields, and fill the text into the input box corresponding to the information field.
  • the input device of the information further includes:
  • the error prompting unit is configured to generate error prompt information if the character string matching the text does not exist in the text included in any of the input boxes.
  • a adding unit configured to add the error prompt information to the second data entry template, and perform marking processing on the information field to which the text belongs in the second data entry template to obtain a third data entry template.
  • an output unit configured to output the third data entry template, so that the information input party returns to perform the obtaining based on the error prompt information included in the third data entry template and the information field of the markup The operation of the second data entry template imported by the information entry party in the display page.
  • FIG. 6 is a schematic diagram of a terminal device according to an embodiment of the present application.
  • the terminal device 6 of this embodiment includes a processor 60 and a memory 61 in which computer readable instructions 62, such as information input programs, executable on the processor 60 are stored. .
  • the processor 60 executes the steps of the input method embodiment of the respective information when the computer readable instructions 62 are executed, such as steps 101 to 107 shown in FIG.
  • the processor 60 when executing the computer readable instructions 62, implements the functions of the various modules/units in the various apparatus embodiments described above, such as the functions of the units 51 through 57 shown in FIG.
  • the computer readable instructions 62 may be partitioned into one or more modules/units that are stored in the memory 61 and executed by the processor 60, To complete this application.
  • the one or more modules/units may be a series of computer readable instruction segments capable of performing a particular function, the instruction segments being used to describe the execution of the computer readable instructions 62 in the terminal device 6.
  • the terminal device 6 may be a computing device such as a desktop computer, a notebook, a palmtop computer, and a cloud server.
  • the terminal device may include, but is not limited to, the processor 60 and the memory 61. It will be understood by those skilled in the art that FIG. 6 is only an example of the terminal device 6, and does not constitute a limitation of the terminal device 6, and may include more or less components than those illustrated, or combine some components or different components.
  • the terminal device may further include an input/output device, a network access device, a bus, and the like.
  • the so-called processor 60 may be a central processing unit (CPU), or may be other general-purpose processors, a digital signal processor (DSP), an application specific integrated circuit (ASIC), Field-Programmable Gate Array (FPGA) or other programmable logic device, discrete gate or transistor logic device, discrete hardware components, etc.
  • the general purpose processor may be a microprocessor or the processor or any conventional processor or the like.
  • the memory 61 may be an internal storage unit of the terminal device 6, such as a hard disk or a memory of the terminal device 6.
  • the memory 61 may also be an external storage device of the terminal device 6, for example, a plug-in hard disk equipped on the terminal device 6, a smart memory card (SMC), and a secure digital (SD). Card, flash card, etc. Further, the memory 61 may also include both an internal storage unit of the terminal device 6 and an external storage device.
  • the memory 61 is configured to store the computer readable instructions and other programs and data required by the terminal device.
  • the memory 61 can also be used to temporarily store data that has been output or is about to be output.
  • each functional unit in each embodiment of the present application may be integrated into one processing unit, or each unit may exist physically separately, or two or more units may be integrated into one unit.
  • the above integrated unit can be implemented in the form of hardware or in the form of a software functional unit.
  • the integrated unit if implemented in the form of a software functional unit and sold or used as a standalone product, may be stored in a computer readable storage medium.
  • a computer readable storage medium A number of instructions are included to cause a computer device (which may be a personal computer, server, or network device, etc.) to perform all or part of the steps of the methods described in various embodiments of the present application.
  • the foregoing storage medium includes: a U disk, a mobile hard disk, a read-only memory (ROM), a random access memory (RAM), a magnetic disk, or an optical disk, and the like, which can store program codes. .

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

一种信息的输入方法、装置、终端设备及介质,适用于信息处理技术领域,该方法包括:获取预存储于信息数据库中的字符串(S101);为字符串关联用于标示字符串所属信息类别的标签(S102);分别为每一信息类别建立对应的数据分区表(S103);根据字符串所关联的标签,将字符串存储至对应的数据分区表(S104);获取信息录入方在显示页面的输入框中输入的文本(S105);在与输入框关联的信息类别对应的数据分区表中,检索与文本匹配的字符串(S106);将输入框中的文本替换为匹配到的字符串,并在接收到信息录入方发出的确认指令时,将匹配到的字符串确定为录入于输入框中的信息(S107)。该方案将用户输入的文本进行补全或者格式规范化处理,能够得到准确的数据分类结果,降低了数据维护的难度。

Description

信息的输入方法、装置、终端设备及介质
本申请要求于2018年04月27日提交中国专利局、申请号为201810392820.8、发明名称为“信息的输入方法、终端设备及介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请属于信息处理技术领域,尤其涉及一种信息的输入方法、装置、终端设备及计算机可读存储介质。
背景技术
用户在浏览网页或登录各类移动应用时,通常都会遇到需要在显示页面的指定区域中录入信息的情况。例如,在快递寄件页面,用户需要录入收件人姓名以及收件人地址信息等。为了便于管理用户所输入的数据信息,后台服务器会对接收到的数据信息进行分类处理,以准确确定各项信息所对应的信息类别。例如,将寄件地址为“南山区”的数据信息作为一个信息类别,将寄件地址为“福田区”的数据信息作为另一信息类别。
然而,若用户在指定区域中录入信息时输入了不规范的信息,如,输入“南山红海镇”,则会导致后台服务器将其识别为“南山红海镇”,而无法定位该项数据信息所对应的信息类别为“南山区”。因此,现有技术中,信息的自定义输入方式存在数据维护难度较高的问题。
技术问题
有鉴于此,本申请实施例提供了一种信息的输入方法、装置、终端设备及计算机可读存储介质,以解决现有技术中信息的自定义输入方式存在数据维护难度较高的问题。
技术解决方案
本申请实施例的第一方面提供了一种信息的输入方法,包括:
获取预存储于信息数据库中的字符串,所述字符串为信息采集方针对不同的信息类别所提供的参考字符串,所述字符串包括单字符、词组以及短语中的至少一种;
为所述字符串关联用于标示所述字符串所属信息类别的标签;
分别为每一所述信息类别建立对应的数据分区表;
根据所述字符串所关联的所述标签,将所述字符串存储至对应的所述数据分区表;
获取信息录入方在显示页面的输入框中输入的文本;其中,所述输入框关联有一类信息类别;
在与所述输入框关联的所述信息类别对应的所述数据分区表中,检索与所述文本匹配的所述字符串;
将所述输入框中的所述文本替换为匹配到的所述字符串,并在接收到所述信息录入方发出的确认指令时,将匹配到的所述字符串确定为录入于所述输入框中的信息。
本申请实施例的第二方面提供了一种信息的输入装置,所述识别装置包括用于执行上述第一方面所述的信息的输入方法的单元。
本申请实施例的第三方面提供了一种终端设备,包括存储器以及处理器,所述存储器中存储有可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现如第一方面所述的信息的输入方法的步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如第一方面所述的信息的输入方法的步骤。
有益效果
本申请实施例中,通过预先收集信息采集方所提供的具有规范格式的各个字符串,并根据各个字符串所属的信息类别,将这些字符串存储于不同的数据分区表,使得即使是在显示页面中接收到用户自定义输入的文本,也能够根据文本所属的输入框,快速地进入对应的数据分区表进行关联字符串的查找操作,避免了因信息数据库中字符串数目过多而增大了数据查找过程中所产生的资源消耗,因此,提高了关联字符串的查找效率。通过将用户在输入框中所输入的文本替换为匹配的字符串,实现了在用户输入自定义的文本时,能够自动将该文本进行补全或者进行格式规范化处理,因此,保证了在统计数据信息的信息类别时,可以得到较为准确的数据分类结果,故降低了数据维护的难度。
附图说明
图1是本申请实施例提供的信息的输入方法的实现流程图;
图2是本申请实施例提供的信息的输入方法S105的具体实现流程图;
图3是本申请实施例提供的信息的输入方法S106的具体实现流程图;
图4是本申请另一实施例提供的信息的输入方法的实现流程图;
图5是本申请实施例提供的信息的输入装置的结构框图;
图6是本申请实施例提供的终端设备的示意图。
本发明的实施方式
为了说明本申请所述的技术方案,下面通过具体实施例来进行说明。
图1示出了本申请实施例提供的信息的输入方法的实现流程,该方法流程包括步骤S101至S107。各步骤的具体实现原理如下:
S101:获取预存储于信息数据库中的字符串,所述字符串为信息采集方针对不同的信 息类别所提供的参考字符串,所述字符串包括单字符、词组以及短语中的至少一种。
本申请实施例中,信息数据库用于存储预先收集得到的多个字符串。这些字符串为信息采集方针对不同的信息类别所提供的参考字符串,为格式化处理后的数据信息,即,每一字符串具有后台服务器能够准确识别其信息类别的数据格式。也就是说,后台服务器能够在多个预设的信息类别中,确定出字符串所对应的一个或多个信息类别。例如,若字符串为“南山区”,预设的两个信息类别为“地区”以及“电话”,则可识别出该字符串“南山区”所对应的信息类别为“地区”。
本申请实施例中,上述信息数据库中的字符串可从信息录入页面的历史接收信息中收集,或者,从预先对接的其他业务系统的历史录入信息中收集之后,通过预设算法来对该历史接收信息进行格式化转换处理,以得到用于存储于信息数据库中的字符串。
特别地,信息数据库中的字符串还可以根据信息采集方所发出的文本输入指令来确定。
S102:为所述字符串关联用于标示所述字符串所属信息类别的标签。
针对显示页面中所存在的多个输入框,分别创建对应每一输入框的一个信息类别,并根据信息采集放所发出的设置指令,为每一信息类别打上相应的标签。
本申请实施例中,通过预设的匹配算法,对信息数据库中的各个字符串进行识别处理,以在已创建的多个信息类别中,检测出各个字符串所属的信息类别。对每一字符串,根据其所属的信息类别所对应的标签,将该字符串与该标签进行关联存储,由此使得用户在查看每一字符串时,能够基于字符串所关联的标签来确定该字符串所属的信息类别。
S103:分别为每一所述信息类别建立对应的数据分区表。
S104:根据所述字符串所关联的所述标签,将所述字符串存储至对应的所述数据分区表。
本申请实施例中,利用信息数据库所提供的表分区功能,将上述信息数据库的存储空间分为多个数据分区表。其中,数据分区表的数目与已创建的信息类别的数目相同,以使每一数据分区表与一信息类别对应。
对于每一字符串,根据其关联的标签,确定该字符串所属的信息类别,并将该字符串存储至对应与该信息类别对应的数据分区表。例如,若存在一字符串为“广东省”,其所属的信息类别为省份,则将该“广东省”存储至“省份”所对应的一个数据分区表中。
特别地,若存在对应多个信息类别的字符串,则在其中每一信息类别所对应的数据分区表中,均添加该字符串。
S105:获取信息录入方在显示页面的输入框中输入的文本;其中,所述输入框关联有一类信息类别。
本申请实施例中,显示页面用于为用户展示各类浏览信息,且显示页面中存在有多个输入框,每一输入框用于为用户提供各类文本信息的输入接口。根据当前显示页面的功能属性,分别加载对应该功能属性的多个输入框。例如,若当前显示页面的功能属性为快递订单页面,则加载用于获取订单编号信息的输入框、获取寄件人信息的输入框以及获取收件人信息的输入框等。可以理解的是,每一输入框与上述预先建立的任一信息类别关联。
优选地,根据每一输入框所关联的信息类别,将该信息类别所对应的标签显示于该输入框的邻近位置,以使用户基于该标签,能够确定当前所需输入于该输入框中的文本信息。
本申请实施例中,当在显示页面中检测到信息提交请求时,读取输入框中所包含的各个字符,将所述各个字符确定为当前时刻信息录入方在显示页面的输入框中所输入的文本。
作为本申请的一个实施例,图2示出了本申请实施例提供的信息的输入方法S105的具体实现流程,详述如下:
S1051:根据所述显示页面所包含的各个所述输入框,生成第一数据录入模板,并在所述第一数据录入模板中分别创建与各个所述输入框对应的信息字段。
根据信息收集方所发出的设置指令,创建一数据录入模板。数据录入模板用于获取信息录入方所需输入的文本。本申请实施例中,数据录入模板中包含多个信息字段,每一信息字段对应显示页面中的一个输入框相对应,且该信息字段的表头属性值与该输入框的标签相同。
上述数据录入模板可以是以表格形式展示的文件模板,例如,可以是包含多列数据的Excel文件。当数据录入模板为基于Excel文件的文件模板时,其所包含的一信息字段为Excel文件中的一列表格字段,且除了表头字段之外,其余各个表格字段的属性值均为空值。
S1052:对所述第一数据录入模板进行发布,以使所述信息录入方下载所述第一数据录入模板,并使所述信息录入方将文本输入于所述第一数据录入模板的各个所述信息字段后,得到第二数据录入模板。
本申请实施例中,将上述创建完成的数据录入模板进行发布,以使该数据录入模板以附件形式展示于显示页面。当信息录入方在显示页面中发出附件下载指令时,信息录入方可以下载并打开该数据录入模板。在包含多个信息字段的数据录入模板中,根据表头字段的属性值,信息录入方确定出每一信息字段所对应的输入框,并将原本需要输入于输入框中的文本输入于当前的数据录入模板中。
例如,在上述示例中,若显示页面的两个输入框所分别对应的标签为寄件人地址以及寄件人电话,则在信息录入方所下载的数据录入模板中,将存在“寄件人地址”所对应的一列信息字段A以及“寄件人电话”所对应的一列信息字段B。信息字段A中的首个字段的 属性值为“寄件人地址”,其余各个字段的属性值为空值,以使得信息录入方能够依次在属性值为空值的各个信息字段A中,分别输入多个不同的寄件人地址信息。同理,信息字段B中的首个字段的属性值为“寄件人电话”,其余各个字段的属性值为空值,以使得信息录入方能够依次在属性值为空值的各个信息字段B中,分别输入多个不同的寄件人电话信息。
其中,所属行数相同的各个信息字段的属性值对应一条完整的数据记录,即,行数相同的各个信息字段的属性值分别表示在一次信息输入过程中,信息录入方分别在各个输入框中所输入的文本。
本申请实施例中,当信息录入方在数据录入模板中输入完成各项文本后,对包含所述各项文本的数据录入模板进行保存。为了便于区分,将原本发布于显示页面中的数据录入模板成为第一数据录入模板,将保存更新后的数据录入模板成为第二数据录入模板。
S1053:获取所述信息录入方在所述显示页面中所导入的所述第二数据录入模板。
若在显示页面中检测到文本批量导入指令,则获取信息录入方所上传的第二数据录入模板。
S1054:在所述第二数据录入模板中,提取每一所述信息字段中的所述文本,并将所述文本填充至该信息字段所对应的所述输入框。
对接收到的第二数据录入模板进行解析处理。具体地,依次读取第二数据录入模板中的每一条数据记录,并获取该数据记录中各个信息字段的属性值。根据每一信息字段在显示页面中所对应的输入框,将该信息字段的属性值填充至该输入框。
优选地,若第二数据录入模板中包含一条以上的数据记录,则在显示页面的每一输入框中,以下拉表格的形式展示其对应的信息字段中的各个属性值。
本申请实施例中,通过发布包含多个信息字段的数据录入模板,使得信息录入方能够在数据录入模板中,批量地导入所需输入于显示页面中的多条数据记录,故提高了信息的输入效率;由于数据录入模板中的每一信息字段均与一输入框预先关联,由此保证了信息录入方在数据录入模板中输入文本后,能够准确地定位出显示页面中各输入框所需填充的文本,因此,提高了信息的录入准确度。
S106:在与所述输入框关联的所述信息类别对应的所述数据分区表中,检索与所述文本匹配的所述字符串。
本申请实施例中,对于输入框中所包含的每一文本,根据该输入框所关联的信息类别,在该信息类别对应的数据分区表中,查找是否存在于该文本匹配的字符串。具体地,根据预设的文本相似度计算算法,判断数据分区表中的任一字符串与当前文本的相似度是否大于预设阈值。若判断结果为是,则确定该字符串为与当前文本匹配的字符串。上述文本相似度计 算算法包括但不限于余弦相似度算法、概率分布距离算法以及欧式距离算法等。
优选地,作为本申请的一个实施例,图3示出了本申请实施例提供的信息的输入方法S106的具体实现流程,详述如下:
S1061:在与所述输入框关联的所述信息类别对应的所述数据分区表中,对各个所述字符串进行转换处理,得到各个所述字符串所分别对应的第一向量矩阵。
S1062:生成所述文本对应的第二向量矩阵。
本申请实施例中,在与所述输入框关联的所述信息类别对应的所述数据分区表中,读取预存储的各个字符串。对其中的每一字符串,将其进行分词处理,得到构成该字符串的各个分词。上述分词可以为单字符,也可以为多字符。在预设的词向量数据库中,分别查找各个分词的列向量,并将各个分词的列向量组成向量矩阵。其中,向量矩阵的每一列均对应一个列向量,词向量数据库为记录词语与列向量之间的对应关系的数据库。列向量例如可以是根据word2vec模型训练词语所得到对应的词向量。同理,基于上述方式,对当前输入框中所包含的文本进行转换处理,以得到该文本对应的向量矩阵。
本申请实施例中,将字符串对应的向量矩阵成为第一向量矩阵,将文本对应的向量矩阵称为第二向量矩阵。
S1063:分别计算所述第二向量矩阵与各个所述第一向量矩阵的耦合度,并确定出其中所述耦合度最高的所述第一向量矩阵所对应的所述字符串。
本申请实施例中,以第一向量矩阵以及第二向量矩阵的耦合度来度量字符串以及文本之间的相似度。对于信息数据库中所存储的N(N为大于零的整数)个字符串,根据每一字符串所对应的第一向量矩阵,可分别计算出第二向量矩阵与N个第一向量矩阵的N个耦合度。查找出其中耦合度最高的一个第一向量矩阵后,将该第一向量矩阵所对应的字符串确定出与文本匹配字符串。
优选地,作为本申请的一个实施例,上述步骤S1063具体包括:根据下式计算所述第二向量矩阵与排序为n的所述第一向量矩阵的耦合度:
Figure PCTCN2018096270-appb-000001
其中,tanh为双曲正切函数,BkWdWt为预设的权重系数,WdLength n为排序为n的所述第一向量矩阵所对应的字符串的字长总数,WdLength input为所述第二向量矩阵所对应的字符串的字长总数,VecTol input以及VecTol n分别为第一向量矩阵以及排序为n的所述第一向量矩阵所包含的元素总数,Vec input,i为第一向量矩阵中的第i个元素值,Vec n,j为第一向量 矩阵中的第j个元素值;i、j以及n均为大于零的整数。
本申请实施例中,通过将输入框中的文本以及信息数据库中的各个字符串均转换为向量矩阵,实现了以数字形式来准确计算字符串以及文本之间的耦合度,因此,提高了字符串以及文本之间的相似度计算准确率;通过将耦合度最高的第一向量矩阵所对应的字符串确定为与文本匹配的字符串,保证了检索得到的字符串与当前信息录入方所输入的文本能够具有更强的关联度,由此使得在后续执行文本的替换操作时,能够得到更为准确的信息录入效果。
S107:将所述输入框中的所述文本替换为匹配到的所述字符串,并在接收到所述信息录入方发出的确认指令时,将匹配到的所述字符串确定为录入于所述输入框中的信息。
本申请实施例中,将当前输入框中所包含的文本替换为与该文本匹配的字符串,即,令输入框中所实时显示的文本变更为该字符串。
优选地,若存在于文本匹配的多个字符串,则将输入框中的文本替换为匹配到的任一字符串后,将其余各个字符串以气泡提示的形式依序显示于该输入框上方,以使得各个字符串为当前输入框的候选文本。
当信息录入方查看到输入框中所更新显示的文本后,可确定该文本与自己所需表达的文本语义是否相同。若是,则信息录入方发出确定指令;若否,则信息录入方发出拒绝指令。
根据信息录入方发出的确定指令,将输入框中所包含的字符串确定为当前时刻从输入框中所接收到的录入信息。若接收到信息录入方发出的拒绝指令,则将输入框的下一候选文本作为当前时刻所匹配到的字符串,并返回执行上述将输入框中的文本替换为匹配到的字符串,并在接收到信息录入方发出的确认指令时,将匹配到的字符串确定为录入于输入框中的信息的步骤。
本申请实施例中,通过预先收集信息采集方所提供的具有规范格式的各个字符串,并根据各个字符串所属的信息类别,将这些字符串存储于不同的数据分区表,使得即使是在显示页面中接收到用户自定义输入的文本,也能够根据文本所属的输入框,快速地进入对应的数据分区表进行关联字符串的查找操作,避免了因信息数据库中字符串数目过多而增大了数据查找过程中所产生的资源消耗,因此,提高了关联字符串的查找效率。
作为本申请的另一实施例,在上述实施例的基础之上,如图4所示,在上述S106之后,还包括:
S1055:对任一所述输入框所包含的所述文本,若所述数据分区表中不存在与该文本匹配的所述字符串,则生成错误提示信息。
本申请实施例中,对任一输入框所包含的文本,仅有在数据分区表中确定出与该文本的相似度大于预设阈值的字符串时,才确定该字符串与文本匹配。若数据分区表中不存在与 该文本的相似度大于预设阈值的字符串,则表示不存在与该文本匹配的字符串,此时,确定第二数据录入模板中所包含的文本存在格式错误问题,因此,生成错误提示信息。
优选地,上述错误提示信息用于描述当前错误的出现原因。例如,文本长度超过预设范围值,或者,不存在与该文本对应的地址信息等。
S1056:将所述错误提示信息添加至所述第二数据录入模板,并在所述第二数据录入模板中,对该文本所属的所述信息字段进行标记处理,得到第三数据录入模板。
本申请实施例中,重新加载信息录入方所上传的第二数据录入模板,并在该第二数据录入模板中,定位上述未与任一字符串匹配的文本。根据该文本在第二数据录入模板中所属的信息字段,将整列信息字段进行标记处理。标记方式包括但不限于色彩标记、字体加粗标记以及字段背景色标记等。同时,对定位得到的文本进行批注处理,以将上述错误提示信息添加至批注内容中。
S1057:输出所述第三数据录入模板,以使所述信息录入方基于所述第三数据录入模板所包含的所述错误提示信息以及标记的所述信息字段,返回执行所述获取所述信息录入方在所述显示页面中所导入的所述第二数据录入模板的操作。
在对第二数据录入模板进行批注以及标记处理后,得到修改后的数据录入模板,将该数据录入模板称为第三数据录入模板。将第三数据录入模板发布于显示页面,以使信息录入方在接收到显示页面中所弹出的错误提示信息后,下载该第三数据录入模板。信息录入方在第三数据录入模板中查看到自己所录入出错的内容和批注信息后,将会重新输入各个信息字段的属性值,以将再次创建的数据录入模板进行导入,此时,返回执行上述S1053。
本申请实施例中,在检测到数据分区表中不存在与文本匹配的字符串时,通过将错误提示信息添加至数据录入模板,并对文本所属的所信息字段进行标记处理,使得信息录入方能够及时了解信息录入错误的原因,准确地定位错误文本的位置,从而能够快速纠错所需输入的文本后,再次执行信息输入操作,因此,本申请实施例在一定程度上也提高了批量文本的输入效率。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
对应于本申请实施例所提供的信息的输入方法,图5示出了本申请实施例提供的信息的输入装置的结构框图。为了便于说明,仅示出了与本实施例相关的部分。
参照图5,该装置包括:
第一获取单元51,用于获取预存储于信息数据库中的字符串,所述字符串为信息采集方针对不同的信息类别所提供的参考字符串,所述字符串包括单字符、词组以及短语中的至 少一种。
关联单元52,用于为所述字符串关联用于标示所述字符串所属信息类别的标签。
建立单元53,用于分别为每一所述信息类别建立对应的数据分区表。
存储单元54,用于根据所述字符串所关联的所述标签,将所述字符串存储至对应的所述数据分区表。
第二获取单元55,用于获取信息录入方在显示页面的输入框中输入的文本;其中,所述输入框关联有一类信息类别。
检索单元56,用于在与所述输入框关联的所述信息类别对应的所述数据分区表中,检索与所述文本匹配的所述字符串。
替换单元57,用于将所述输入框中的所述文本替换为匹配到的所述字符串,并在接收到所述信息录入方发出的确认指令时,将匹配到的所述字符串确定为录入于所述输入框中的信息。
可选地,所述检索单元56包括:
转换子单元,用于在与所述输入框关联的所述信息类别对应的所述数据分区表中,对各个所述字符串进行转换处理,得到各个所述字符串所分别对应的第一向量矩阵。
生成子单元,用于生成所述文本对应的第二向量矩阵。
计算子单元,用于分别计算所述第二向量矩阵与各个所述第一向量矩阵的耦合度,并确定出其中所述耦合度最高的所述第一向量矩阵所对应的所述字符串。
可选地,所述计算子单元具体用于:
根据下式计算所述第二向量矩阵与排序为n的所述第一向量矩阵的耦合度:
Figure PCTCN2018096270-appb-000002
其中,tanh为双曲正切函数,BkWdWt为预设的权重系数,WdLength n为排序为n的所述第一向量矩阵所对应的字符串的字长总数,WdLength input为所述第二向量矩阵所对应的字符串的字长总数,VecTol input以及VecTol n分别为第一向量矩阵以及排序为n的所述第一向量矩阵所包含的元素总数,Vec input,i为第一向量矩阵中的第i个元素值,Vec n,j为第一向量矩阵中的第j个元素值;i、j以及n均为大于零的整数。
可选地,所述第二获取单元55包括:
创建子单元,用于根据所述显示页面所包含的各个所述输入框,生成第一数据录入模板,并在所述第一数据录入模板中分别创建与各个所述输入框对应的信息字段。
发布子单元,用于对所述第一数据录入模板进行发布,以使所述信息录入方下载所述第一数据录入模板,并使所述信息录入方将文本输入于所述第一数据录入模板的各个所述信息字段后,得到第二数据录入模板。
获取子单元,用于获取所述信息录入方在所述显示页面中所导入的所述第二数据录入模板。
填充子单元,用于在所述第二数据录入模板中,提取每一所述信息字段中的所述文本,并将所述文本填充至该信息字段所对应的所述输入框。
可选地,所述信息的输入装置还包括:
错误提示单元,用于对任一所述输入框所包含的所述文本,若所述数据分区表中不存在与该文本匹配的所述字符串,则生成错误提示信息。
添加单元,用于将所述错误提示信息添加至所述第二数据录入模板,并在所述第二数据录入模板中,对该文本所属的所述信息字段进行标记处理,得到第三数据录入模板。
输出单元,用于输出所述第三数据录入模板,以使所述信息录入方基于所述第三数据录入模板所包含的所述错误提示信息以及标记的所述信息字段,返回执行所述获取所述信息录入方在所述显示页面中所导入的所述第二数据录入模板的操作。
图6是本申请一实施例提供的终端设备的示意图。如图6所示,该实施例的终端设备6包括:处理器60以及存储器61,所述存储器61中存储有可在所述处理器60上运行的计算机可读指令62,例如信息的输入程序。所述处理器60执行所述计算机可读指令62时实现上述各个信息的输入方法实施例中的步骤,例如图1所示的步骤101至107。或者,所述处理器60执行所述计算机可读指令62时实现上述各装置实施例中各模块/单元的功能,例如图5所示单元51至57的功能。
示例性的,所述计算机可读指令62可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器61中,并由所述处理器60执行,以完成本申请。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该指令段用于描述所述计算机可读指令62在所述终端设备6中的执行过程。
所述终端设备6可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于处理器60和存储器61。本领域技术人员可以理解,图6仅仅是终端设备6的示例,并不构成对终端设备6的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网 络接入设备、总线等。
所称处理器60可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器61可以是所述终端设备6的内部存储单元,例如终端设备6的硬盘或内存。所述存储器61也可以是所述终端设备6的外部存储设备,例如所述终端设备6上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器61还可以既包括所述终端设备6的内部存储单元也包括外部存储设备。所述存储器61用于存储所述计算机可读指令以及所述终端设备所需的其他程序和数据。所述存储器61还可以用于暂时地存储已经输出或者将要输出的数据。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (20)

  1. 一种信息的输入方法,其特征在于,包括:
    获取预存储于信息数据库中的字符串,所述字符串为信息采集方针对不同的信息类别所提供的参考字符串,所述字符串包括单字符、词组以及短语中的至少一种;
    为所述字符串关联用于标示所述字符串所属信息类别的标签;
    分别为每一所述信息类别建立对应的数据分区表;
    根据所述字符串所关联的所述标签,将所述字符串存储至对应的所述数据分区表;
    获取信息录入方在显示页面的输入框中输入的文本;其中,所述输入框关联有一类信息类别;
    在与所述输入框关联的所述信息类别对应的所述数据分区表中,检索与所述文本匹配的所述字符串;
    将所述输入框中的所述文本替换为匹配到的所述字符串,并在接收到所述信息录入方发出的确认指令时,将匹配到的所述字符串确定为录入于所述输入框中的信息。
  2. 如权利要求1所述的信息的输入方法,其特征在于,所述在与所述输入框关联的所述信息类别对应的所述数据分区表中,检索与所述文本匹配的所述字符串,包括:
    在与所述输入框关联的所述信息类别对应的所述数据分区表中,对各个所述字符串进行转换处理,得到各个所述字符串所分别对应的第一向量矩阵;
    生成所述文本对应的第二向量矩阵;
    分别计算所述第二向量矩阵与各个所述第一向量矩阵的耦合度,并确定出其中所述耦合度最高的所述第一向量矩阵所对应的所述字符串。
  3. 如权利要求2所述的信息的输入方法,其特征在于,所述分别计算所述第二向量矩阵与各个所述第一向量矩阵的耦合度,并确定出其中所述耦合度最高的所述第一向量矩阵所对应的所述字符串,包括:
    根据下式计算所述第二向量矩阵与排序为n的所述第一向量矩阵的耦合度:
    Figure PCTCN2018096270-appb-100001
    其中,tanh为双曲正切函数,BkWdWt为预设的权重系数,WdLength n为排序为n的所 述第一向量矩阵所对应的字符串的字长总数,WdLength input为所述第二向量矩阵所对应的字符串的字长总数,VecTol input以及VecTol n分别为第一向量矩阵以及排序为n的所述第一向量矩阵所包含的元素总数,Vec input,i为第一向量矩阵中的第i个元素值,Vec n,j为第一向量矩阵中的第j个元素值;i、j以及n均为大于零的整数。
  4. 如权利要求1所述的信息的输入方法,其特征在于,所述获取信息录入方在显示页面的输入框中输入的文本,包括:
    根据所述显示页面所包含的各个所述输入框,生成第一数据录入模板,并在所述第一数据录入模板中分别创建与各个所述输入框对应的信息字段;
    对所述第一数据录入模板进行发布,以使所述信息录入方下载所述第一数据录入模板,并使所述信息录入方将文本输入于所述第一数据录入模板的各个所述信息字段后,得到第二数据录入模板;
    获取所述信息录入方在所述显示页面中所导入的所述第二数据录入模板;
    在所述第二数据录入模板中,提取每一所述信息字段中的所述文本,并将所述文本填充至该信息字段所对应的所述输入框。
  5. 如权利要求4所述的信息的输入方法,其特征在于,在所述在与所述输入框关联的所述信息类别对应的所述数据分区表中,检索与所述文本匹配的所述字符串之后,还包括:
    对任一所述输入框所包含的所述文本,若所述数据分区表中不存在与该文本匹配的所述字符串,则生成错误提示信息;
    将所述错误提示信息添加至所述第二数据录入模板,并在所述第二数据录入模板中,对该文本所属的所述信息字段进行标记处理,得到第三数据录入模板;
    输出所述第三数据录入模板,以使所述信息录入方基于所述第三数据录入模板所包含的所述错误提示信息以及标记的所述信息字段,返回执行所述获取所述信息录入方在所述显示页面中所导入的所述第二数据录入模板的操作。
  6. 一种信息的输入装置,其特征在于,包括:
    第一获取单元,用于获取预存储于信息数据库中的字符串,所述字符串为信息采集方针对不同的信息类别所提供的参考字符串,所述字符串包括单字符、词组以及短语中的至少一种;
    关联单元,用于为所述字符串关联用于标示所述字符串所属信息类别的标签;
    建立单元,用于分别为每一所述信息类别建立对应的数据分区表;
    存储单元,用于根据所述字符串所关联的所述标签,将所述字符串存储至对应的所述 数据分区表;
    第二获取单元,用于获取信息录入方在显示页面的输入框中输入的文本;其中,所述输入框关联有一类信息类别;
    检索单元,用于在与所述输入框关联的所述信息类别对应的所述数据分区表中,检索与所述文本匹配的所述字符串;
    替换单元,用于将所述输入框中的所述文本替换为匹配到的所述字符串,并在接收到所述信息录入方发出的确认指令时,将匹配到的所述字符串确定为录入于所述输入框中的信息。
  7. 根据权利要求6所述的信息的输入装置,其特征在于,所述检索单元包括:
    转换子单元,用于在与所述输入框关联的所述信息类别对应的所述数据分区表中,对各个所述字符串进行转换处理,得到各个所述字符串所分别对应的第一向量矩阵;
    生成子单元,用于生成所述文本对应的第二向量矩阵;
    计算子单元,用于分别计算所述第二向量矩阵与各个所述第一向量矩阵的耦合度,并确定出其中所述耦合度最高的所述第一向量矩阵所对应的所述字符串。
  8. 根据权利要求7所述的信息的输入装置,其特征在于,所述计算子单元具体用于:
    根据下式计算所述第二向量矩阵与排序为n的所述第一向量矩阵的耦合度:
    Figure PCTCN2018096270-appb-100002
    其中,tanh为双曲正切函数,BkWdWt为预设的权重系数,WdLength n为排序为n的所述第一向量矩阵所对应的字符串的字长总数,WdLength input为所述第二向量矩阵所对应的字符串的字长总数,VecTol input以及VecTol n分别为第一向量矩阵以及排序为n的所述第一向量矩阵所包含的元素总数,Vec input,i为第一向量矩阵中的第i个元素值,Vec n,j为第一向量矩阵中的第j个元素值;i、j以及n均为大于零的整数。
  9. 根据权利要求6所述的信息的输入装置,其特征在于,所述第二获取单元包括:
    创建子单元,用于根据所述显示页面所包含的各个所述输入框,生成第一数据录入模板,并在所述第一数据录入模板中分别创建与各个所述输入框对应的信息字段;
    发布子单元,用于对所述第一数据录入模板进行发布,以使所述信息录入方下载所述第一数据录入模板,并使所述信息录入方将文本输入于所述第一数据录入模板的各个所述信息字段后,得到第二数据录入模板;
    获取子单元,用于获取所述信息录入方在所述显示页面中所导入的所述第二数据录入 模板;
    填充子单元,用于在所述第二数据录入模板中,提取每一所述信息字段中的所述文本,并将所述文本填充至该信息字段所对应的所述输入框。
  10. 根据权利要求9所述的信息的输入装置,其特征在于,还包括:
    错误提示单元,用于对任一所述输入框所包含的所述文本,若所述数据分区表中不存在与该文本匹配的所述字符串,则生成错误提示信息;
    添加单元,用于将所述错误提示信息添加至所述第二数据录入模板,并在所述第二数据录入模板中,对该文本所属的所述信息字段进行标记处理,得到第三数据录入模板;
    输出单元,用于输出所述第三数据录入模板,以使所述信息录入方基于所述第三数据录入模板所包含的所述错误提示信息以及标记的所述信息字段,返回执行所述获取所述信息录入方在所述显示页面中所导入的所述第二数据录入模板的操作。
  11. 一种终端设备,其特征在于,包括存储器以及处理器,所述存储器中存储有可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现如下步骤:
    获取预存储于信息数据库中的字符串,所述字符串为信息采集方针对不同的信息类别所提供的参考字符串,所述字符串包括单字符、词组以及短语中的至少一种;
    为所述字符串关联用于标示所述字符串所属信息类别的标签;
    分别为每一所述信息类别建立对应的数据分区表;
    根据所述字符串所关联的所述标签,将所述字符串存储至对应的所述数据分区表;
    获取信息录入方在显示页面的输入框中输入的文本;其中,所述输入框关联有一类信息类别;
    在与所述输入框关联的所述信息类别对应的所述数据分区表中,检索与所述文本匹配的所述字符串;
    将所述输入框中的所述文本替换为匹配到的所述字符串,并在接收到所述信息录入方发出的确认指令时,将匹配到的所述字符串确定为录入于所述输入框中的信息。
  12. 根据权利要求11所述的终端设备,其特征在于,所述在与所述输入框关联的所述信息类别对应的所述数据分区表中,检索与所述文本匹配的所述字符串,包括:
    在与所述输入框关联的所述信息类别对应的所述数据分区表中,对各个所述字符串进行转换处理,得到各个所述字符串所分别对应的第一向量矩阵;
    生成所述文本对应的第二向量矩阵;
    分别计算所述第二向量矩阵与各个所述第一向量矩阵的耦合度,并确定出其中所述耦合度最高的所述第一向量矩阵所对应的所述字符串。
  13. 根据权利要求12所述的终端设备,其特征在于,所述分别计算所述第二向量矩阵与各个所述第一向量矩阵的耦合度,并确定出其中所述耦合度最高的所述第一向量矩阵所对应的所述字符串,包括:
    根据下式计算所述第二向量矩阵与排序为n的所述第一向量矩阵的耦合度:
    Figure PCTCN2018096270-appb-100003
    其中,tanh为双曲正切函数,BkWdWt为预设的权重系数,WdLength n为排序为n的所述第一向量矩阵所对应的字符串的字长总数,WdLength input为所述第二向量矩阵所对应的字符串的字长总数,VecTol input以及VecTol n分别为第一向量矩阵以及排序为n的所述第一向量矩阵所包含的元素总数,Vec input,i为第一向量矩阵中的第i个元素值,Vec n,j为第一向量矩阵中的第j个元素值;i、j以及n均为大于零的整数。
  14. 根据权利要求11所述的终端设备,其特征在于,所述获取信息录入方在显示页面的输入框中输入的文本,包括:
    根据所述显示页面所包含的各个所述输入框,生成第一数据录入模板,并在所述第一数据录入模板中分别创建与各个所述输入框对应的信息字段;
    对所述第一数据录入模板进行发布,以使所述信息录入方下载所述第一数据录入模板,并使所述信息录入方将文本输入于所述第一数据录入模板的各个所述信息字段后,得到第二数据录入模板;
    获取所述信息录入方在所述显示页面中所导入的所述第二数据录入模板;
    在所述第二数据录入模板中,提取每一所述信息字段中的所述文本,并将所述文本填充至该信息字段所对应的所述输入框。
  15. 根据权利要求14所述的终端设备,其特征在于,在所述在与所述输入框关联的所述信息类别对应的所述数据分区表中,检索与所述文本匹配的所述字符串之后,还包括:
    对任一所述输入框所包含的所述文本,若所述数据分区表中不存在与该文本匹配的所述字符串,则生成错误提示信息;
    将所述错误提示信息添加至所述第二数据录入模板,并在所述第二数据录入模板中,对该文本所属的所述信息字段进行标记处理,得到第三数据录入模板;
    输出所述第三数据录入模板,以使所述信息录入方基于所述第三数据录入模板所包含的所述错误提示信息以及标记的所述信息字段,返回执行所述获取所述信息录入方在所述显示页面中所导入的所述第二数据录入模板的操作。
  16. 一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,其特征在于,所述计算机可读指令被至少一个处理器执行时实现如下步骤:
    获取预存储于信息数据库中的字符串,所述字符串为信息采集方针对不同的信息类别所提供的参考字符串,所述字符串包括单字符、词组以及短语中的至少一种;
    为所述字符串关联用于标示所述字符串所属信息类别的标签;
    分别为每一所述信息类别建立对应的数据分区表;
    根据所述字符串所关联的所述标签,将所述字符串存储至对应的所述数据分区表;
    获取信息录入方在显示页面的输入框中输入的文本;其中,所述输入框关联有一类信息类别;
    在与所述输入框关联的所述信息类别对应的所述数据分区表中,检索与所述文本匹配的所述字符串;
    将所述输入框中的所述文本替换为匹配到的所述字符串,并在接收到所述信息录入方发出的确认指令时,将匹配到的所述字符串确定为录入于所述输入框中的信息。
  17. 根据权利要求16所述的计算机可读存储介质,其特征在于,所述在与所述输入框关联的所述信息类别对应的所述数据分区表中,检索与所述文本匹配的所述字符串,包括:
    在与所述输入框关联的所述信息类别对应的所述数据分区表中,对各个所述字符串进行转换处理,得到各个所述字符串所分别对应的第一向量矩阵;
    生成所述文本对应的第二向量矩阵;
    分别计算所述第二向量矩阵与各个所述第一向量矩阵的耦合度,并确定出其中所述耦合度最高的所述第一向量矩阵所对应的所述字符串。
  18. 根据权利要求17所述的计算机可读存储介质,其特征在于,所述分别计算所述第二向量矩阵与各个所述第一向量矩阵的耦合度,并确定出其中所述耦合度最高的所述第一向量矩阵所对应的所述字符串,包括:
    根据下式计算所述第二向量矩阵与排序为n的所述第一向量矩阵的耦合度:
    Figure PCTCN2018096270-appb-100004
    其中,tanh为双曲正切函数,BkWdWt为预设的权重系数,WdLength n为排序为n的所述第一向量矩阵所对应的字符串的字长总数,WdLength input为所述第二向量矩阵所对应的字符串的字长总数,VecTol input以及VecTol n分别为第一向量矩阵以及排序为n的所述第一向量矩阵所包含的元素总数,Vec input,i为第一向量矩阵中的第i个元素值,Vec n,j为第一向量矩阵中的第j个元素值;i、j以及n均为大于零的整数。
  19. 根据权利要求16所述的计算机可读存储介质,其特征在于,所述获取信息录入方在显示页面的输入框中输入的文本,包括:
    根据所述显示页面所包含的各个所述输入框,生成第一数据录入模板,并在所述第一数据录入模板中分别创建与各个所述输入框对应的信息字段;
    对所述第一数据录入模板进行发布,以使所述信息录入方下载所述第一数据录入模板,并使所述信息录入方将文本输入于所述第一数据录入模板的各个所述信息字段后,得到第二数据录入模板;
    获取所述信息录入方在所述显示页面中所导入的所述第二数据录入模板;
    在所述第二数据录入模板中,提取每一所述信息字段中的所述文本,并将所述文本填充至该信息字段所对应的所述输入框。
  20. 根据权利要求19所述的计算机可读存储介质,其特征在于,所述计算机可读指令被至少一个处理器执行时还实现如下步骤:
    对任一所述输入框所包含的所述文本,若所述数据分区表中不存在与该文本匹配的所述字符串,则生成错误提示信息;
    将所述错误提示信息添加至所述第二数据录入模板,并在所述第二数据录入模板中,对该文本所属的所述信息字段进行标记处理,得到第三数据录入模板;
    输出所述第三数据录入模板,以使所述信息录入方基于所述第三数据录入模板所包含的所述错误提示信息以及标记的所述信息字段,返回执行所述获取所述信息录入方在所述显示页面中所导入的所述第二数据录入模板的操作。
PCT/CN2018/096270 2018-04-27 2018-07-19 信息的输入方法、装置、终端设备及介质 WO2019205308A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810392820.8 2018-04-27
CN201810392820.8A CN108664574B (zh) 2018-04-27 2018-04-27 信息的输入方法、终端设备及介质

Publications (1)

Publication Number Publication Date
WO2019205308A1 true WO2019205308A1 (zh) 2019-10-31

Family

ID=63781281

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2018/096270 WO2019205308A1 (zh) 2018-04-27 2018-07-19 信息的输入方法、装置、终端设备及介质

Country Status (2)

Country Link
CN (1) CN108664574B (zh)
WO (1) WO2019205308A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112036144A (zh) * 2020-09-03 2020-12-04 广联达科技股份有限公司 数据解析方法、装置、计算机设备和可读存储介质
CN112579064A (zh) * 2020-12-04 2021-03-30 深圳市大富网络技术有限公司 一种代码提示方法、系统、装置及可读存储介质
CN113626593A (zh) * 2021-07-13 2021-11-09 深圳希施玛数据科技有限公司 一种Excel文件校验方法、装置及设备

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111222352A (zh) * 2018-11-26 2020-06-02 北京京东尚科信息技术有限公司 一种表单录入方法及其装置、设备、存储介质
CN111240496A (zh) * 2018-11-28 2020-06-05 深圳市帝迈生物技术有限公司 终端设备、移动终端及信息录入方法、计算机存储介质
CN109614501B (zh) * 2018-12-13 2020-09-25 浙江工商大学 一种基于知识图谱的工业隐患规范化上报方法及系统
CN109741742A (zh) * 2019-01-03 2019-05-10 中国联合网络通信集团有限公司 一种输入方法和终端
CN111478877B (zh) * 2019-01-24 2022-08-02 安碁资讯股份有限公司 网域名称识别方法及网域名称识别装置
CN110427328A (zh) * 2019-08-07 2019-11-08 北京字节跳动网络技术有限公司 文本处理方法、装置、设备及存储介质
CN110765750B (zh) * 2019-09-16 2024-03-15 平安科技(深圳)有限公司 报表数据录入方法及终端设备
CN110853717B (zh) * 2019-10-16 2022-06-17 云知声智能科技股份有限公司 一种文书字段控制关联缺陷项目的方法及装置
CN111026282B (zh) * 2019-11-27 2023-05-23 上海明品医学数据科技有限公司 一种在输入过程中判断是否进行医学数据标注的控制方法
CN114491089B (zh) * 2022-01-28 2023-08-29 北京百度网讯科技有限公司 地址获取方法、装置、电子设备、介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101382866A (zh) * 2008-09-26 2009-03-11 腾讯科技(深圳)有限公司 修正输入文字的系统及方法
CN101799736A (zh) * 2009-04-30 2010-08-11 广东国笔科技股份有限公司 功能实时联想型交互系统及方法
CN103440311A (zh) * 2013-08-27 2013-12-11 深圳市华傲数据技术有限公司 一种地名实体识别的方法及系统
CN105955506A (zh) * 2016-05-20 2016-09-21 珠海市魅族科技有限公司 一种信息展示方法以及信息展示装置
CN107291730A (zh) * 2016-03-31 2017-10-24 阿里巴巴集团控股有限公司 对查询词提供校正建议的方法、装置、及概率词典构建方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101459884B (zh) * 2008-12-29 2010-11-10 中国移动通信集团北京有限公司 一种业务处理方法及装置
GB201306942D0 (en) * 2013-04-17 2013-05-29 Tomtom Int Bv Methods, devices and computer software for facilitating searching and display of locations relevant to a digital map
CN107153652B (zh) * 2016-03-03 2020-10-30 创新先进技术有限公司 将目标字符串转化为规范化字符串的方法及装置
CN107515702B (zh) * 2016-06-16 2020-10-27 苏宁易购集团股份有限公司 一种页面交互方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101382866A (zh) * 2008-09-26 2009-03-11 腾讯科技(深圳)有限公司 修正输入文字的系统及方法
CN101799736A (zh) * 2009-04-30 2010-08-11 广东国笔科技股份有限公司 功能实时联想型交互系统及方法
CN103440311A (zh) * 2013-08-27 2013-12-11 深圳市华傲数据技术有限公司 一种地名实体识别的方法及系统
CN107291730A (zh) * 2016-03-31 2017-10-24 阿里巴巴集团控股有限公司 对查询词提供校正建议的方法、装置、及概率词典构建方法
CN105955506A (zh) * 2016-05-20 2016-09-21 珠海市魅族科技有限公司 一种信息展示方法以及信息展示装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112036144A (zh) * 2020-09-03 2020-12-04 广联达科技股份有限公司 数据解析方法、装置、计算机设备和可读存储介质
CN112036144B (zh) * 2020-09-03 2024-04-02 广联达科技股份有限公司 数据解析方法、装置、计算机设备和可读存储介质
CN112579064A (zh) * 2020-12-04 2021-03-30 深圳市大富网络技术有限公司 一种代码提示方法、系统、装置及可读存储介质
CN113626593A (zh) * 2021-07-13 2021-11-09 深圳希施玛数据科技有限公司 一种Excel文件校验方法、装置及设备
CN113626593B (zh) * 2021-07-13 2024-04-19 深圳希施玛数据科技有限公司 一种Excel文件校验方法、装置及设备

Also Published As

Publication number Publication date
CN108664574B (zh) 2023-08-18
CN108664574A (zh) 2018-10-16

Similar Documents

Publication Publication Date Title
WO2019205308A1 (zh) 信息的输入方法、装置、终端设备及介质
CN112035653B (zh) 一种政策关键信息提取方法和装置、存储介质、电子设备
US11972201B2 (en) Facilitating auto-completion of electronic forms with hierarchical entity data models
WO2021042521A1 (zh) 一种合同自动生成方法、计算机设备及计算机非易失性存储介质
WO2022048211A1 (zh) 文档目录生成方法、装置、电子设备及可读存储介质
WO2021139262A1 (zh) 文献主题词聚合方法、装置、计算机设备及可读存储介质
US11816138B2 (en) Systems and methods for parsing log files using classification and a plurality of neural networks
CN110263311B (zh) 一种网络页面的生成方法及设备
CN108170715B (zh) 一种文本结构化处理方法
WO2020057413A1 (zh) 垃圾文本的识别方法、装置、计算设备及可读存储介质
CN110083832B (zh) 文章转载关系的识别方法、装置、设备及可读存储介质
WO2019242124A1 (zh) 金额信息的提取方法、装置、终端设备及介质
US10042880B1 (en) Automated identification of start-of-reading location for ebooks
CN110162754B (zh) 一种岗位描述文档的生成方法及设备
US11562234B2 (en) Dynamically determining schema labels using a hybrid neural network encoder
WO2023274047A1 (zh) 标准知识图谱构建、标准查询方法及装置
CN111651552B (zh) 结构化信息确定方法、装置和电子设备
US10331789B2 (en) Semantic analysis apparatus, method, and non-transitory computer readable storage medium thereof
US20230138491A1 (en) Continuous learning for document processing and analysis
US20140181124A1 (en) Method, apparatus, system and storage medium having computer executable instrutions for determination of a measure of similarity and processing of documents
CN113779218B (zh) 问答对构建方法、装置、计算机设备和存储介质
CN111310473A (zh) 文本纠错方法及其模型训练的方法、装置
US20230134218A1 (en) Continuous learning for document processing and analysis
CN115294593A (zh) 一种图像信息抽取方法、装置、计算机设备及存储介质
CN114911936A (zh) 一种模型训练、评论识别方法、装置、电子设备及介质

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18916027

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 18916027

Country of ref document: EP

Kind code of ref document: A1