WO2020085674A1 - 이용자가 희망 도서 신청 시 실시간으로 마크 데이터를 생성하고 전송하는 방법 및 이를 위한 시스템 - Google Patents

이용자가 희망 도서 신청 시 실시간으로 마크 데이터를 생성하고 전송하는 방법 및 이를 위한 시스템 Download PDF

Info

Publication number
WO2020085674A1
WO2020085674A1 PCT/KR2019/013088 KR2019013088W WO2020085674A1 WO 2020085674 A1 WO2020085674 A1 WO 2020085674A1 KR 2019013088 W KR2019013088 W KR 2019013088W WO 2020085674 A1 WO2020085674 A1 WO 2020085674A1
Authority
WO
WIPO (PCT)
Prior art keywords
book
information
mark data
generating
database
Prior art date
Application number
PCT/KR2019/013088
Other languages
English (en)
French (fr)
Inventor
유제승
Original Assignee
주식회사 대양정보
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020180128908A external-priority patent/KR102015089B1/ko
Priority claimed from KR1020190067498A external-priority patent/KR102227421B1/ko
Application filed by 주식회사 대양정보 filed Critical 주식회사 대양정보
Priority to EP19876370.8A priority Critical patent/EP3872743A4/en
Priority to US17/059,246 priority patent/US11409718B2/en
Priority to CN201980034486.1A priority patent/CN112534465A/zh
Priority to JP2020565284A priority patent/JP6925547B2/ja
Publication of WO2020085674A1 publication Critical patent/WO2020085674A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2379Updates performed during online database operations; commit processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Definitions

  • the present invention relates to a method and system for generating mark data in real time when a library user applies for a desired book, and more specifically, it utilizes bibliography, category information, and AI of new books that require mark data generation.
  • a method to generate mark data in real time when applying for a desired book, and to transmit it to the user's library or library server, and a system that can implement it, which can automatically generate mark data through data analysis and send it to the desired format It is about.
  • MARC Korean literature automation catalog
  • MARC data are not only items that contain objective information written in the book, such as the name of the book, author, publication date, etc., but also librarians who grant it, such as the Korean Decimal Classification Act (hereinafter KDC) or the Dewey Decimal Classification Act (hereinafter DDC). Since the items reflected by the subject are also included, a librarian with professional knowledge is essential to generate high-quality MARC data according to the conventional method, and it is difficult to provide high-quality MARC data through the method provided by the book supplier. There is a problem.
  • KDC Korean Decimal Classification Act
  • DDC Dewey Decimal Classification Act
  • the present invention was devised to solve the above-mentioned problems of the prior art, and non-surgery matters (for example, KDC / DDC, which could not be generated only with basic surges among mark data through big data analysis using AI)
  • References and indexes are displayed, publications, authors are individuals or organizations, subject words, library-specific custom billing symbols, library-specific book registration numbers, etc.), and each library is a user when a user requests a desired book It is aimed at sending to.
  • the goal is to generate accurate mark data in real time even for a large amount of books to maximize the efficiency of generating mark data and transmit it to the user when applying for a desired book.
  • a method for generating real-time mark data according to an embodiment of the present invention for solving the above-mentioned problems includes: (a) constructing a database 100 using book information and mark data of a book in which mark data is generated; (b) receiving book information of a new book, and generating mark data of a new book based on the book information of the received new book and the database 100; And (c) providing mark data of the generated new book to the user.
  • the book information may include bibliographic information, category information, and table of contents information for the book.
  • a mapping table in which non-bibliographic information corresponding to book information of a book on which mark data is generated is formed and stored in a database, wherein the non-bibliographic information is KDC / It may include at least one of a DDC, a reference and an index, a publication, whether an author is an individual or an organization, and a subject.
  • the step (b) comprises: (b-1) receiving book information of a new book through an input unit; (b-2) extracting, extracting non-Bibliographic information mapped to book information received from the database; (b-3) calculating, by the analysis unit, the similarity with the book stored in the database through morpheme analysis of the received bibliographic information; (b-4) the generating unit may update the extracted non-bibliographic information based on the similarity and generate mark data.
  • the similarity may be calculated by multiplying the number of the same morpheme and the category weight.
  • the step (c) may filter and provide an item desired by the user among the generated mark data.
  • the mark data generation system 10 for performing a real-time mark data generation method includes: a database for storing book information and mark data of a book in which mark data is generated; A mark generation unit that receives book information of a new book and generates mark data; A communication unit communicating with an external terminal to transmit and receive book information or mark data; And a control unit, wherein the database forms and stores a mapping table in which non-bibliographic information corresponding to book information is mapped, and the non-bibliographic information is KDC / DDC, whether references and indexes, publications, authors Whether it is an individual or a group, it may include at least one of the subject words.
  • the mark generation unit an input unit for receiving book information of a new book; An extraction unit for extracting non-Bibliographic information corresponding to the book information of the new book; An analysis unit performing morpheme analysis on the bibliographic information of the new book; And a generating unit for updating the non-bibliographic information and generating mark data for a new book including the same.
  • a real-time mark data generation method includes a building step of constructing a database using book information and mark data of a book in which mark data is generated; A generation step of receiving book information of a new book from a user and generating mark data of the new book based on the book information of the received new book and the database; And a transmission step of transmitting mark data of the generated new book to a user when applying for a desired book.
  • the book information may include at least one or more of bibliographic information, category information, and table of contents information for the book.
  • a mapping table in which non-surgery information corresponding to book information of a book in which mark data is generated is formed and stored in a database, and the non-surgery information is whether KDC / DDC, references and indexes , A publication, whether the author is an individual or an organization, or at least one of the subject words.
  • the generating step includes receiving book information of a new book through an input unit;
  • the similarity is preferably calculated by multiplying the number of the same morphemes and the category weight.
  • the desired item of the generated mark data is filtered and transmitted to the user, but it is preferable that the mark data further includes basic bibliographic information of the book.
  • a database in which book information and mark data of a book in which mark data is generated is stored; A mark generation unit that receives book information of a new book and generates mark data; A communication unit communicating with an external terminal to transmit and receive book information or mark data; And a control unit; and a real-time mark data generation and transmission system.
  • the database forms and stores a mapping table to which the received book information and non-surgery information are mapped, and the communication unit transmits mark data generated in real time to the user's server.
  • the mark generation unit an input unit for receiving book information of a new book; An extraction unit for extracting non-Bibliographic information corresponding to the book information of the new book; An analysis unit performing morpheme analysis on the bibliographic information of the new book; And a generating unit for updating the non-bibliographic information and generating mark data for a new book including the same.
  • high-quality mark data including accurate and sufficient items that can be utilized in a real library system is generated and provided through bibliographic information and category information of new books as well as big data analysis using AI for this. can do.
  • non-Bibliographic information that cannot be obtained only with the basic bibliographic information of the book for example, KDC / DDC
  • KDC / DDC indicates whether there are references and indexes, publications, whether the author is an individual or an organization, by subject, library Information on customized billing symbols, library-specific book registration numbers, etc. can be automatically generated and provided to each library.
  • mark data By generating mark data and filtering it according to the format required for each library, it is possible to provide an integrated service that can be used by all libraries without generating separate mark data for each library. Since it uses mark data with, it is possible for both library and library users to efficiently provide or use library services.
  • a library book when requested, it can be usefully used for the purpose of collecting accurate meta-information. Since it can transmit MARC (Machine-Readable Cataloging) information that was not included in the existing meta-information, it can be very useful in libraries. You can.
  • MARC Machine-Readable Cataloging
  • FIG. 1 is a view showing a method for providing mark data according to the prior art.
  • FIG. 2 is a view showing a method for generating and providing mark data according to an embodiment of the present invention.
  • FIG 3 is a view schematically showing generation of mark data using a mark data generation system 10 according to an embodiment of the present invention.
  • FIG. 4 is a diagram showing the configuration of a real-time mark data generation system 10 according to an embodiment of the present invention.
  • FIG 5 is a view showing the configuration of a mark generating unit 200 according to an embodiment of the present invention.
  • FIG. 6 is a flowchart illustrating a method for generating real-time mark data according to an embodiment of the present invention.
  • FIG. 7 is a flowchart illustrating a method of generating mark data of a new book by the mark generator 200 according to an embodiment of the present invention.
  • FIG. 8 is a diagram illustrating filtering mark data according to an embodiment.
  • 9 and 10 schematically illustrate a process of transmitting the generated mark data from the real-time mark generation system 10 according to the present invention to a user server.
  • FIG. 1 is a view showing a method for providing mark data according to the prior art
  • FIG. 2 is a view showing a method for generating and providing mark data according to an embodiment of the present invention.
  • MARC data is generated from a book sales place and provided to a book delivery company, or when the National Library of Korea or the Korea Education and Research Information Service directly generates and uploads MARC data, other libraries download and use it. Method.
  • MARC data is subject to librarians who grant it, such as the Korean Decimal Classification Act (hereinafter KDC) or the Dewey Decimal Classification Act (hereinafter DDC), as well as items that contain objective information described in books, such as the name of the book, author, and publication date. Since this reflected item is also included, it is difficult to provide high-quality MARC data through the method provided by the book delivery company because a librarian with specialized knowledge is essential for generating high-quality MARC data according to the conventional method. have.
  • KDC Korean Decimal Classification Act
  • DDC Dewey Decimal Classification Act
  • the present invention was devised to solve the above-described problems, and when book information is input to the mark data generation system 10 according to the present invention in each library, mark data is automatically generated, and thus The generated mark data can be directly transferred to the library and provided.
  • KDC / DDC information will be described as an example, but it is not limited thereto, and if the same technical idea as the present invention to be described below is used, whether the reference and index are displayed, whether the publication, the author is an individual
  • various information that cannot be obtained only with basic bibliographic information of a book, such as whether it is an organization, subject words, customized billing symbols for each library, and book registration symbols for each library.
  • FIG 3 is a view schematically showing generation of mark data using a mark data generation system 10 according to an embodiment of the present invention.
  • the present invention when the user applies for a desired book (a user) to a library or library server, the present invention receives book information including bibliographic information and category information for a new book, and uses it to mark data. By generating, it is possible to provide a method and system for generating real-time mark data provided to users.
  • Mark data refers to a set of standard metadata formats that are coded so that the computer can identify and accumulate and distribute overall information related to books as list data, and the present invention provides bibliographic information and category information received based on big data. Information on items constituting the mark data may be estimated using limited information as described above, and generated and provided as mark data.
  • the bibliographic information may include book name, author, publisher, or ISBN information
  • category information includes, for example, general, philosophy, religion, social science, natural science, technical science, art, language, literature, and history. It can be, but is not necessarily limited to, it can be of course, it can be variously classified according to the user's settings, including their upper and lower items.
  • the new book does not necessarily mean only a newly published book within a certain period, and may include all books that need to generate new mark data according to a user's intention.
  • FIG. 4 is a diagram showing the configuration of a real-time mark data generation system 10 according to an embodiment of the present invention.
  • the real-time mark data generation system 10 may include a database 100, a mark generation unit 200, a communication unit 300, and a control unit 400.
  • the database 100 may store book information of books on which mark data has already been generated and mark data corresponding to the book information.
  • Book information stored in the database 100 may include bibliographic information, category information, and table of contents information.
  • bibliographic information may include book name, author, publisher or ISBN information
  • category information may include general, philosophical, religious, social science, natural science, technical science, art, language, literature, history, etc.
  • the present invention is not limited to this, and it can be classified into various types according to a user's setting including upper and lower items.
  • book information stored in the database 100 may further include reference information.
  • Reference information may include a book introduction, a summary, the language of the original application, the original title and the original author, but is not limited thereto, and various information related to the book may be included according to a user's setting.
  • the database 100 may further store information about morphemes forming bibliographic information or reference information of each book. This may be used in the analysis unit 230 to be described later to calculate the similarity between the new book and the pre-stored book through morpheme analysis. In this regard, the analysis unit 230 will be described later in detail.
  • Book information and mark data stored in the database 100 are directly input into the database 100 through a known input means (keyboard, mouse, touch pad or touch screen, etc.), or outside provided by a library or the like. Book information and mark data can be received and stored from the server. Alternatively, as will be described later, the mark data of the new book generated according to the real-time mark data generation method according to the present invention can also be stored in the database 100 together with the book information of the new book.
  • the database 100 may form and store a mapping table in which book information and non-surge information of stored books correspond.
  • Non-biblical information may include, for example, KDC / DDC, references and indexes, publications, whether the author is an individual or an organization, and the subject language.
  • KDC Korean Decimal Classification
  • DDC Dewey Decimal Classification
  • KDC Korean Decimal Classification
  • DDC Dewey Decimal Classification
  • the mark data stored in the database 100 may include KDC or DDC information of these books.
  • the database 100 can form and store a mapping table that matches book information of books in which mark data is parasitic and non-surge information included in the mark data of the book.
  • the mark generation unit 200 may receive book information of a new book and generate mark data based on the book information of the new book.
  • FIG 5 is a view showing the configuration of a mark generating unit 200 according to an embodiment of the present invention.
  • the mark generating unit 200 includes: an input unit 210; Extraction unit 220; Analysis unit 230; and generation unit 240; may include.
  • the input unit 210 may receive book information of a new book to generate mark data. At this time, the book information input to the input unit 210 may be directly input by a known input means, or may be received and input in the form of data from an external server through the communication unit 300 to be described later. Book information input through the input unit 210 may include bibliographic information, category information, or table of contents information for new books.
  • the extracting unit 220 may extract secretariat information mapped to book information of the received new book.
  • the database 100 stores a mapping table indicating a correspondence relationship between book information of pre-stored books and non-surgery information corresponding thereto, and the extracting unit 220 based on the mapping table displays the input unit 210 ) To extract the input book information and the non-surgery information mapped.
  • category information is KDC and DDC mapped to category information input as unstructured data by user estimation, and the extraction unit 220 inputs the above on the mapping table. KDC and DDC mapped to the received category information may be extracted.
  • the analysis unit 230 may perform morpheme analysis on the bibliographic information of the received new book and compare it with morphemes forming bibliography of books pre-stored in the database 100 to calculate similarity.
  • Morphological analysis is a kind of natural language processing technique that analyzes human language through a mechanical device such as a computer, and means a method of decomposing and analyzing a target word into a morphological unit that is a minimum semantic unit.
  • the similarity may be calculated through (the same number of morphemes) x (category weight), and the method and the embodiment for calculating the similarity through this will be described in detail while describing a method of generating mark data to be described later.
  • the analysis unit 230 may perform morpheme analysis including reference information and calculate similarity.
  • Reference information may include, but is not limited to, a book introduction, a table of contents, a summary, the language of the original application, the original title and the original author.
  • the generation unit 240 may update non-bibliographic information based on the similarity calculated by the analysis unit 230 and generate mark data including the same.
  • the KDC or DDC extracted using the extraction unit 220 is a KDC or DDC that is mapped to category information input as unstructured data by user's estimation, it may cover a somewhat wide range or have low accuracy, and the generation unit 240 Based on the similarity calculated by the analysis unit 230, the KDC or DDC extracted by the extraction unit 220 is updated to calculate more accurate KDC, DDC, and marks including KDC or DDC calculated with high accuracy. Data can be generated.
  • the communication unit 300 may transmit and receive book information and / or mark data by communicating with an external terminal.
  • the external terminal refers to an electronic device having a communication means capable of communicating with the communication unit 300 according to the present invention, and may include a user terminal, a computer or a server provided in the library, and the like.
  • the real-time mark data generation system 10 when a user requests a desired book, receives book information and / or mark data from an external terminal through the communication unit 300 and stores it in the database 100 or new
  • the mark data of the book can be generated, and the generated mark data can be transmitted to an external terminal or server to provide the mark data of the new book to the user.
  • the control unit 400 may control the overall operation of the mark data generation system 10.
  • FIG. 6 is a flowchart illustrating a method for generating real-time mark data according to an embodiment of the present invention.
  • the book information and mark data of books in which mark data has already been generated may be stored in the database 100 to construct the database 100.
  • the book information and mark data may be directly input into the database 100 through a known input means, or may be stored by receiving pre-stored book information and mark data from an external server provided by a library or the like.
  • the book information may include book bibliographic information, category information, and table of contents information.
  • bibliographic information may include book name, author, publisher or ISBN information
  • category information may include general, philosophical, religious, social science, natural science, technical science, art, language, literature, history, etc.
  • the present invention is not limited to this, and it can be classified into various types according to a user's setting including upper and lower items.
  • the book information may further include reference information.
  • Reference information may include a book introduction, a summary, the language of the original application, the original title and the original author, but is not limited thereto, and various information related to the book may be included according to a user's setting.
  • the database 100 may form and store a mapping table in which book information and non-serge information of the stored book correspond.
  • step (a) the database 100 is constructed using information on books in which mark data including non-surgery information is already generated, and the book information of books stored in the database 100 is not bibliographically.
  • a mapping table mapped with information may be formed and stored in the database 100.
  • step (b) the mark generation unit 200 receives the book information of the new book, and marks the new book based on the received book information of the new book and the database 100 constructed in step (a) above. Data can be generated.
  • FIG. 7 is a flowchart illustrating a method of generating mark data of a new book by the mark generator 200 according to an embodiment of the present invention.
  • a method for generating mark data of a new book includes: (b-1) receiving book information of a new book through the input unit 210; (b-2) extracting unit 220, extracting non-bibliographic information mapped to book information received from the database 100; (b-3) the analysis unit 230, calculating the similarity with the book stored in the database 100 through the morpheme analysis of the received bibliographic information; (b-4) generating unit 240, updating the extracted secretarial information based on the similarity and generating mark data; may include.
  • step (b-1) book information including bibliographic information and category information of the new book is received through the input unit 210.
  • step (b-1) the user inputs bibliographic information of the new book to generate mark data and category information estimated by the user.
  • the bibliographic information and category information received from the user may be directly input to the input unit 210 through a known input means, or received from an external server through the communication unit 300 and input to the input unit 210.
  • the bibliographic information among the book information input by the user includes objective information described in the book, such as a book name, an author, a publisher, or an ISBN, and the category information may be a category estimated according to the subjective interpretation of the user.
  • the book information received in step (b-1) may further include reference information in addition to bibliographic information, category information, and table of contents information.
  • the reference information may include a book introduction, a summary, the language of the original application, the original title and the original author, but is not limited thereto.
  • step (b-2) non-surgery information mapped to book information of the new book received in step (b-1) is extracted through the extraction unit 220.
  • a mapping table indicating a correspondence relationship between book information including category information and non-bibliographic information corresponding thereto is stored, and in step (b-2), based on the mapping table (b-1) In step), non-bibliographic information mapped to book information input by the user may be extracted.
  • step (b-3) the analysis unit 230 calculates the similarity with the book stored in the database 100 through morpheme analysis of the received bibliographic information.
  • Morphological analysis is a kind of natural language processing technique that analyzes human language through a mechanical device such as a computer, and means a method of decomposing and analyzing a target word into a morphological unit that is a minimum semantic unit.
  • the analysis unit 230 performs morpheme analysis on the bibliographic information of the new book received in step (b-1), and compares it with morphemes forming bibliography of books pre-stored in the database 100 to compare similarity. Can be calculated.
  • the similarity can be calculated through (the same number of morphemes) ⁇ (category weight), and this is as follows.
  • N i The number of the same morphemes (N i ) is a formula that the more frequently the same morpheme appears, the more likely it is to be similar to a new book.
  • the category weight (w i ) is a formula that a book having a category similar to the category information input by the user is more likely to be similar to a new book.
  • the category weight may be set such that the higher the weight is set for the books in which the KDC, DDC, and the hundreds, tens, and ones digits extracted in step (b-2) coincide.
  • KDC and DDC is a classification system that classifies books through a method of gradually descending from the top to the bottom by descending to hundreds, tens, ones, and decimals using numbers from 0 to 9, whites, The more the digits of the tens and ones of the coincidence in turn, the more likely it is a book of a similar category.
  • the category weight of the book in which the KDC, DDC of the new book calculated in step (b-2) and the white digit, the ten digit, and the one digit are all set is highest, and then It can be set in the order of a book with a white digit, a book with a white digit, and a book with a white digit, and finally a book with a white digit.
  • a weight may be set differently according to each morpheme.
  • Each morpheme extracted from the bibliographic information of the book by the analysis unit 230 may have a different degree of association with the category in which each book is included. In consideration of this, it is possible to set the weight to be differently assigned to each morpheme.
  • the weight assigned to each morpheme may be set such that the higher the frequency, the more frequent the morphemes appear within the same category.
  • the analysis unit 230 may perform morpheme analysis on reference information as well as bibliographic information of a new book.
  • Reference information may include a book introduction, a table of contents, a summary, the language of the application, the original name and original author.
  • step (b-4) the generating unit 240 updates the extracted secretarial information based on the similarity calculated in step (b-3), and generates mark data.
  • the KDC or DDC extracted in step (b-2) is a KDC or DDC that is mapped to category information input as unstructured data by the user's estimation, so it covers a wide range or has low accuracy.
  • step (b-4) a more accurate KDC, DDC is calculated by updating the extracted KDC or DDC based on the bibliographic information of the received book, and marks including the KDC or DDC calculated with high accuracy are obtained. Data can be generated.
  • the mark data of the new book generated through the step (b-4) may be automatically updated and stored in the database 100 according to the present invention together with the book information of the new book.
  • step (c) the mark data of the new book generated in step (b) may be transmitted to a terminal owned by the user or a server operated by the user (for example, a library server) and provided to the user.
  • a server operated by the user for example, a library server
  • an item desired by the user may be filtered and provided among the generated mark data.
  • the mark data generated according to the method for generating mark data according to the present invention is coded and stored in general information about a book, including book name, author, edition matter, publication matter, form matter, subject, cycle, etc. It can be data. Each user or library can selectively select and provide items to be used.
  • FIG. 8 is a diagram illustrating filtering mark data according to an embodiment.
  • libraries A, ⁇ , and N define only items corresponding to a selected area and exclude items corresponding to a non-selected area through library defined filters A to N defined by each library. By doing so, only desired items of the mark data generated by the real-time mark data generation system can be filtered and provided.
  • KDC / DDC information As described above, the generation of KDC / DDC information has been described above as an example, but the technical spirit of the present invention is not necessarily limited to this, and whether KDC / DDC information is included, indicating whether references and indexes, publications, Whether the author is an individual or an organization, subject words, customized billing symbols for each library, and book registration symbols for each library, various information that cannot be obtained by using only basic bibliographic information of a book can be generated.
  • a new book that is input or transmitted by a user (for example, a person who applies for a book to purchase a book) in the real-time mark generation system 10 according to the present invention when applying for a desired book.
  • a user server for example, a library server, a reception server, etc.
  • the user server parses the mark data and books Meta information can be extracted.
  • the user server can create a suseo list containing mark data in the extracted book meta information. At this time, the mark data becomes data at the time when it is transmitted to the user server to the real-time mark generation system 10 of the present invention.
  • the method for generating and transmitting real-time mark data uses only standardized standard data format mark data when transmitting from the real-time mark generation system 10 to the user server, so that the user or user server is used for the first interlocking operation.
  • FIG. 10 shows another modified example of the process of generating mark data of a new book generated in real time according to the present invention, and then transmitting the generated mark data to a user server (for example, a library server, a reception server, etc.) It is shown.
  • a user server for example, a library server, a reception server, etc.
  • the real-time mark generation system 10 of the present invention transmits mark data to a user server
  • the meta information of the book is transmitted as a single value together with the mark data generated in real time. Way.
  • the user server receives the meta information of the book together with the mark data generated in real time as a single value, so that the book list can be created more quickly and accurately using the book meta information and includes the transmitted mark data. I can do it.
  • real-time mark data is transmitted in this way, there is an advantage that can be applied to the existing system through the least modification.
  • the present invention relates to a method and system for generating mark data in real time when a library user applies for a desired book, through bibliography and category information of new books requiring mark data generation and big data analysis using AI Mark data can be automatically generated and transmitted according to a user's desired format.
  • mark data can be generated in real time and transmitted to the user's library or library server.
  • it is possible to generate and provide high-quality mark data that includes accurate and sufficient items that can be utilized in the actual library system through big data analysis using AI for bibliographic information and category information of new books.
  • AI bibliographic information and category information

Abstract

본 발명은 실시간 마크 데이터 생성 방법 및 시스템에 관한 것으로, 본 발명의 일 실시예에 따른 실시간 마크 데이터 생성 방법은 (a) 마크 데이터가 생성되어 있는 도서의 도서 정보 및 마크 데이터를 이용해 데이터베이스를 구축하는 단계; (b) 신규 도서의 도서 정보를 입력받고, 상기 입력받은 신규 도서의 도서 정보 및 상기 데이터베이스를 기반으로 신규 도서의 마크 데이터를 생성하는 단계; 및 (c) 상기 생성된 신규 도서의 마크 데이터를 사용자에게 제공하는 단계;를 포함할 수 있다.

Description

이용자가 희망 도서 신청 시 실시간으로 마크 데이터를 생성하고 전송하는 방법 및 이를 위한 시스템
본 발명은, 도서관 이용자가 희망도서를 신청할 때, 실시간으로 마크 데이터를 생성하는 방법 및 시스템에 관한 것으로, 보다 상세하게는 마크 데이터 생성이 필요한 신규 도서의 서지사항과 카테고리 정보 및 AI를 활용한 빅데이터 분석을 통해 자동으로 마크 데이터를 생성하여 사용자가 원하는 형식에 맞게 전송할 수 있는, 희망도서 신청 시 실시간으로 마크 데이터를 생성하고, 이를 사용자인 도서관 혹은 도서관 서버로 전송하는 방법과 이를 구현할 수 있는 시스템에 관한 것이다.
마크(MARC) 데이터는 도서와 관련된 전반적인 정보를 컴퓨터가 목록 데이터로 식별하여 축적, 유통할 수 있도록 코드화한 일련의 메타데이터 표준 형식을 의미한다. 현재 국내에서는 미국 표준(USMARC)과 캐나다 표준(CAN/MARC)의 통합 형식인 MARC 21을 기본 틀로 하여 2005년 통합 서지용 한국 문헌 자동화 목록(KORMARC) 형식을 KS 규격으로 제정하여 사용하고 있다. 이러한 통합 서지용 KORMARC 형식은 도서의 도서명, 저자, 판 사항, 발행 사항, 형태 사항, 주제, 주기 등과 같은 도서와 관련된 전반적인 정보를 포함한다.
기존에는, 도 1에 제시된 것처럼, 도서의 판매처에서 MARC 데이터를 생성하여 도서 납품처에 제공하거나, 국립중앙도서관 또는 한국교육학술정보원이 직접 MARC 데이터를 생성하여 업로드 하면 다른 도서관들은 이를 다운로드하여 사용하는 방식을 이용해왔다.
그러나 MARC 데이터는 도서명, 저자, 출판일 등과 같이 도서에 기재되어 있는 객관적인 정보를 담고 있는 항목뿐만 아니라, 한국십진분류법(이하, KDC) 또는 듀이십진분류법(이하, DDC)와 같이 이를 부여하는 사서의 주관이 반영되는 항목도 포함되어 있기 때문에, 종래 방식에 따라 양질의 MARC 데이터 생성을 위해서 전문적인 지식을 지닌 사서가 반드시 필요하며, 도서 납품처에서 제공하는 방법을 통해서는 양질의 MARC 데이터를 제공받기 어려운 문제점이 있다.
또한, 도서관에서 근무하는 전문적인 지식을 지닌 사서가 MARC 데이터 생성 업무를 수행한다고 하더라도, 여전히 오류의 가능성이 존재하고, 도서관 마다 제각기 다른 MARC 데이터가 생성될 가능성이 존재하며, 각 도서 마다 방대한 양의 정보를 검색하고 입력하는 작업을 반복해야 하므로 상당한 시간이 소요되며 비효율적이라는 문제점이 존재한다.
이와 같은 문제점을 해결하기 위해, 종래 자동으로 MARC 데이터를 생성하기 위한 다양한 시도들이 있었으나(대한민국 등록특허제10-0991661호 등), 이들은 책으로부터 직접적으로 획득할 수 있는 서지정보만을 활용하여 MARC 데이터를 생성하고자 하였기 때문에, 여전히 실제 도서관에서 활용될 수 있을 만큼의 충분한 항목의 MARC 데이터를 생성하지 못하거나, 여전히 정확도가 상당히 떨어지는 문제점이 존재한다.
이와 같이 서지정보만으로는 획득할 수 없는, KDC/DDC, 참고문헌과 색인의 여부 표시, 출반지, 저자가 개인인지 단체인지 여부, 주제어, 도서관별 맞춤 청구기호 및 도서관별 도서등록번호 등을 포함한 도서의 MARC 데이터를 자동으로 생성하고, 특히 이용자가 희망도서를 신청할 때 이렇게 생성된 마크 데이터를 사용자가 원하는 형식에 맞게 전송하거나 제공해줄 수 있는 기술이 요구되고 있으며, 본 발명은 이와 관련된 것이다.
본 발명은 전술한 종래 기술의 문제점을 해결하기 위하여 안출된 것으로, AI를 활용한 빅데이터 분석을 통해 마크 데이터 중 기본서지 사항만으로는 생성할 수 없었던, 비서지 사항들(예를 들어 KDC/DDC, 참고문헌과 색인의 여부 표시, 출판지, 저자가 개인인지 단체인지 여부, 주제어, 도서관별 맞춤 청구기호, 도서관별 도서등록번호 등)까지 정확하게 생성하고, 이용자가 희망 도서를 신청할 때 사용자인 각 도서관들에 전송하는 것을 목적으로 한다.
또한, 마크 데이터 생성을 자동화함으로써, 많은 양의 도서에 대하여도 실시간으로 정확한 마크 데이터를 생성하여 마크 데이터의 생성 효율을 극대화하고, 이를 희망도서 신청 시 사용자에게 전송하는 것을 목적으로 한다.
본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
전술한 문제점을 해결하기 위한 본 발명의 일 실시예에 따른 실시간 마크 데이터 생성 방법은, (a) 마크 데이터가 생성되어 있는 도서의 도서 정보 및 마크 데이터를 이용해 데이터베이스(100)를 구축하는 단계; (b) 신규 도서의 도서 정보를 입력받고, 상기 입력받은 신규 도서의 도서 정보 및 상기 데이터베이스(100)를 기반으로 신규 도서의 마크 데이터를 생성하는 단계; 및 (c) 상기 생성된 신규 도서의 마크 데이터를 사용자에게 제공하는 단계;를 포함할 수 있다.
일 실시예에 따르면, 상기 도서 정보는 도서에 대한 서지 정보, 카테고리 정보 및 목차 정보를 포함할 수 있다.
일 실시예에 따르면, 상기 (a) 단계는, 마크 데이터가 생성되어 있는 도서의 도서 정보와 대응되는 비 서지 정보가 매핑된 매핑 테이블을 형성하여 데이터베이스에 저장하되, 상기 비 서지 정보는, KDC/DDC, 참고문헌과 색인의 여부, 출판지, 저자가 개인인지 단체인지 여부, 주제어 중 적어도 어느 하나를 포함할 수 있다.
일 실시예에 따르면, 상기 (b) 단계는, (b-1) 입력부를 통해 신규 도서의 도서 정보를 입력받는 단계; (b-2) 추출부가, 상기 데이터베이스로부터 입력받은 도서 정보와 매핑된 비 서지 정보를 추출하는 단계; (b-3) 분석부가, 입력받은 서지 정보에 대한 형태소 분석을 통해 상기 데이터베이스에 저장된 도서와의 유사도를 산출하는 단계; (b-4) 생성부가, 상기 유사도를 기초로 상기 추출한 비 서지 정보를 갱신하고 마크 데이터를 생성하는 단계;를 포함할 수 있다.
일 실시예에 따르면, 상기 유사도는, 동일한 형태소의 수와 카테고리 가중치의 곱으로 산출될 수 있다.
일 실시에에 따르면, 상기 (c) 단계는, 상기 생성된 마크 데이터 중 사용자가 원하는 항목을 필터링 하여 제공할 수 있다.
한편, 실시간 마크 데이터 생성 방법을 수행하기 위한 본 발명의 일 실시예에 따른 마크 데이터 생성 시스템(10)은, 마크 데이터가 생성되어 있는 도서의 도서 정보 및 마크 데이터를 저장하는 데이터베이스; 신규 도서의 도서 정보를 입력받고 마크 데이터를 생성하는 마크생성부; 외부 단말과 통신하여 도서 정보 또는 마크 데이터를 송수신하는 통신부; 및 제어부;를 포함하고, 상기 데이터베이스는, 도서 정보와 대응되는 비 서지 정보가 매핑된 매핑 테이블을 형성하여 저장하되, 상기 비 서지 정보는, KDC/DDC, 참고문헌과 색인의 여부, 출판지, 저자가 개인인지 단체인지 여부, 주제어 중 적어도 어느 하나를 포함할 수 있다.
일 실시예에 따르면, 상기 마크생성부는, 신규 도서의 도서 정보를 입력받는 입력부; 상기 신규 도서의 도서 정보와 대응되는 비 서지 정보를 추출하는 추출부; 상기 신규 도서의 서지 정보에 대한 형태소 분석을 수행하는 분석부; 상기 비 서지 정보를 갱신하고 이를 포함한 신규 도서의 마크 데이터를 생성하는 생성부;를 포함할 수 있다.
본 발명의 다른 실시 형태에 따른 실시간 마크 데이터 생성 방법은, 마크 데이터가 생성되어 있는 도서의 도서 정보 및 마크 데이터를 이용하여 데이터베이스를 구축하는 구축 단계; 신규 도서의 도서 정보를 이용자로부터 입력받고, 상기 입력받은 신규 도서의 도서 정보와 상기 데이터베이스를 기반으로 신규 도서의 마크 데이터를 생성하는 생성 단계; 및 상기 생성된 신규 도서의 마크 데이터를 희망도서 신청 시 사용자에게 전송하는 전송 단계;를 포함한다.
이때 상기 도서 정보는, 도서에 대한 서지 정보, 카테고리 정보 및 목차 정보 중 적어도 어느 하나 이상을 포함할 수 있다.
상기 구축 단계는, 마크 데이터가 생성되어 있는 도서의 도서 정보와 대응되는 비서지 정보가 매핑된 매핑 테이블을 형성하여 데이터베이스에 저장하고, 상기 비서지 정보는, KDC/DDC, 참고문헌과 색인의 여부, 출판지, 저자가 개인인지 단체인지 여부, 주제어 중 적어도 어느 하나 이상을 포함할 수 있다.
상기 생성 단계는, 입력부를 통해, 신규 도서의 도서 정보를 입력받는 단계;
추출부를 통해, 상기 데이터베이스로부터 입력받은 도서 정보와 매핑된 비 서지 정보를 추출하는 단계; 분석부를 통해, 입력받은 서지 정보에 대한 형태소 분석을 통해 상기 데이터베이스에 저장된 도서와의 유사도를 산출하는 단계; 및 생성부를 통해 상기 유사도를 기초로 상기 추출한 비서지 정보를 갱신하고 마크 데이터를 생성하는 단계;를 포함할 수 있다.
상기 유사도는, 동일한 형태소의 수와 카테고리 가중치의 곱으로 산출되는 것이 바람직하다.
상기 전송 단계는, 상기 생성된 마크 데이터 중 사용자가 원하는 항목을 필터링 하여 사용자에게 전송하되, 상기 마크 데이터에는 도서의 기본 서지 정보 더 포함되는 것이 바람직하다.
본 발명의 또 다른 실시 형태로, 마크 데이터가 생성되어 있는 도서의 도서 정보 및 마크 데이터가 저장된 데이터베이스; 신규 도서의 도서 정보를 입력받고 마크 데이터를 생성하는 마크생성부; 외부 단말과 통신하여 도서 정보 또는 마크 데이터를 송수신하는 통신부; 및 제어부;를 포함하는 실시간 마크 데이터 생성 및 전송 시스템을 들 수 있다.
상기 데이터베이스는, 수신된 도서 정보와 대응되는 비서지 정보가 매핑된 매핑 테이블을 형성하여 저장하고, 상기 통신부는, 사용자의 서버에 실시간으로 생성된 마크 데이터를 전송하는 것이 바람직하다.
상기 마크생성부는, 신규 도서의 도서 정보를 입력받는 입력부; 상기 신규 도서의 도서 정보와 대응되는 비 서지 정보를 추출하는 추출부; 상기 신규 도서의 서지 정보에 대한 형태소 분석을 수행하는 분석부; 및 상기 비 서지 정보를 갱신하고 이를 포함한 신규 도서의 마크 데이터를 생성하는 생성부;를 포함할 수 있다.
본 발명에 의하면, 신규 도서의 서지정보, 카테고리 정보뿐만 아니라 이에 대한 AI를 활용한 빅데이터 분석을 통해 실제 도서관 시스템 내에서도 활용할 수 있는, 정확하고도 충분한 항목을 포함하는 양질의 마크데이터를 생성하여 제공할 수 있다.
구체적으로, 마크 데이터 중 도서의 기본 서지 정보만으로는 획득할 수 없는 비 서지 정보들, 예를 들어 KDC/DDC, 참고문헌과 색인의 여부 표시, 출판지, 저자가 개인인지 단체인지 여부, 주제어, 도서관별 맞춤 청구기호, 도서관별 도서등록번호 등에 대한 정보를 자동으로 생성하여 각 도서관에 제공할 수 있다.
또한, 본 발명에 의하면 반드시 전문 지식을 지닌 사서가 아니어도 양질의 마크 데이터를 생성할 수 있어 도서관의 효율적인 인력 운용이 가능하다.
또한, 이러한 빅데이터가 저장된 시스템을 통해 마크 데이터 생성을 자동화 함으로써 많은 양의 도서에 대하여도 실시간으로 정확한 마크 데이터를 생성하여 마크 데이터의 생성 효율을 극대화 할 수 있다.
또한, 마크 데이터를 생성하여 도서관 마다 필요한 형식에 맞게 필터링 하여 제공함으로써 도서관 마다 별개의 마크 데이터를 생성할 필요 없이, 모든 도서관이 이용할 수 있는 통합 서비스를 제공할 수 있으며, 이와 같이 각 도서관이 동일한 체계를 갖는 마크 데이터를 활용하므로 도서관 및 도서관 이용자 모두가 효율적으로 도서관 서비스를 제공 또는 이용할 수 있도록 한다.
특히 도서관 희망도서 신청 시, 정확한 메타정보 수집을 위한 용도로 유용하게 사용할 수 있는데, 기존의 메타정보에 포함되지 못하였던 MARC (Machine-Readable Cataloging) 정보를 전송해줄 수 있어, 도서관에서 아주 유용하게 사용될 수 있다.
본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해 될 수 있을 것이다.
도 1은 종래 기술에 따른 마크 데이터 제공 방법을 나타낸 도면이다.
도 2는 본 발명의 일 실시예에 따른 마크 데이터 생성 및 제공 방법을 나타낸 도면이다.
도 3은 본 발명의 일 실시예에 따른 마크 데이터 생성 시스템(10)을 이용해 마크 데이터를 생성하는 것을 개략적으로 나타낸 도면이다.
도 4는 본 발명의 일 실시예에 따른 실시간 마크 데이터 생성 시스템(10)의 구성을 나타낸 도면이다.
도 5는 본 발명의 일 실시예에 따른 마크생성부(200)의 구성을 나타낸 도면이다.
도 6은 본 발명의 일 실시예에 따른 실시간 마크 데이터 생성 방법을 나타낸 순서도이다.
도 7은 본 발명의 일 실시예에 따른 마크생성부(200)가 신규 도서의 마크 데이터를 생성하는 방법을 나타낸 순서도이다.
도 8은 일 실시예에 따라 마크 데이터를 필터링하는 것을 나타낸 도면이다.
도 9와 도 10은 본 발명에 따른 실시간 마크 생성 시스템(10)에서 사용자 서버로 생성된 마크 데이터를 전송하는 과정을 도식적으로 나타낸 것이다.
[부호의 설명]
10: 마크 데이터 생성 시스템
100: 데이터베이스 200: 마크생성부
210: 입력부 220: 추출부
230: 분석부 240: 생성부
300: 통신부 400: 제어부
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시 예를 상세히 설명한다. 본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시 예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시 예에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시 예들은 본 발명의 게시가 완전하도록 하고, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다. 본 명세서에서 사용된 용어는 실시 예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다.
도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 동일 또는 유사한 구성요소에 대해서는 동일한 참조부호를 붙였다. 그리고 어떤 부분이 어떤 구성 요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에서 기술한 "부"란, 특정 기능을 수행하는 하나의 단위 또는 블록을 의미한다.
도 1은 종래 기술에 따른 마크 데이터 제공 방법을 나타낸 도면이고, 도 2는 본 발명의 일 실시예에 따른 마크 데이터 생성 및 제공 방법을 나타낸 도면이다.
도 1을 참조하면, 종래에는 일반적으로 도서의 판매처에서 MARC 데이터를 생성하여 도서 납품처에 제공하거나, 국립중앙도서관 또는 한국교육학술정보원이 직접 MARC 데이터를 생성하여 업로드 하면 다른 도서관들은 이를 다운로드하여 사용하는 방식을 이용해왔다.
그러나 MARC 데이터는 도서명, 저자, 출판일 등과 같이 도서에 기재되어 있는 객관적인 정보를 담고 있는 항목뿐만 아니라 한국십진분류법(이하, KDC) 또는 듀이십진분류법(이하, DDC)와 같이 이를 부여하는 사서의 주관이 반영되는 항목도 포함되어 있어 종래 방식에 따라 양질의 MARC 데이터 생성을 위해서 전문적인 지식을 지닌 사서가 반드시 필요하기 때문에, 도서 납품처에서 제공하는 방법을 통해서는 양질의 MARC 데이터를 제공받기 어려운 문제점이 있다.
또한, 도서관에서 근무하는 전문적인 지식을 지닌 사서가 MARC 데이터 생성 업무를 수행한다고 하더라도, 여전히 오류의 가능성이 존재하고 각 도서 마다 방대한 양의 정보를 검색하고 입력하는 작업을 반복해야 하므로 상당한 시간이 소요되며 효율적이지 못한 문제점이 있다.
도 2를 참조하면, 본 발명은 전술한 문제점을 해결하기 위하여 안출된 것으로, 각 도서관에서 본 발명에 따른 마크 데이터 생성 시스템(10)에 도서 정보를 입력하면, 자동으로 마크 데이터를 생성하고, 이렇게 생성된 마크 데이터를 도서관으로 직접 전송하여 제공할 수 있다.
이하에서는, 도 3 내지 도 10을 참조하여 본 발명에 따른 실시간 마크 데이터 생성 시스템 및 이를 이용한 마크 데이터 생성 방법에 대하여 상술하도록 한다.
또한, 본 명세서에서는 KDC/DDC 정보의 생성을 예시로서 설명할 것이나, 반드시 이에 한정되는 것은 아니고 이하 설명할 본 발명과 동일한 기술적 사상을 이용하면 참고문헌과 색인의 여부 표시, 출판지, 저자가 개인인지 단체인지 여부, 주제어, 도서관별 맞춤 청구기호, 도서관별 도서등록기호 등과 같은 도서의 기본 서지정보만으로는 획득할 수 없는 다양한 정보를 생성할 수 있음은 물론이다.
도 3은 본 발명의 일 실시예에 따른 마크 데이터 생성 시스템(10)을 이용해 마크 데이터를 생성하는 것을 개략적으로 나타낸 도면이다.
상기 도 3을 참조하면, 본 발명은 이용자가 희망도서를 (사용자인) 도서관 혹은 도서관 서버에 신청할 때, 신규 도서에 대한 서지 정보 및 카테고리 정보를 포함하는 도서 정보를 입력받고, 이를 이용해 마크 데이터를 생성하여, 사용자에게 제공하는 실시간 마크 데이터 생성 방법 및 시스템을 제공할 수 있다.
마크 데이터는 도서와 관련된 전반적인 정보를 컴퓨터가 목록 데이터로 식별하여 축적, 유통할 수 있도록 코드화한 일련의 메타데이터 표준 형식을 의미하는 것으로, 본 발명은 빅데이터를 기반으로 입력받은 서지 정보 및 카테고리 정보와 같은 제한적인 정보를 이용해 마크 데이터를 구성하는 항목에 대한 정보를 추정하고 그를 마크 데이터로서 생성하여 제공할 수 있다.
이때, 서지 정보는 도서명, 저자, 출판사 또는 ISBN 정보를 포함할 수 있으며, 카테고리 정보는 예를 들면 총류, 철학, 종교, 사회과학, 자연과학, 기술과학, 예술, 언어, 문학, 역사 등을 포함할 수 있으나, 반드시 이에 한정되는 것은 아니고 이들의 상, 하위 항목을 포함하여 사용자의 설정에 따라 다양하게 분류될 수 있음은 물론이다.
또한, 신규 도서는 반드시 일정 기간 내 새로 발간된 도서만을 의미하는 것은 아니고, 사용자의 의사에 따라 새로이 마크 데이터를 생성할 필요가 있는 모든 도서를 포함할 수 있다.
도 4는 본 발명의 일 실시예에 따른 실시간 마크 데이터 생성 시스템(10)의 구성을 나타낸 도면이다.
상기 도 4를 참조하면, 본 발명에 따른 실시간 마크 데이터 생성 시스템(10)은, 데이터베이스(100), 마크생성부(200), 통신부(300) 및 제어부(400)를 포함할 수 있다.
데이터베이스(100)는 이미 마크 데이터가 생성되어 있는 도서들의 도서 정보 및 해당 도서 정보와 대응되는 마크 데이터를 저장할 수 있다.
데이터베이스(100)에 저장되는 도서 정보는 서지 정보, 카테고리 정보 및 목차 정보를 포함할 수 있다. 서지 정보는 도서명, 저자, 출판사 또는 ISBN 정보 등을 포함할 수 있으며, 카테고리 정보는 예를 들면 총류, 철학, 종교, 사회과학, 자연과학, 기술과학, 예술, 언어, 문학, 역사 등을 포함할 수 있으나, 반드시 이에 한정되는 것은 아니고 이들의 상, 하위 항목을 포함하여 사용자의 설정에 따라 다양하게 분류될 수 있음은 물론이다.
일 실시예에 따르면, 데이터베이스(100)에 저장되는 도서 정보는 참조 정보를 더 포함할 수 있다. 참조 정보는 책 소개, 요약, 원서의 언어, 원서명 및 원저자 등을 포함할 수 있으나, 반드시 이에 한정되는 것은 아니고 사용자의 설정에 따라 도서와 관련된 다양한 정보가 포함될 수 있다.
또한, 데이터베이스(100)는 각 도서들의 서지 정보 또는 참조 정보를 이루는 형태소에 대한 정보를 더 저장할 수 있다. 이는 후술할 분석부(230)가 형태소 분석을 통해 신규 도서와 기저장된 도서와의 유사도를 산출함에 있어서 이용될 수 있는데, 이와 관련하여는 후에 분석부(230)를 설명하면서 상술하도록 한다.
상기 데이터베이스(100)에 저장되는 도서 정보 및 마크 데이터는, 공지의 입력 수단(키보드, 마우스, 터치 패드 또는 터치 스크린 등)을 통해 직접 데이터베이스(100)로 입력되거나, 혹은 도서관 등이 구비하고 있는 외부의 서버로부터 도서 정보 및 마크 데이터를 수신하여 저장할 수 있다. 또는 후술할 바와 같이, 본 발명에 따른 실시간 마크 데이터 생성 방법에 따라 생성된 신규 도서의 마크 데이터 또한 신규 도서의 도서 정보와 함께 데이터베이스(100)에 저장될 수 있다.
한편, 본 발명의 일 실시예에 따른 데이터베이스(100)는 저장된 도서의 도서 정보와 비서지 정보를 대응시킨 매핑 테이블을 형성하여 저장할 수 있다. 비서지 정보는 예를 들면 KDC/DDC, 참고문헌과 색인의 여부 표시, 출판지, 저자가 개인인지 단체인지 여부 및 주제어 등을 포함할 수 있다. 여기서 KDC(Korean Decimal Classification, 한국십진분류법), DDC(Dewey Decimal Classification, 듀이십진분류법)는 주제에 따른 도서 분류 체계로서, 0~9의 숫자를 이용해 백의자리, 십의자리, 일의자리 및 소수점 이하로 내려가면서 점점 하위 항목으로 분류되는 방식을 통해 도서를 분류하는 분류 체계를 의미한다. 상기 데이터베이스(100)에 저장되는 마크 데이터에는 이러한 도서의 KDC 또는 DDC 정보가 포함될 수 있다.
본 발명에 따른 데이터베이스(100)는, 마크 데이터가 기생성되어 있는 도서들의 도서 정보와 해당 도서의 마크 데이터에 포함된 비서지 정보를 대응시킨 매핑 테이블을 형성하여 저장할 수 있는 것이다.
마크생성부(200)는 신규 도서의 도서 정보를 입력받고, 상기 입력받은 신규 도서의 도서 정보를 기반으로 마크 데이터를 생성할 수 있다.
도 5는 본 발명의 일 실시예에 따른 마크생성부(200)의 구성을 나타낸 도면이다.
상기 도 5를 참조하면, 본 발명의 일 실시예에 따른 마크생성부(200)는, 입력부(210); 추출부(220); 분석부(230);및 생성부(240);를 포함할 수 있다.
입력부(210)는 마크 데이터를 생성할 신규 도서의 도서 정보를 입력받을 수 있다. 이 때, 입력부(210)에 입력되는 도서 정보는, 공지의 입력수단에 의하여 직접 입력되거나, 또는 후술할 통신부(300)를 통해 외부 서버로부터 데이터의 형태로 수신하여 입력될 수 있다. 상기 입력부(210)를 통해 입력되는 도서 정보는 신규 도서의 서지 정보, 카테고리 정보 또는 목차 정보를 포함할 수 있다.
추출부(220)는 입력받은 신규 도서의 도서 정보와 매핑되어 있는 비서지 정보를 추출할 수 있다. 전술한 바와 같이, 데이터베이스(100)에는 기저장된 도서들의 도서 정보 및 이와 대응되는 비서지 정보의 대응 관계를 나타내는 매핑 테이블이 저장되며, 추출부(220)는 이러한 매핑 테이블을 기초로 상기 입력부(210)를 통해 입력된 도서 정보와 매핑된 비서지 정보를 추출할 수 있다. 예를 들어, 입력부(210)를 통해 입력된 도서 정보 중 카테고리 정보는, 사용자의 추정에 의해 비정형 데이터로서 입력된 카테고리 정보와 매핑되는 KDC, DDC이며, 추출부(220)는 매핑 테이블 상에서 상기 입력받은 카테고리 정보와 매핑된 KDC, DDC를 추출할 수 있다.
분석부(230)는 입력받은 신규 도서의 서지 정보에 대한 형태소 분석을 수행하고, 이를 상기 데이터베이스(100)에 기저장된 도서들의 서지 사항을 이루는 형태소들과 비교하여 유사도를 산출할 수 있다. 형태소 분석은 인간의 언어를 컴퓨터와 같은 기계 장치를 통해 분석하는 자연어 처리 기법의 한 종류로, 어떤 대상 어절을 최소의 의미 단위인 형태소 단위로 분해하여 분석하는 방법을 의미한다.
한편, 상기 유사도는 (동일한 형태소의 수)×(카테고리 가중치)를 통해 산출될 수 있으며, 이를 통해 유사도를 산출하는 방법 및 실시예에 대하여는 후술할 마크 데이터 생성 방법을 설명하면서 상술하도록 한다.
일 실시예에 따르면, 본 발명에 따른 분석부(230)는 참조 정보를 포함하여 형태소 분석을 수행하고, 유사도를 산출할 수 있다. 참조 정보는 책 소개, 목차, 요약, 원서의 언어, 원서명 및 원저자 등을 포함할 수 있으나 반드시 이에 한정되는 것은 아님은 물론이다.
생성부(240)는 상기 분석부(230)가 산출한 유사도를 기반으로 비 서지 정보를 갱신하고, 이를 포함한 마크 데이터를 생성할 수 있다.
상기 추출부(220)를 이용해 추출한 KDC 또는 DDC는 사용자의 추정에 의해 비정형 데이터로서 입력된 카테고리 정보와 매핑되는 KDC, DDC이므로 다소 넓은 범위를 포괄하거나 그 정확도가 낮을 수 있는데, 생성부(240)는 상기 분석부(230)가 산출한 유사도를 기반으로 하여 추출부(220)가 추출한 KDC 또는 DDC를 갱신함으로써 더욱 정확한 KDC, DDC를 산출하고, 이와 같이 높은 정확도로 산출된 KDC 또는 DDC를 포함한 마크 데이터를 생성할 수 있다.
통신부(300)는, 외부 단말과 통신하여 도서 정보 및/또는 마크 데이터를 송수신할 수 있다.
상기 외부 단말은 본 발명에 따른 통신부(300)와 통신할 수 있는 통신 수단을 가진 전자 장치를 의미하는 것으로, 사용자 단말, 도서관에 구비된 컴퓨터 또는 서버 등을 포함할 수 있다.
즉, 본 발명에 따른 실시간 마크 데이터 생성 시스템(10)은, 이용자가 희망도서 신청 시, 통신부(300)를 통해 외부 단말로부터 도서 정보 및/또는 마크 데이터를 수신하여 데이터베이스(100)에 저장하거나 신규 도서의 마크 데이터를 생성할 수 있고, 생성된 마크 데이터를 외부 단말 또는 서버로 전송하여 사용자에게 신규 도서의 마크 데이터를 제공할 수 있다.
제어부(400)는 마크 데이터 생성 시스템(10)의 전반적인 동작을 제어할 수 있다.
이하에서는, 전술한 본 발명에 따른 실시간 마크 데이터 생성 시스템(10)을 이용한 실시간 마크 데이터 생성 방법에 대하여 보다 상세히 설명한다.
도 6은 본 발명의 일 실시예에 따른 실시간 마크 데이터 생성 방법을 나타낸 순서도이다.
상기 도 6을 참조하면, 본 발명의 일 실시예에 따른 실시간 마크 데이터 생성 방법은, 이용자가 희망도서를 신청할 때 (a) 마크 데이터가 생성되어 있는 도서의 도서 정보 및 마크 데이터를 데이터베이스(100)에 구축 및 저장하는 단계; (b) 신규 도서의 도서 정보를 입력받고, 상기 입력받은 신규 도서의 도서 정보 및 상기 데이터베이스(100)를 기반으로 신규 도서의 마크 데이터를 생성하는 단계; 및 (c) 상기 생성된 신규 도서의 마크 데이터를 사용자에게 전송하는 단계;를 포함할 수 있다.
상기 (a) 단계에서, 이미 마크 데이터가 생성되어 있는 도서들의 도서 정보 및 마크 데이터를 데이터베이스(100)에 저장하여 데이터베이스(100)를 구축할 수 있다. 상기 도서 정보 및 마크 데이터는 공지의 입력 수단을 통해 직접 데이터베이스(100)에 입력되거나, 혹은 도서관 등이 구비하고 있는 외부의 서버로부터 기 저장되어 있는 도서 정보 및 마크 데이터를 수신하여 저장할 수 있다.
상기 도서 정보는 도서의 서지 정보, 카테고리 정보 및 목차 정보를 포함할 수 있다. 서지 정보는 도서명, 저자, 출판사 또는 ISBN 정보 등을 포함할 수 있으며, 카테고리 정보는 예를 들면 총류, 철학, 종교, 사회과학, 자연과학, 기술과학, 예술, 언어, 문학, 역사 등을 포함할 수 있으나, 반드시 이에 한정되는 것은 아니고 이들의 상, 하위 항목을 포함하여 사용자의 설정에 따라 다양하게 분류될 수 있음은 물론이다.
또한, 상기 도서 정보는 참조 정보를 더 포함할 수 있다. 참조 정보는 책 소개, 요약, 원서의 언어, 원서명 및 원저자 등을 포함할 수 있으나, 반드시 이에 한정되는 것은 아니고 사용자의 설정에 따라 도서와 관련된 다양한 정보가 포함될 수 있다.
일 실시예에 따르면, 데이터베이스(100)는 저장된 도서의 도서 정보와 비서지 정보를 대응시킨 매핑 테이블을 형성하여 저장할 수 있다.
즉, (a)단계에서는, 비서지 정보를 포함한 마크 데이터가 이미 생성되어 있는 도서들에 대한 정보를 이용해 데이터베이스(100)를 구축하고, 이와 같이 데이터베이스(100)에 저장된 도서들의 도서 정보를 비 서지 정보와 매핑시킨 매핑 테이블을 형성하여 데이터베이스(100)에 저장할 수 있다.
(b)단계에서, 마크생성부(200)가 신규 도서의 도서 정보를 입력받고, 입력받은 신규 도서의 도서 정보 및 상기 (a)단계에서 구축한 데이터베이스(100)를 기반으로 하여 신규 도서의 마크 데이터를 생성할 수 있다.
도 7은 본 발명의 일 실시예에 따른 마크생성부(200)가 신규 도서의 마크 데이터를 생성하는 방법을 나타낸 순서도이다.
상기 도 7을 참조하면, 본 발명에 따른 신규 도서의 마크 데이터 생성 방법은, (b-1) 입력부(210)를 통해 신규 도서의 도서 정보를 입력받는 단계; (b-2) 추출부(220)가, 상기 데이터베이스(100)로부터 입력받은 도서 정보와 매핑된 비 서지 정보를 추출하는 단계; (b-3) 분석부(230)가, 입력받은 서지 정보에 대한 형태소 분석을 통해 상기 데이터베이스(100)에 저장된 도서와의 유사도를 산출하는 단계; (b-4) 생성부(240)가, 상기 유사도를 기초로 상기 추출한 비서지 정보를 갱신하고 마크 데이터를 생성하는 단계;를 포함할 수 있다.
(b-1)단계에서는 입력부(210)를 통해 신규 도서의 서지 정보 및 카테고리 정보를 포함한 도서 정보를 입력받는다.
즉, (b-1)단계에서 사용자는 마크 데이터를 생성하고자 하는 신규 도서의 서지 정보 및 사용자가 추정한 카테고리 정보를 입력한다. 이와 같이 사용자로부터 입력받는 서지 정보 및 카테고리 정보는, 공지의 입력 수단을 통해 직접 입력부(210)에 입력되거나, 통신부(300)를 통해 외부 서버로부터 수신하여 입력부(210)에 입력될 수 있다.
여기서 사용자가 입력하는 도서 정보 중 서지 정보는 도서명, 저자, 출판사 또는 ISBN과 같이 도서에 기재되어 있는 객관적인 정보들을 포함하며, 카테고리 정보는 사용자의 주관적인 해석에 따라 추정한 카테고리일 수 있다.
상기 (b-1)단계에서 입력받는 도서 정보는, 서지 정보, 카테고리 정보 및 목차 정보 외에 참조 정보를 더 포함할 수 있다. 상기 참조 정보는 책 소개, 요약, 원서의 언어, 원서명 및 원저자 등을 포함할 수 있으나 반드시 이에 한정되는 것은 아님은 물론이다.
(b-2)단계에서는 추출부(220)를 통해 상기 (b-1) 단계에서 입력받은 신규 도서의 도서 정보와 매핑되어 있는 비서지 정보를 추출한다.
본 발명에 따른 데이터베이스(100)에는 카테고리 정보를 포함한 도서 정보 및 이와 대응되는 비 서지 정보의 대응 관계를 나타내는 매핑 테이블이 저장되며, (b-2) 단계에서는 이러한 매핑 테이블을 기초로 (b-1) 단계에서 사용자가 입력한 도서 정보와 매핑된 비 서지 정보를 추출할 수 있다.
(b-3)단계에서, 분석부(230)는 입력받은 서지 정보에 대한 형태소 분석을 통해 상기 데이터베이스(100)에 저장된 도서와의 유사도를 산출한다.
형태소 분석은 인간의 언어를 컴퓨터와 같은 기계 장치를 통해 분석하는 자연어 처리 기법의 한 종류로, 어떤 대상 어절을 최소의 의미 단위인 형태소 단위로 분해하여 분석하는 방법을 의미한다.
분석부(230)는 (b-1)단계에서 입력받은 신규 도서의 서지 정보에 대한 형태소 분석을 수행하고, 이를 상기 데이터베이스(100)에 기저장된 도서들의 서지 사항을 이루는 형태소들과 비교하여 유사도를 산출할 수 있다.
상기 유사도는, (동일한 형태소의 수)×(카테고리 가중치)를 통해 산출할 수 있으며, 이를 수식으로 나타내면 아래와 같다.
Figure PCTKR2019013088-appb-I000001
(Si:유사도, Ni:동일한 형태소의 수, wi:카테고리 가중치)
동일한 형태소의 수(Ni)는, 동일한 형태소가 나타나는 빈도가 많을수록 신규 도서와 유사할 가능성이 높음을 수식화 한 것이다.
카테고리 가중치(wi)는, 사용자가 입력한 카테고리 정보와 카테고리가 유사한 도서일수록 신규 도서와 유사할 가능성이 높음을 수식화 한 것이다.
일 실시예에 따르면, 상기 카테고리 가중치는 (b-2)단계에서 추출한 KDC, DDC와 백의자리, 십의자리 및 일의자리가 차례로 일치하는 도서일수록 높은 가중치가 설정되도록 할 수 있다.
KDC 및 DDC는 0~9의 숫자를 이용해 백의자리, 십의자리, 일의자리 및 소수점 이하로 내려가면서 점점 상위 항목에서 하위 항목으로 분류되는 방식을 통해 도서를 분류하는 분류 체계로서, 백의자리, 십의자리 및 일의자리가 차례로 일치할수록 서로 유사한 카테고리의 도서일 가능성이 높은 것이다.
즉, 상기 카테고리 가중치는, (b-2)단계에서 산출된 신규 도서의 KDC, DDC와 백의자리, 십의자리, 일의자리가 모두 일치하는 도서의 카테고리 가중치를 가장 높게 설정하고, 그 다음으로 백의자리, 십의자리가 일치하는 도서, 또 그 다음으로 백의자리가 일치하는 도서, 마지막으로 백의자리가 일치하지 않는 도서 순으로 설정할 수 있다.
상기 수식에는 표현되지 않았으나, 일 실시예에 따르면 상기 유사도를 산출함에 있어서 각 형태소에 따라 가중치가 달리 부여되도록 설정할 수 있다.
분석부(230)에 의하여 도서의 서지 정보로부터 추출되는 형태소마다 각 도서가 포함된 카테고리와의 연관성의 정도가 서로 다를 수 있는데, 이를 고려하여 각 형태소마다 가중치가 달리 부여되도록 설정할 수 있는 것이다.
이 경우, 상기 형태소마다 부여되는 가중치는, 동일한 카테고리 내에서 나타나는 빈도가 많은 형태소일수록 더 높은 가중치가 부여되도록 설정할 수 있다.
일 실시예에 따르면, 본 발명에 따른 분석부(230)는 신규 도서의 서지 정보뿐만 아니라 참조 정보에 대하여도 형태소 분석을 수행할 수 있다. 참조 정보는 책 소개, 목차, 요약, 원서의 언어, 원서명 및 원저자 등을 포함할 수 있다.
(b-4)단계에서, 생성부(240)는 (b-3) 단계에서 산출된 유사도를 기초로 상기 추출한 비서지 정보를 갱신하고, 마크 데이터를 생성한다.
예를 들어, 전술한 바와 같이 상기 (b-2)단계에서 추출한 KDC 또는 DDC는 사용자의 추정에 의해 비정형 데이터로서 입력된 카테고리 정보와 매핑되는 KDC, DDC이므로 다소 넓은 범위를 포괄하거나 그 정확도가 낮을 수 있는데, (b-4)단계에서는 상기 입력받은 도서의 서지 정보를 기반으로 상기 추출한 KDC 또는 DDC를 갱신함으로써 더욱 정확한 KDC, DDC를 산출하고, 이와 같이 높은 정확도로 산출된 KDC 또는 DDC를 포함한 마크 데이터를 생성할 수 있다.
한편, 상기 (b-4)단계를 통해 생성된 신규 도서의 마크 데이터는, 신규 도서의 도서 정보와 함께 본 발명에 따른 데이터베이스(100)에 자동으로 업데이트되어 저장될 수 있다.
(c)단계에서는 상기 (b) 단계에서 생성된 신규 도서의 마크 데이터를 사용자가 소지한 단말 또는 사용자가 운용하는 서버(예를 들면, 도서관 서버)로 전송하여 사용자에게 제공할 수 있다.
일 실시예에 따르면, 상기 (c)단계에서는 상기 생성된 마크 데이터 중 사용자가 원하는 항목을 필터링 하여 제공할 수 있다.
전술한 바와 같이, 본 발명에 따른 마크 데이터 생성 방법에 따라 생성되는 마크 데이터는 도서명, 저자, 판 사항, 발행 사항, 형태 사항, 주제, 주기 등을 포함하여 도서에 대한 전반적인 정보를 코드화 하여 저장한 데이터일 수 있다. 각 사용자 또는 도서관은 이 중 이용하고자 하는 항목만을 선별적으로 선택하여 제공받을 수 있다.
도 8은 일 실시예에 따라 마크 데이터를 필터링하는 것을 나타낸 도면이다.
상기 도 8을 참조하면, 도서관 A, 쪋, N은 각 도서관마다 정의한 도서관 정의 필터A 내지 도서관 정의 필터 N을 통해, 선택 영역에 해당하는 항목들만을 선별하고, 비선택 영역에 해당하는 항목들을 배제함으로써, 실시간 마크 데이터 생성 시스템에서 생성된 마크 데이터 중 원하는 항목만을 필터링하여 제공받을 수 있는 것이다.
전술한 바와 같이, 이상 본 명세서에서는 KDC/DDC정보의 생성을 예시로서 설명하였으나, 본 발명의 기술적 사상이 반드시 이에 한정되는 것은 아니고 KDC/DDC 정보를 포함하여 참고문헌과 색인의 여부 표시, 출판지, 저자가 개인인지 단체인지 여부, 주제어, 도서관별 맞춤 청구기호, 도서관별 도서등록기호 등과 같이 도서의 기본 서지정보만으로는 획득할 수 없는 다양한 정보를 생성할 수 있다.
도 9와 도 10은, 본 발명에 따른 실시간 마크 생성 시스템(10)에서 이용자(예기서는 도서를 구입하고자 도서 신청을 진행하는 사람을 의미한다)가 희망도서 신청시, 입력 혹은 전송한 신규 도서의 도서 정보를 입력받아, 실시간으로 생성된 신규 도서의 마크 데이터를 생성한 후, 이를 사용자 서버(예를 들어 도서관 서버, 수신 서버 등)로 생성된 마크 데이터를 전송하는 과정을 각각 도식적으로 나타낸 것이다.
상기 도 9에서 확인되듯이, 본 발명에 따른 실시간 마크 생성 시스템(10)에서 사용자에게 전송되는 마크 데이터 안에는 도서 메타정보가 포함되어 있으므로, 마크데이터만 전송되더라도, 사용자 서버에서 마크데이터를 파싱하여 도서 메타정보를 추출해 낼 수 있다. 또한, 사용자 서버에서는 추출된 도서 메타정보에 마크데이터가 포함된 수서리스트를 만들 수 있게 된다. 이때, 마크 데이터는 본 발명의 실시간 마크 생성 시스템(10)에 사용자 서버로 송신한 시점의 데이터가 된다.
따라서, 본 발명에 따른 실시간 마크 데이터의 생성 및 전송 방법은, 실시간 마크 생성 시스템(10)으로부터 사용자 서버로 송신 시 규격화된 표준 데이터 포맷인 마크데이터만을 사용하게 되므로, 최초 연동시에 사용자 혹은 사용자 서버는 송신처에 별도의 규격을 전달할 필요없이, (본 발명을 사용하는) 다양한 공급원으로부터 마크데이터를 받을 수 있다는 장점이 있다.
도 10은 본 발명에 따른 실시간으로 생성된 신규 도서의 마크 데이터를 생성한 후, 이를 사용자 서버(예를 들어 도서관 서버, 수신 서버 등)로 생성된 마크 데이터를 전송하는 과정에 관한 다른 변형예를 도시한 것이다.
앞서 살펴본 도 8의 과정과는 달리, 본 발명의 실시간 마크 생성 시스템(10)이 사용자 서버로 마크데이터를 전송할 때, 실시간으로 생성된 마크데이터와 함께 도서의 메타정보를 하나의 값으로 한꺼번에 전송하는 방식이다.
이렇게 사용자 서버는, 실시간으로 생성된 마크데이터와 함께 도서의 메타정보를 하나의 값으로 한꺼번에 전송받음으로써, 보다 신속하고 정확하게 도서 메타정보를 이용해 수서 리스트를 만들 수 있으며, 같이 전송된 마크데이터를 포함시킬 수 있다. 이러한 방식으로 실시간 마크데이터가 전송될 경우에는, 기존의 시스템에 가장 적은 수정을 거쳐서 적용될 수 있는 장점이 존재한다.
위에서 설명된 본 발명의 실시 예들은 예시의 목적을 위해 개시된 것이며, 이들에 의하여 본 발명이 한정되는 것은 아니다. 또한, 본 발명에 대한 기술 분야에서 통상의 지식을 가진 자라면, 본 발명의 사상과 범위 안에서 다양한 수정 및 변경을 가할 수 있을 것이며, 이러한 수정 및 변경은 본 발명의 범위에 속하는 것으로 보아야 할 것이다.
본 발명은, 도서관 이용자가 희망도서를 신청할 때, 실시간으로 마크 데이터를 생성하는 방법 및 시스템에 관한 것으로, 마크 데이터 생성이 필요한 신규 도서의 서지사항과 카테고리 정보 및 AI를 활용한 빅데이터 분석을 통해 자동으로 마크 데이터를 생성하여 사용자가 원하는 형식에 맞게 전송할 수 있으며, 희망도서 신청 시 실시간으로 마크 데이터를 생성하고, 이를 사용자인 도서관 혹은 도서관 서버로 전송할 수 있다. 또한, 신규 도서의 서지정보, 카테고리 정보뿐만 아니라 이에 대한 AI를 활용한 빅데이터 분석을 통해 실제 도서관 시스템 내에서도 활용할 수 있는, 정확하고도 충분한 항목을 포함하는 양질의 마크데이터를 생성하여 제공할 수 있으므로 산업상 이용가능성이 있다.

Claims (8)

  1. 실시간 마크 데이터의 생성 및 전송 방법에 있어서,
    마크 데이터가 생성되어 있는 도서의 도서 정보 및 마크 데이터를 이용하여 데이터베이스를 구축하는 구축 단계;
    신규 도서의 도서 정보를 이용자로부터 입력받고, 입력받은 신규 도서의 도서 정보와 상기 데이터베이스를 기반으로 신규 도서의 마크 데이터를 생성하는 생성 단계; 및
    생성된 신규 도서의 마크 데이터를 사용자 혹은 사용자 서버로 전송하는 전송 단계;를 포함하는 것을 특징으로 하는, 실시간 마크 데이터 생성 및 전송 방법.
  2. 제1항에 있어서,
    상기 도서 정보는, 도서에 대한 서지 정보, 카테고리 정보 및 목차 정보 중 적어도 어느 하나 이상을 포함하는 것을 특징으로 하는, 실시간 마크 데이터 생성 및 전송 방법.
  3. 제1항에 있어서,
    상기 구축 단계는, 마크 데이터가 생성되어 있는 도서의 도서 정보와 대응되는 비서지 정보가 매핑된 매핑 테이블을 형성하여 데이터베이스에 저장하고,
    상기 비서지 정보는, KDC/DDC, 참고문헌과 색인의 여부, 출판지, 저자가 개인인지 단체인지 여부, 주제어 중 적어도 어느 하나 이상을 포함하는 것을 특징으로 하는, 실시간 마크 데이터 생성 및 전송 방법.
  4. 제1항에 있어서,
    상기 생성 단계는,
    입력부를 통해, 신규 도서의 도서 정보를 입력받는 단계;
    추출부를 통해, 상기 데이터베이스로부터 입력받은 도서 정보와 매핑된 비 서지 정보를 추출하는 단계;
    분석부를 통해, 입력받은 서지 정보에 대한 형태소 분석을 통해 상기 데이터베이스에 저장된 도서와의 유사도를 산출하는 단계; 및
    생성부를 통해 상기 유사도를 기초로 상기 추출한 비서지 정보를 갱신하고 마크 데이터를 생성하는 단계;를 포함하는 것을 특징으로 하는, 실시간 마크 데이터 생성 및 전송 방법.
  5. 제4항에 있어서,
    상기 유사도는, 동일한 형태소의 수와 카테고리 가중치의 곱으로 산출되는 것을 특징으로 하는, 실시간 마크 데이터 생성 및 전송 방법.
  6. 제1항에 있어서,
    상기 전송 단계는, 상기 생성된 마크 데이터 중 사용자가 원하는 항목을 필터링 하여 사용자에게 전송하되,
    상기 마크 데이터에는 도서의 기본 서지 정보 더 포함되는 것을 특징으로 하는, 실시간 마크 데이터 생성 및 전송 방법.
  7. 마크 데이터가 생성되어 있는 도서의 도서 정보 및 마크 데이터가 저장된 데이터베이스;
    신규 도서의 도서 정보를 입력받고 마크 데이터를 생성하는 마크생성부;
    외부 단말과 통신하여 도서 정보 또는 마크 데이터를 송수신하는 통신부; 및
    제어부;를 포함하고,
    상기 데이터베이스는, 수신된 도서 정보와 대응되는 비서지 정보가 매핑된 매핑 테이블을 형성하여 저장하고,
    상기 통신부는, 실시간으로 생성된 마크 데이터를 사용자의 서버로 전송하는 것을 특징으로 하는, 실시간 마크 데이터 생성 및 전송 시스템.
  8. 제7항에 있어서,
    상기 마크생성부는, 신규 도서의 도서 정보를 입력받는 입력부; 상기 신규 도서의 도서 정보와 대응되는 비 서지 정보를 추출하는 추출부; 상기 신규 도서의 서지 정보에 대한 형태소 분석을 수행하는 분석부; 및 상기 비 서지 정보를 갱신하고 이를 포함한 신규 도서의 마크 데이터를 생성하는 생성부;를 포함하는 것을 특징으로 하는, 실시간 마크 데이터 생성 시스템.
PCT/KR2019/013088 2018-10-26 2019-10-07 이용자가 희망 도서 신청 시 실시간으로 마크 데이터를 생성하고 전송하는 방법 및 이를 위한 시스템 WO2020085674A1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
EP19876370.8A EP3872743A4 (en) 2018-10-26 2019-10-07 METHOD FOR GENERATION AND TRANSMISSION OF DATA IN MARC FORMAT IN REAL TIME DURING A REQUEST FOR A BOOK DESIRED BY A USER, AND ASSOCIATED SYSTEM
US17/059,246 US11409718B2 (en) 2018-10-26 2019-10-07 Method for generating and transmitting MARC data in real time when user applies for wish book, and system therefor
CN201980034486.1A CN112534465A (zh) 2018-10-26 2019-10-07 利用者申请所希望的图书时实时生成并传送机读目录数据的方法及用于该方法的系统
JP2020565284A JP6925547B2 (ja) 2018-10-26 2019-10-07 リアルタイムマークデータ生成方法及びシステム

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR10-2018-0128908 2018-10-26
KR1020180128908A KR102015089B1 (ko) 2018-10-26 2018-10-26 실시간 마크 데이터 생성 방법 및 시스템
KR10-2019-0067498 2019-06-07
KR1020190067498A KR102227421B1 (ko) 2019-06-07 2019-06-07 이용자가 희망 도서 신청 시 실시간 마크 데이터를 생성하고 전송하는 방법 및 이를 위한 시스템

Publications (1)

Publication Number Publication Date
WO2020085674A1 true WO2020085674A1 (ko) 2020-04-30

Family

ID=70331561

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2019/013088 WO2020085674A1 (ko) 2018-10-26 2019-10-07 이용자가 희망 도서 신청 시 실시간으로 마크 데이터를 생성하고 전송하는 방법 및 이를 위한 시스템

Country Status (5)

Country Link
US (1) US11409718B2 (ko)
EP (1) EP3872743A4 (ko)
JP (1) JP6925547B2 (ko)
CN (1) CN112534465A (ko)
WO (1) WO2020085674A1 (ko)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004234076A (ja) * 2003-01-28 2004-08-19 Hitachi Ltd 図書管理システム及び書誌情報管理方法
KR20070091588A (ko) * 2007-07-27 2007-09-11 주식회사 학술정보 인터넷을 통한 도서정보 상호교류 및 데이터베이스 구축시스템 및 방법
KR20090032546A (ko) * 2007-09-28 2009-04-01 이종엽 도서용 마크 데이터 처리 시스템 및 그 방법
KR100991661B1 (ko) 2010-05-31 2010-11-04 이병준 도서의 디디씨/케이디씨 자동 분류 시스템 및 그 방법
KR20130108043A (ko) * 2012-03-22 2013-10-02 조문환 마크 데이터 구축 방법
KR20150008212A (ko) * 2013-07-10 2015-01-22 조문환 구매요청도서 마크 데이터 구축방법
KR102015089B1 (ko) * 2018-10-26 2019-08-27 유제승 실시간 마크 데이터 생성 방법 및 시스템

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060167933A1 (en) * 2005-01-07 2006-07-27 Hassan Behbehani International standard question number
KR100537058B1 (ko) * 2005-09-13 2005-12-16 주식회사 이지막 마크 데이터를 효율적으로 제공하기 위한 온라인 마크데이터 제공 시스템 및 방법
US7667863B1 (en) * 2005-10-27 2010-02-23 Eldred John H Method for modification of publication covers
US7890337B2 (en) * 2006-08-25 2011-02-15 Jermyn & Associates, Llc Anonymity-ensured system for providing affinity-based deliverables to library patrons
US7720873B2 (en) * 2007-06-21 2010-05-18 International Business Machines Corporation Dynamic data discovery of a source data schema and mapping to a target data schema
US8949241B2 (en) * 2009-05-08 2015-02-03 Thomson Reuters Global Resources Systems and methods for interactive disambiguation of data
KR20120078928A (ko) * 2011-01-03 2012-07-11 삼성전자주식회사 전자 책 콘텐츠 관리를 위한 방법 및 장치
US20130085973A1 (en) * 2011-09-30 2013-04-04 Sirsi Corporation Library intelligence gathering and reporting
KR20130096796A (ko) * 2012-02-23 2013-09-02 삼성전자주식회사 전자책의 리소스 검색 장치 및 방법
US8682796B2 (en) * 2012-08-23 2014-03-25 Sirsi Corporation Digital resource acquisition
JP2014059728A (ja) * 2012-09-18 2014-04-03 Crew Systems Inc 電子書籍システム
WO2014049708A1 (ja) * 2012-09-26 2014-04-03 株式会社 東芝 文書分析装置およびプログラム
CN202995762U (zh) * 2012-11-10 2013-06-12 西安景行数创信息科技有限公司 图书馆新书入馆实时提醒系统
KR20150007109A (ko) * 2013-07-10 2015-01-20 조정환 구매요청도서 마크 데이터 구축방법
US20160140096A1 (en) * 2014-11-17 2016-05-19 Kobo Inc. Excerpt selection feature for an e-reading device
US10321167B1 (en) * 2016-01-21 2019-06-11 GrayMeta, Inc. Method and system for determining media file identifiers and likelihood of media file relationships
CN105760942A (zh) * 2016-02-18 2016-07-13 李晓秋 一种图书借阅方法和装置
CN105893485B (zh) * 2016-03-29 2019-02-12 浙江大学 一种基于图书目录的专题自动生成方法
US11520412B2 (en) * 2017-03-06 2022-12-06 Microsoft Technology Licensing, Llc Data input system/example generator
CN107862069A (zh) * 2017-11-21 2018-03-30 广州星耀悦教育科技有限公司 一种分类数据库的构建方法以及图书分类的方法
CN108595504B (zh) * 2018-03-20 2023-09-29 山东中教传媒有限公司 一种图书管控服务平台
US11062035B2 (en) * 2018-04-30 2021-07-13 Innoplexus Ag Secure document management using blockchain

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004234076A (ja) * 2003-01-28 2004-08-19 Hitachi Ltd 図書管理システム及び書誌情報管理方法
KR20070091588A (ko) * 2007-07-27 2007-09-11 주식회사 학술정보 인터넷을 통한 도서정보 상호교류 및 데이터베이스 구축시스템 및 방법
KR20090032546A (ko) * 2007-09-28 2009-04-01 이종엽 도서용 마크 데이터 처리 시스템 및 그 방법
KR100991661B1 (ko) 2010-05-31 2010-11-04 이병준 도서의 디디씨/케이디씨 자동 분류 시스템 및 그 방법
KR20130108043A (ko) * 2012-03-22 2013-10-02 조문환 마크 데이터 구축 방법
KR20150008212A (ko) * 2013-07-10 2015-01-22 조문환 구매요청도서 마크 데이터 구축방법
KR102015089B1 (ko) * 2018-10-26 2019-08-27 유제승 실시간 마크 데이터 생성 방법 및 시스템

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3872743A4

Also Published As

Publication number Publication date
JP2021515953A (ja) 2021-06-24
EP3872743A1 (en) 2021-09-01
CN112534465A (zh) 2021-03-19
JP6925547B2 (ja) 2021-08-25
EP3872743A4 (en) 2022-07-13
US11409718B2 (en) 2022-08-09
US20210209071A1 (en) 2021-07-08

Similar Documents

Publication Publication Date Title
WO2010120101A2 (ko) 역 벡터 공간 모델을 이용한 키워드 추천방법 및 그 장치
WO2021040124A1 (ko) 인공지능 기반의 법률 문서 분석 시스템 및 방법
WO2011136425A1 (ko) 개체명 사전 및 마이닝 규칙이 결합된 온톨로지 스키마를 이용한 리소스 기술 프레임워크 네트워크 구축 장치 및 방법
WO2020015067A1 (zh) 数据采集方法、装置、设备及存储介质
WO2010087566A1 (en) Document analysis system
WO2013002436A1 (ko) 온톨로지 기반의 문서 분류 방법 및 장치
WO2020040537A1 (ko) 건축규정 분류체계별 건축규정 법령정보 검색 시스템 및 그 방법
WO2017115994A1 (ko) 인공 지능 기반 연관도 계산을 이용한 노트 제공 방법 및 장치
WO2010137814A2 (en) Method of providing by-viewpoint patent map and system thereof
WO2015130129A1 (ko) 서고 관리 시스템
WO2012046906A1 (ko) 다중 자원을 통합한 지식베이스를 이용하여 연구 주체간의 상관관계가 표시된 자원검색 정보 제공 장치 및 방법
WO2020085674A1 (ko) 이용자가 희망 도서 신청 시 실시간으로 마크 데이터를 생성하고 전송하는 방법 및 이를 위한 시스템
US20040078361A1 (en) System and method for analyzing patent families
KR102015089B1 (ko) 실시간 마크 데이터 생성 방법 및 시스템
WO2012046904A1 (ko) 다중 자원 기반 검색정보 제공 장치 및 방법
WO2013008978A1 (ko) 개체 식별 결과 검색 시스템 및 방법
WO2011136413A1 (ko) 특허 유사도 검출에 의한 지적재산권 포괄 성형망 구현장치 및 방법
WO2019112223A1 (ko) 전자 문서 검색 방법 및 그 서버
WO2018139777A1 (ko) 데이터구조를 이용한 수치정보관리장치
WO2021101106A2 (ko) 의료 기기 및 약품 정보 제공 시스템 및 방법
WO2015133774A1 (ko) 특허 분석 시스템 및 방법과 이를 실행하기 위한 프로그램이 기록된 기록매체
WO2012046905A1 (ko) 다중 자원의 통합에 의한 자원 검색 장치 및 방법
WO2016209026A1 (ko) 연관도를 이용한 연관 노트 제공 방법 및 장치
WO2023277522A1 (ko) 키워드 사전을 이용하여 투자 키워드를 관리하는 서버 및 방법
WO2018084458A1 (ko) 코드 처리 장치 및 코드 처리 방법

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 19876370

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2020565284

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

ENP Entry into the national phase

Ref document number: 2019876370

Country of ref document: EP

Effective date: 20210526