CN112534465A

CN112534465A - 利用者申请所希望的图书时实时生成并传送机读目录数据的方法及用于该方法的系统

Info

Publication number: CN112534465A
Application number: CN201980034486.1A
Authority: CN
Inventors: 柳济丞
Original assignee: Ocean Intelligence Co ltd
Current assignee: Ocean Intelligence Co ltd
Priority date: 2018-10-26
Filing date: 2019-10-07
Publication date: 2021-03-19
Also published as: JP2021515953A; EP3872743A4; JP6925547B2; WO2020085674A1; EP3872743A1; US20210209071A1; US11409718B2

Abstract

本发明涉及一种实时生成机读目录数据的方法及系统，本发明的一个实施例的实时生成机读目录数据的方法可包括如下步骤：(a)利用生成有机读目录数据的图书的图书信息及机读目录数据，构建数据库；(b)输入新图书的图书信息，基于上述输入的新图书的图书信息及上述数据库，生成新图书的机读目录数据；及(c)将上述生成的新图书的机读目录数据传送给使用者。

Description

利用者申请所希望的图书时实时生成并传送机读目录数据的方法及用于该方法的系统

技术领域

本发明涉及图书馆利用者申请所希望的图书时实时地生成机读目录数据的方法及系统，更具体地，涉及如下的方法及实现该方法的系统：通过需要生成机读目录数据的新图书的书籍信息和类别信息及应用AI的大数据分析来自动生成机读目录数据并以使用者所希望的格式进行传送的、在申请所希望的图书时实时地生成机读目录数据，并将此传送到作为使用者的图书馆或图书馆服务器。

背景技术

机读目录(MARC)数据是指，将与图书相关的整体信息以可由计算机识别为目录数据而积累、流通的方式代码化的一系列元数据标准格式。当前在韩国国内将美国标准(USMARC)和加拿大标准(CAN/MARC)的综合格式即MARC 21作为基本框架，将2005年综合书籍用韩国文献自动化目录(KORMARC)格式制定为KS规范而使用。这样的综合书籍用KORMARC格式包括图书的书名、作者、版本事项、发行事项、形态事项、主题、周期等这样的与图书相关的整体信息。

如图1所示，以往采用了在图书的销售处生成MARC数据而提供给图书收货处、或者由国立中央图书馆或韩国教育学术信息院直接生成MARC数据而上传时其他图书馆将此下载而使用的方式。

但是，MARC数据中不仅包括书名、作者、出版日等这样的包含记载于书上的客观信息的项目，而且还包括韩国十进制分类法(下面，称为KDC)或杜威十进制分类法(下面，称为DDC)这样的反映出赋予它的图书管理员的主观意向的项目，因此为了根据以往方式生成优质的MARC数据，必须有具备专业知识的图书管理员，通过在图书收货处提供的方法，存在难以获得优质的MARC数据的问题。

另外，即便由在图书馆工作的具备专业知识的图书管理员执行MARC数据生成业务，也仍然存在错误的可能性，并且可能在每个图书馆分别生成彼此不同的MARC数据，每个图书管都要反复进行检索庞大的量的信息并输入的作业，因此需要花费相当多的时间，存在效率低的问题。

为了解决这样的问题，以往尝试了各种用于自动生成MARC数据的方法(韩国注册专利第10-0991661号等)，但其由于仅利用从书中可直接获得的书籍信息来生成MARC数据，因此仍然无法生成实际在图书馆应用的程度的足够的项目的MARC数据或仍然存在准确度极低的问题。

这样，需要一种自动生成仅通过书籍信息无法获得的、包括KDC/DDC、参考文献及索引的与否显示、出版地、作者是个人还是团体的与否、主题词、每个图书馆的定制索书号及每个图书馆的图书登记号等的图书的MARC数据，特别是在利用者申请所希望的图书时按照使用者所希望的格式传送或提供这样生成的机读目录数据的技术，本发明即涉及相关技术。

发明内容

技术课题

本发明是为了解决上述的以往技术的问题点而研发的，本发明的目的在于通过应用AI的大数据分析而准确地生成机读目录数据中的仅通过基本书籍信息无法生成的非书籍信息(例如KDC/DDC、参考文献及索引的与否显示、出版地、作者是个人还是团体的与否、主题词、每个图书馆的定制索书号、每个图书馆的图书登记号等)，并且在利用者申请所希望的图书时传送给作为使用者的各个图书馆。

另外，目的在于，通过将机读目录数据生成自动化，从而对于大量的图书，也能够实时生成准确的机读目录数据，从而将机读目录数据的生成效率最大化，并在申请所希望的图书时将其传送给使用者。

本发明的技术课题不限于以上提及的技术课题，通过下面的记载，本领域技术人员可清楚地理解在此未提及的其他的技术课题。

解决课题的手段

为了解决上述的问题，本发明的一个实施例的实时生成机读目录数据的方法包括如下步骤：(a)利用生成有机读目录数据的图书的图书信息及机读目录数据，构建数据库100；(b)输入新图书的图书信息，基于上述输入的新图书的图书信息及上述数据库100，生成新图书的机读目录数据；及(c)将上述生成的新图书的机读目录数据提供给使用者。

根据一个实施例，上述图书信息包括关于图书的书籍信息、类别信息及目次信息。

根据一个实施例，在上述(a)步骤中，形成映射有与生成有机读目录数据的图书的图书信息对应的非书籍信息的映射表而存储到数据库，上述非书籍信息包括KDC/DDC、参考文献及索引的与否、出版地、作者是个人还是团体的与否、主题词中的至少任一个。

根据一个实施例，上述(b)步骤包括如下步骤：(b-1)通过输入部输入新图书的图书信息；(b-2)提取部从上述数据库提取被映射到所输入的图书信息的非书籍信息；(b-3)分析部通过对所输入的书籍信息进行语素分析而算出与存储于上述数据库的图书之间的相似度；(b-4)生成部基于上述相似度而更新上述提取的非书籍信息并生成机读目录数据。

根据一个实施例，上述相似度将相同的语素的数量和类别加权值相乘而算出。

根据一个实施，在上述(c)步骤中，在上述生成的机读目录数据中过滤出使用者所希望的项目而提供。

另一方面，用于执行实时生成机读目录数据的方法的本发明的一个实施例的机读目录数据生成系统10包括：数据库，其存储生成有机读目录数据的图书的图书信息及机读目录数据；机读目录生成部，其被输入新图书的图书信息而生成机读目录数据；通信部，其与外部终端进行通信而收发图书信息或机读目录数据；及控制部，上述数据库形成映射有与图书信息对应的非书籍信息的映射表而进行存储，上述非书籍信息包括KDC/DDC、参考文献及索引的与否、出版地、作者是个人还是团体的与否、主题词中的至少一个。

根据一个实施例，上述机读目录生成部包括：输入部，其被输入新图书的图书信息；提取部，其提取与上述新图书的图书信息对应的非书籍信息；分析部，其对上述新图书的书籍信息进行语素分析；生成部，其更新上述非书籍信息并生成包括该非书籍信息的新图书的机读目录数据。

本发明的另一实施方式的实时生成机读目录数据的方法包括：构建步骤，利用生成有机读目录数据的图书的图书信息及机读目录数据，构建数据库；生成步骤，接收由利用者输入的新图书的图书信息，基于上述输入的新图书的图书信息和上述数据库而生成新图书的机读目录数据；及传送步骤，当申请所希望的图书时将上述生成的新图书的机读目录数据传送给使用者。

此时，上述图书信息包括关于图书的书籍信息、类别信息及目次信息中的至少一个以上。

在上述构建步骤中，形成映射有与生成有机读目录数据的图书的图书信息对应的非书籍信息的映射表并存储到数据库，上述非书籍信息包括KDC/DDC、参考文献及索引的与否、出版地、作者是个人还是团体的与否、主题词中的至少任一个以上。

上述生成步骤包括如下步骤：通过输入部输入新图书的图书信息；通过提取部从上述数据库提取被映射到所输入的图书信息的非书籍信息；通过分析部对所输入的书籍信息进行语素分析而算出与存储于上述数据库的图书之间的相似度；及通过生成部，基于上述相似度更新上述提取的非书籍信息并生成机读目录数据。

上述相似度优选将相同的语素的数量和类别加权值的相乘而算出。

在上述传送步骤中，优选在上述生成的机读目录数据中过滤出使用者所希望的项目而传送给使用者，在上述机读目录数据中还包括图书的基本书籍信息。

作为本发明的又一实施方式，提供一种实时生成并传送机读目录数据的系统，其包括：数据库，其存储生成有机读目录数据的图书的图书信息及机读目录数据；机读目录生成部，其被输入新图书的图书信息而生成机读目录数据；通信部，其与外部终端通信而收发图书信息或机读目录数据；及控制部。

上述数据库优选形成映射有与接收的图书信息对应的非书籍信息的映射表而进行存储，上述通信部向使用者的服务器传送实时生成的机读目录数据。

上述机读目录生成部包括：输入部，其被输入新图书的图书信息；提取部，其提取与上述新图书的图书信息对应的非书籍信息；分析部，其对上述新图书的书籍信息进行语素分析；及生成部，其更新上述非书籍信息并生成包含该非书籍信息的新图书的机读目录数据。

发明效果

根据本发明，不仅通过新图书的书籍信息、类别信息而且还通过对此进行的应用AI的大数据分析，生成并提供在实际图书馆系统内也能够应用的包括准确且足够的项目的优质的机读目录数据。

具体地，自动生成机读目录数据中的仅通过图书的基本书籍信息无法获得的非书籍信息，例如KDC/DDC、参考文献及索引的与否显示、出版地、作者是个人还是团体的与否、主题词、每个图书馆的定制索书号、每个图书馆的图书登记号等信息而提供给各个图书馆。

另外，根据本发明，即便不是具备专业知识的图书管理员，也能够生成优质的机读目录数据，可实现图书馆的有效的人力运用。

另外，通过存储有这样的大数据的系统，将机读目录数据生成自动化，从而对于大量的图书，也能够实时生成准确的机读目录数据，由此能够将机读目录数据的生成效率最大化。

另外，生成机读目录数据并过滤成每个图书馆所需的格式而提供，从而每个图书馆无需单独生成机读目录数据，可提供所有图书馆均可利用的综合服务，这样各个图书馆应用具备相同的体系的机读目录数据，因此图书馆及图书馆利用者均能够有效地提供或利用图书馆服务。

特别地，在申请图书馆所希望的图书时，可用于收集准确的元信息，因为可传送以往的元信息中不包括的机读目录即MARC(Machine-Readable Cataloging)信息，因此在图书馆可非常有用地使用。

本发明的效果不限于以上提及的效果，通过参照下面的记载，本领域技术人员可清楚地理解在此未提及的其他效果。

附图说明

图1是示出以往技术的提供机读目录数据的方法的图。

图2是示出本发明的一个实施例的生成并提供机读目录数据的方法的图。

图3是概略性地示出利用本发明的一个实施例的机读目录数据生成系统10而生成机读目录数据的图。

图4是示出本发明的一个实施例的实时机读目录数据生成系统10的结构的图。

图5是示出本发明的一个实施例的机读目录生成部200的结构的图。

图6是示出本发明的一个实施例的实时生成机读目录数据的方法的顺序图。

图7是示出本发明的一个实施例的机读目录生成部200生成新图书的机读目录数据的方法的顺序图。

图8是示出根据一个实施例而过滤机读目录数据的情况的图。

图9和图10是以图示的方式示出在本发明的实时机读目录生成系统10中向使用者服务器传送所生成的机读目录数据的过程的图。

附图标记说明

10：机读目录数据生成系统

100：数据库 200：机读目录生成部

210：输入部 220：提取部

230：分析部 240：生成部

300：通信部 400：控制部

具体实施方式

下面，参照附图，对本发明的优选的实施例进行详细说明。通过参照根据附图而详细说明的实施例，可清楚地理解本发明的优点及特征、实现其优点及特征的方法。但是，本发明不限于下面公开的实施例，可以彼此不同的各种形态实现，本实施例仅为了完整地公开本发明，向本领域的技术人员更加清楚告知发明的范围而提供，本发明根据权利要求的范围而定义。在整个说明书中，相同的附图标记表示相同的构成要素。

在未进行定义的情况下，关于本说明书中使用的所有术语(包括技术及科学术语)，应理解为本领域的技术人员共同理解的意思。另外，关于一般使用的词典中定义的术语，在没有明确地特别定义的情况下，不解释为理想的或过度的意思。本说明书中使用的术语用于对实施例进行说明，本发明不限于此。本说明书中，在未特别说明的情况下，单数形式包括复数形式的情况。

附图中为了对本发明进行清楚的说明，对于与说明无关的部分省略了说明，在整个说明书中，对相同或相似的构成要素，赋予了相同的附图标记。并且，在记载为某个部分“包括”某个构成要素时，在没有特别相反的解释的情况下，并非排除其他构成要素，还可包括其他构成要素。另外，说明书中记载的“部”表示执行特定功能的一个单位或块。

图1是示出以往技术的提供机读目录数据的方法的图，图2是示出本发明的一个实施例的生成并提供机读目录数据的方法的图。

参照图1，以往，在一般情况下使用了在图书的销售处生成MARC数据而提供给图书收货处、或者由国立中央图书馆或韩国教育学术信息院直接生成MARC数据而上传时其他图书馆将此下载而使用的方式。

但是，MARC数据中不仅包括书名、作者、出版日等这样的包含记载于书上的客观信息的项目，而且还包括韩国十进制分类法(下面，称为KDC)或杜威十进制分类法(下面，称为DDC)这样的反映出赋予它的图书管理员的主观意向的项目，因此为了根据以往方式生成优质的MARC数据，必须有具备专业知识的图书管理员，因此，通过在图书收货处提供的方法，存在难以获得优质的MARC数据的问题。

另外，即便由在图书馆工作的具备专业知识的图书管理员执行MARC数据生成业务，也仍然存在错误的可能性，并且针对每个图书均需要反复进行检索庞大的量的信息并输入的作业，因此需要花费相当多的时间，存在效率低的问题。

参照图2，本发明是为了解决上述的问题而研发的，当从各个图书馆向本发明的机读目录数据生成系统10输入图书信息时，自动生成机读目录数据，并将这样生成的机读目录数据直接传送并提供给图书馆。

下面，参照图3至图10而对本发明的实时机读目录数据生成系统及利用该实时机读目录数据生成系统的机读目录数据生成方法进行说明。

另外，在本说明书中，以KDC/DDC信息的生成为例进行说明，但无需必须仅限于此，只要利用与以下说明的本发明相同的技术思想，均可生成参考文献及索引的与否显示、出版地、作者是个人还是团体的与否、主题词、每个图书馆的定制索书号、每个图书馆的图书登记号等这样的仅通过图书的基本书籍信息无法获得的各种信息。

图3是概略性地示出利用本发明的一个实施例的机读目录数据生成系统10而生成机读目录数据的情况的图。

参照上述图3，本发明提供一种当利用者向(使用者)图书馆或图书馆服务器申请所希望的图书时，输入包括关于新图书的书籍信息及类别信息的图书信息，并利用该信息而生成机读目录数据来提供给使用者的实时生成机读目录数据的方法及系统。

机读目录数据是指，将与图书相关的整体信息以可由计算机识别成目录数据而积累、流通的方式代码化的一系列元数据标准格式，本发明基于大数据利用所输入的书籍信息及类别信息这样的限制性的信息而推定关于构成机读目录数据的项目的信息，并将其作为机读目录数据生成而提供。

此时，书籍信息可包括书名、作者、出版社或ISBN信息，类别信息例如包括总类、哲学、宗教、社会科学、自然科学、技术科学、艺术、语言、文学、历史等，但不限于此，可将这些上位、下位项目包括在内而根据使用者的设定来分类成各种各样。

另外，新图书并非仅表示在一定期间内新发行的图书，而可以包括根据使用者的意向，有必要重新生成机读目录数据的所有图书。

参照上述图4，本发明的实时机读目录数据生成系统10包括数据库100、机读目录生成部200、通信部300及控制部400。

数据库100可存储已经生成机读目录数据的图书的图书信息及与该图书信息对应的机读目录数据。

存储于数据库100的图书信息包括书籍信息、类别信息及目次信息。书籍信息包括书名、作者、出版社或ISBN信息等，类别信息例如包括总类、哲学、宗教、社会科学、自然科学、技术科学、艺术、语言、文学、历史等，但不限于此，可将这些上位、下位项目包括在内而根据使用者的设定来分类成各种各样。

根据一个实施例，存储于数据库100的图书信息还包括参考信息。参考信息包括书的简介、概要、原著的语言、原著名及原作者等，但不限于此，可根据使用者的设定而包括与图书相关的各种信息。

另外，数据库100还存储有关于构成各个图书的书籍信息或参考信息的语素的信息。其在后述的分析部230通过语素分析而算出新图书与已存储的图书之间的相似度时被利用，关于此，将在对分析部230进行说明时一并说明。

关于存储于上述数据库100的图书信息及机读目录数据，通过公知的输入单元(键盘、鼠标、触摸面板或触摸屏等)而直接输入到数据库100或从位于图书馆等中的外部的服务器接收图书信息及机读目录数据而进行存储。或者，如后述，根据本发明的实时生成机读目录数据的方法而生成的新图书的机读目录数据也与新图书的图书信息一起被存储到数据库100。

另一方面，本发明的一个实施例的数据库100形成将存储的图书的图书信息和非书籍信息对应起来的映射表而进行存储。非书籍信息例如包括KDC/DDC、参考文献及索引的与否显示、出版地、作者是个人还是团体的与否及主题词等。在此KDC(Korean DecimalClassification，韩国十进制分类法)、DDC(Dewey Decimal Classification，杜威十进制分类法)作为基于主题的图书分类体系，是指通过利用0～9的数字而随着从百位、十位到个位及小数点以下逐渐分类为下位项目的方式对图书进行分类的分类体系。存储于上述数据库100的机读目录数据中包括这样的图书的KDC或DDC信息。

本发明的数据库100形成将已生成有机读目录数据的图书的图书信息和该图书的机读目录数据所包含的非书籍信息对应起来的映射表而进行存储。

机读目录生成部200被输入新图书的图书信息，并基于上述输入的新图书的图书信息生成机读目录数据。

参照上述图5，本发明的一个实施例的机读目录生成部200包括输入部210、提取部220、分析部230及生成部240。

输入部210被输入用于生成机读目录数据的新图书的图书信息。此时，关于输入到输入部210的图书信息，通过公知的输入单元而直接被输入或通过后述的通信部300而从外部服务器以数据的形态接收而被输入。通过上述输入部210而被输入的图书信息包括新图书的书籍信息、类别信息或目次信息。

提取部220提取被映射到所输入的新图书的图书信息的非书籍信息。如上述，数据库100中存储有表示已存储的图书的图书信息及与此对应的非书籍信息的对应关系的映射表，提取部220基于这样的映射表而提取被映射到通过上述输入部210输入的图书信息的非书籍信息。例如，通过输入部210而输入的图书信息中类别信息是被映射到通过使用者的推定而作为非结构化数据输入的类别信息的KDC、DDC，提取部220提取在映射表上被映射到上述输入的类别信息的KDC、DDC。

分析部230对所输入的新图书的书籍信息进行语素分析，将其与构成已存储于上述数据库100的图书的书籍信息的语素进行比较而算出相似度。语素分析作为通过计算机这样的机器装置而对人类的语言进行分析的自然语言处理技法的一种，表示将某一对象语节分解成最小的意思单位即语素单位而进行分析的方法。

另一方面，上述相似度可通过(相同的语素的数量)×(类别加权值)而算出，关于由此算出相似度的方法及实施例，将在后面对机读目录数据生成方法进行说明时一并说明。

根据一个实施例，本发明的分析部230将参考信息包括在内而执行语素分析，并算出相似度。参考信息包括书的简介、目次、概要、原著的语言、原著名及原作者等，但无需必须仅限于此。

生成部240基于上述分析部230算出的相似度而更新非书籍信息，并生成包括该非书籍信息的机读目录数据。

利用上述提取部220而提取的KDC或DDC是被映射到通过使用者的推定而作为非结构化数据(unstructured data)输入的类别信息的KDC、DDC，因此包括较大范围或其准确度可能会低，而生成部240基于上述分析部230算出的相似度而更新提取部220提取的KDC或DDC，从而算出更准确的KDC、DDC，并生成包括以这样的较高的准确度算出的KDC或DDC的机读目录数据。

通信部300与外部终端通信而收发图书信息及/或机读目录数据。

上述外部终端表示具备可与本发明的通信部300进行通信的通信单元的电子装置，可包括使用者终端、设于图书馆的计算机或服务器等。

即，本发明的实时机读目录数据生成系统10在利用者申请所希望的图书时，通过通信部300而从外部终端接收图书信息及/或机读目录数据而存储到数据库100或生成新图书的机读目录数据，并将生成的机读目录数据传送到外部终端或服务器而向使用者提供新图书的机读目录数据。

控制部400对机读目录数据生成系统10的整体动作进行控制。

下面，对利用上述的本发明的实时机读目录数据生成系统10而实时生成机读目录数据的方法进行更详细的说明。

参照上述图6，本发明的一个实施例的实时生成机读目录数据的方法包括如下步骤：在利用者申请所希望的图书时(a)将生成有机读目录数据的图书的图书信息及机读目录数据构建及存储到数据库100；(b)输入新图书的图书信息，基于上述输入的新图书的图书信息及上述数据库100而生成新图书的机读目录数据；及(c)将上述生成的新图书的机读目录数据传送给使用者。

在上述(a)步骤中，将已生成有机读目录数据的图书的图书信息及机读目录数据存储到数据库100而构建数据库100。关于上述图书信息及机读目录数据，通过公知的输入单元而直接输入到数据库100或从设于图书馆等的外部的服务器接收已存储的图书信息及机读目录数据而进行存储。

上述图书信息包括图书的书籍信息、类别信息及目次信息。书籍信息包括书名、作者、出版社或ISBN信息等，类别信息例如包括总类、哲学、宗教、社会科学、自然科学、技术科学、艺术、语言、文学、历史等，但不限于此，可将这些上位、下位项目包括在内而根据使用者的设定来分类成各种各样。

另外，上述图书信息还可包括参考信息。参考信息包括书的简介、概要、原著的语言、原著名及原作者等，但不限于此，可根据使用者的设定而包括与图书相关的各种信息。

根据一个实施例，数据库100形成将存储的图书的图书信息和非书籍信息对应起来的映射表而进行存储。

即，在(a)步骤中，利用关于已生成有包括非书籍信息的机读目录数据的图书的信息而构建数据库100，并将这样的存储于数据库100的图书的图书信息与非书籍信息映射起来而形成映射表并存储到数据库100。

在(b)步骤中，机读目录生成部200被输入新图书的图书信息，并基于所输入的新图书的图书信息及在上述(a)步骤中构建的数据库100而生成新图书的机读目录数据。

参照上述图7，本发明的新图书的机读目录数据生成方法包括如下步骤：(b-1)通过输入部210而输入新图书的图书信息；(b-2)提取部220从上述数据库100提取被映射到所输入的图书信息的非书籍信息；(b-3)分析部230通过对所输入的书籍信息的语素分析而算出与存储于上述数据库100的图书之间的相似度；(b-4)生成部240基于上述相似度而更新上述提取的非书籍信息并生成机读目录数据。

在(b-1)步骤中，通过输入部210而输入包括新图书的书籍信息及类别信息的图书信息。

即，在(b-1)步骤中，使用者输入要生成机读目录数据的新图书的书籍信息及使用者推定的类别信息。这样，由使用者输入的书籍信息及类别信息通过公知的输入单元而直接被输入到输入部210或通过通信部300而从外部服务器接收而被输入到输入部210。

在此，使用者输入的图书信息中，书籍信息包括书名、作者、出版社或ISBN这样的记载于图书的客观信息，类别信息是根据使用者的主观解释而推定的类别。

在上述(b-1)步骤中接收的图书信息中，除了书籍信息、类别信息及目次信息之外，还可包括参考信息。上述参考信息包括书的简介、概要、原著的语言、原著名及原作者等，但无需必须仅限于此。

在(b-2)步骤中，通过提取部220而提取被映射到在上述(b-1)步骤中输入的新图书的图书信息的非书籍信息。

本发明的数据库100中存储有表示包括类别信息的图书信息及与此对应的非书籍信息的对应关系的映射表，在(b-2)步骤中基于这样的映射表而提取被映射到在(b-1)步骤中使用者输入的图书信息的非书籍信息。

在(b-3)步骤中，分析部230通过对所输入的书籍信息进行语素分析而算出与存储于上述数据库100的图书之间的相似度。

语素分析作为通过计算机这样的机器装置而对人类的语言进行分析的自然语言处理技法的一种，是指将某一对象语节分解成最小的意思单位即语素单位而进行分析的方法。

分析部230对在(b-1)步骤中输入的新图书的书籍信息进行语素分析，将此与构成已存储于上述数据库100的图书的书籍信息的语素进行比较而算出相似度。

上述相似度通过(相同的语素的数量)×(类别加权值)而算出，将此用数学式表示如下。

S_i＝N_i×w_i

(S_i：相似度，N_i：相同的语素的数量，w_i：类别加权值)

相同的语素的数量N_i是将相同的语素所表示的频率越多，与新图书相似的可能性越高的情况数式化而成。

类别加权值w_i是将越是类别与使用者输入的类别信息相似的图书，与新图书相似的可能性越高的情况数式化而成。

根据一个实施例，关于上述类别加权值，越是百位、十位及个位依次与在(b-2)步骤中提取的KDC、DDC一致的图书，所设定的加权值越高。

KDC及DDC作为通过利用0～9的数字而按照百位、十位到个位及小数点以下这样的降序而逐渐从上位项目向下位项目分类的方式对图书分类的分类体系，百位、十位及个位依次越一致，越可能是彼此相似的类别的图书。

即，关于上述类别加权值，对于百位、十位、个位均与在(b-2)步骤中算出的新图书的KDC、DDC一致的图书设定最高的类别加权值，接着对百位、十位一致的图书，又接着对百位一致的图书，最后对百位不一致的图书依次设定逐渐变小的类别加权值。

虽然在上述数学式中未表示，但根据一个实施例，在算出上述相似度时，根据各个语素而赋予不同的加权值而进行设定。

通过分析部230而从图书的书籍信息提取的每个语素的与各个图书所属的类别之间的关联性的程度彼此不同，考虑这一点，对各个语素赋予不同的加权值。

在该情况下，关于对上述每个语素赋予的加权值，对于在相同的类别内出现的频率越多的语素，赋予越高的加权值。

根据一个实施例，本发明的分析部230不仅对新图书的书籍信息进行语素分析，而且还对参考信息进行语素分析。参考信息包括书的简介、目次、概要、原著的语言、原著名及原作者等。

在(b-4)步骤中，生成部240基于在(b-3)步骤算出的相似度而更新上述提取的非书籍信息，生成机读目录数据。

例如，如上述，在上述(b-2)步骤中提取的KDC或DDC是被映射到通过使用者的推定而作为非结构化数据输入的类别信息的KDC、DDC，因此包括较大范围或其准确度可能会低，在(b-4)步骤中基于上述输入的图书的书籍信息而更新上述提取的KDC或DDC，从而算出更准确的KDC、DDC，并生成包括以这样的高准确度算出的KDC或DDC的机读目录数据。

另一方面，通过上述(b-4)步骤而生成的新图书的机读目录数据与新图书的图书信息一起自动更新到本发明的数据库100而被存储。

在(c)步骤中，将在上述(b)步骤中生成的新图书的机读目录数据传送到使用者所持有的终端或使用者所运用的服务器(例如，图书馆服务器)而提供给使用者。

根据一个实施例，在上述(c)步骤中，在上述生成的机读目录数据中过滤出使用者所希望的项目而提供。

如上述，根据本发明的机读目录数据生成方法而生成的机读目录数据是将包括书名、作者、版本事项、发行事项、形态事项、主题、周期等的关于图书的整体信息代码化来存储的数据。各个使用者或图书馆在其中仅选择要利用的项目而获取。

图8是示出根据一个实施例而过滤机读目录数据的情况的图。

参照上述图8，图书馆A至N通过针对各个图书馆定义的图书馆定义过滤器A至图书馆定义过滤器N，仅选择相当于选择区域的项目，将相当于非选择区域的项目排除，从而在实时机读目录数据生成系统中生成的机读目录数据中仅过滤出所希望的项目而获取。

如上述，在以上的本说明书中以KDC/DDC信息的生成为例进行了说明，但本发明的技术思想并非仅限于此，可生成包括KDC/DDC信息在内的参考文献及索引的与否显示、出版地、作者是个人还是团体的与否、主题词、每个图书馆的定制索书号、每个图书馆的图书登记号等这样的仅通过图书的基本书籍信息无法获得的各种信息。

图9和图10分别以图示的方式示出在本发明的实时机读目录生成系统10中当利用者(在此表示为了购买图书而申请图书的人)申请所希望的图书时，接收被输入或传送的新图书的图书信息而生成实时生成的新图书的机读目录数据，然后向使用者服务器(例如图书馆服务器、接收服务器)等传送所生成的机读目录数据的过程。

如上述图9所示，在本发明的实时机读目录生成系统10中向使用者传送的机读目录数据中包括图书元信息，因此即便仅传送机读目录数据，也能够在使用者服务器中解析机读目录数据而提取图书元信息。另外，在使用者服务器中可制作出在提取的图书元信息中包括机读目录数据的手写列表。此时，机读目录数据为在本发明的实时机读目录生成系统10向使用者服务器发送的时间点的数据。

因此，在本发明的实时生成并传送机读目录数据的方法中，从实时机读目录生成系统10向使用者服务器进行发送时仅使用被规范化的标准数据格式的机读目录数据，因此在最初联动时，使用者或使用者服务器无需向发送处传递单独的规范，可从(使用本发明的)各种供给源接收机读目录数据。

图10示出本发明的实时生成新图书的机读目录数据之后，将该所生成的机读目录数据传送给使用者服务器(例如图书馆服务器、接收服务器等)的过程的变形例。

与上述的图8的过程不同地，本发明的实时机读目录生成系统10向使用者服务器传送机读目录数据时，将图书的元信息和实时生成的机读目录数据作为一个值而一并传送。

这样，使用者服务器将图书的元信息和实时生成的机读目录数据作为一个值而一并接收，从而可更加迅速且准确地利用图书元信息而制作手写列表，还可包括一起传送的机读目录数据。通过这样的方式传送实时机读目录数据的情况下，经过最少的改动就可适用于以往的系统。

以上说明的本发明的实施例仅为例示，本发明不限于此。另外，本领域技术人员可在本发明的思想和范围内进行各种修改及变更，而这样的修改及变更属于本发明的范围。

产业上的利用可能性

本发明涉及图书馆利用者申请所希望的图书时实时地生成机读目录数据的方法及系统，通过需要生成机读目录数据的新图书的书籍信息和类别信息及应用AI的大数据分析来自动生成机读目录数据并以使用者所希望的格式进行传送，在申请所希望的图书时实时地生成机读目录数据，并将此传送到作为使用者的图书馆或图书馆服务器。另外，不仅通过新图书的书籍信息、类别信息而且还通过对此进行的应用AI的大数据分析，生成并提供在实际图书馆系统内也能够应用的包括准确且足够的项目的优质的机读目录数据，因此具有产业上的利用可能性。

Claims

1.一种实时生成并传送机读目录数据的方法，其特征在于，包括：

构建步骤，利用生成有机读目录数据的图书的图书信息及机读目录数据，构建数据库；

生成步骤，接收由利用者输入的新图书的图书信息，基于所输入的新图书的图书信息和上述数据库，生成新图书的机读目录数据；及

传送步骤，将所生成的新图书的机读目录数据传送给使用者或使用者服务器。

2.根据权利要求1所述的实时生成并传送机读目录数据的方法，其特征在于，

上述图书信息包括关于图书的书籍信息、类别信息及目次信息中的至少任一个以上。

3.根据权利要求1所述的实时生成并传送机读目录数据的方法，其特征在于，

在上述构建步骤中，形成映射表并存储到数据库，其中上述映射表映射有与生成有机读目录数据的图书的图书信息对应的非书籍信息，

上述非书籍信息包括KDC/DDC、参考文献及索引的与否、出版地、作者是个人还是团体的与否、主题词中的至少任一个以上。

4.根据权利要求1所述的实时生成并传送机读目录数据的方法，其特征在于，

上述生成步骤包括如下步骤：

通过输入部输入新图书的图书信息；

通过提取部从上述数据库提取被映射到所输入的图书信息的非书籍信息；

通过分析部对所输入的书籍信息进行语素分析来算出与存储于上述数据库的图书之间的相似度；及

通过生成部，基于上述相似度而更新上述提取的非书籍信息并生成机读目录数据。

5.根据权利要求4所述的实时生成并传送机读目录数据的方法，其特征在于，

上述相似度通过将相同的语素的数量和类别加权值相乘而算出。

6.根据权利要求1所述的实时生成并传送机读目录数据的方法，其特征在于，

在上述传送步骤中，在上述生成的机读目录数据中过滤出使用者所希望的项目而传送给使用者，

在上述机读目录数据中还包括图书的基本书籍信息。

7.一种实时生成并传送机读目录数据的系统，其特征在于，其包括：

数据库，其存储生成有机读目录数据的图书的图书信息及机读目录数据；

机读目录生成部，其被输入新图书的图书信息而生成机读目录数据；

通信部，其与外部终端进行通信而收发图书信息或机读目录数据；及

控制部，

上述数据库形成映射表并存储，上述映射表映射有与接收的图书信息对应的非书籍信息，

上述通信部将实时生成的机读目录数据传送到使用者的服务器。

8.根据权利要求7所述的实时生成并传送机读目录数据的系统，其特征在于，

上述机读目录生成部包括：

输入部，其被输入新图书的图书信息；

提取部，其提取与上述新图书的图书信息对应的非书籍信息；

分析部，其对上述新图书的书籍信息进行语素分析；及

生成部，其更新上述非书籍信息并生成包括该非书籍信息的新图书的机读目录数据。