KR20230008306A - 도서목록정보(marc data) 구축을 위한 인공지능을 이용한 분류번호(kdc, ddc) 생성 방법 및 시스템 - Google Patents

도서목록정보(marc data) 구축을 위한 인공지능을 이용한 분류번호(kdc, ddc) 생성 방법 및 시스템 Download PDF

Info

Publication number
KR20230008306A
KR20230008306A KR1020210088791A KR20210088791A KR20230008306A KR 20230008306 A KR20230008306 A KR 20230008306A KR 1020210088791 A KR1020210088791 A KR 1020210088791A KR 20210088791 A KR20210088791 A KR 20210088791A KR 20230008306 A KR20230008306 A KR 20230008306A
Authority
KR
South Korea
Prior art keywords
book
information
artificial intelligence
key value
classification
Prior art date
Application number
KR1020210088791A
Other languages
English (en)
Other versions
KR102665966B1 (ko
Inventor
오수민
Original Assignee
주식회사 학술정보
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 학술정보 filed Critical 주식회사 학술정보
Priority to KR1020210088791A priority Critical patent/KR102665966B1/ko
Publication of KR20230008306A publication Critical patent/KR20230008306A/ko
Application granted granted Critical
Publication of KR102665966B1 publication Critical patent/KR102665966B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/316Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/02Preprocessing operations, e.g. segment selection; Pattern representation or modelling, e.g. based on linear discriminant analysis [LDA] or principal components; Feature selection or extraction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성 방법 및 시스템이 개시된다. 본 발명의 일측면에 따른 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성 방법은, 대상 도서에 대한 도서 정보를 입력받는 단계; 도서 정보 중 도서명에 대한 인공지능 분석에 의해 제1 키값을 결정하는 단계; 도서 정보의 상세정보에 대한 인공지능 분석에 의해 제2 키값을 결정하는 단계; 및 제1 키값과 제2 키값을 이용하여 대상 도서에 대한 분류번호를 생성하는 단계를 포함한다.

Description

도서목록정보(MARC DATA) 구축을 위한 인공지능을 이용한 분류번호(KDC, DDC) 생성 방법 및 시스템{Method and system for generating classification numbers using artificial intelligence to build book MARC DATA}
본 발명은 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성 방법 및 시스템에 관한 것이다.
방대한 양의 도서를 관리하기 위해서는 체계적인 도서의 분류가 필수이다. 일반적으로 도서를 분류함으로써 생성되는 목록정보(MARC DATA) 구축은 일정한 룰에 의해 구축된다. MARC DATA 구축시 한국십진분류법(KDC: Korean Decimal Classification)와 듀이십진분류법(DDC: Dewey Decimal Classification)을 활용한 분류번호를 이용한다.
종래에는 이러한 분류번호를 일정한 매뉴얼에 기반하여 사람에 의해 수동으로 생성하였다. 이 경우 매뉴얼에 의한 사서의 직관으로 판단됨에 따라 동일주제와 동일도서 임에도 서로 다르게 부여될 가능성 있어 분류의 오류가 발생하는 경우가 많다. 또한 매뉴얼을 찾아가며 도서를 분류함으로 인해 하루에 50여권을 분류하는데 그쳐 장시간이 소요된다. 또한 다양한 학문 분야와 언어의 다양성으로 도서의 내용을 파악 하기가 힘들어 정확한 분류가 어려울 수 있다.
대한민국 등록특허 제 10-0991661 (도서의 디디씨/케이디씨 자동 분류 시스템 및 그 방법)
따라서, 본 발명은 상술한 문제점을 해결하기 위해 안출된 것으로서, 인력에 의함이 아닌 인공지능을 이용함으로써 보다 정확하고 간편히 수행할 수 있는 도서목록정보(MARC DATA) 구축을 위한 인공지능을 이용한 분류번호(KDC, DDC) 생성 방법 및 시스템을 제공하기 위한 것이다.
또한 본 발명은 인공지능에 의한 오류를 최소화하기 위해 관리자의 음성을 이용하는 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성 방법 및 시스템을 제공하기 위한 것이다.
본 발명의 다른 목적들은 이하에 서술되는 바람직한 실시예를 통하여 보다 명확해질 것이다.
본 발명의 일 측면에 따르면, 입력된 대상 도서의 도서명에 대해 인공지능 분석에 의해 제1 키값을 결정하는 단계; 상기 대상 도서의 도서명을 이용하여 상세정보를 취득하고, 취득된 상세정보에 대한 상기 인공지능 분석에 의해 제2 키값을 결정하는 단계; 및 상기 제1 키값과 상기 제2 키값을 이용하여 상기 대상 도서에 대한 분류번호를 생성하는 단계를 포함하는, 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성 방법 및 그 방법을 수행하는 프로그램이 기록된 기록매체가 제공된다.
여기서, 온라인을 통해 외부의 도서DB에서 상기 상세정보를 취득한다.
또한, 상기 제1 키값 또는 상기 제2 키값 결정 시, 입력되는 음성을 추가 분석하여 함께 활용한다.
또한, 상기 제 1키값 또는 상기 제2 키값 결정 시, 보조정보 필요 여부를 판단하는 단계; 및 보조정보 필요로 판단되는 경우에만, 분석된 정보를 하나 이상의 관리자에게 노출하고, 상기 관리자로부터 입력되는 음성을 분석하여 보조정보를 생성하는 단계를 포함한다.
또한, 상기 보조정보를 이용하여 상기 인공지능을 업데이트시키는 단계를 더 포함한다.
또한, 상기 음성에 대한 목소리분석에 의해 관리자를 식별하고, 식별된 관리자에 설정된 전문가정보에 따라 상기 보조정보에 대한 중요도를 결정한다.
또한, 상기 분류번호를 포함하는 상기 대상 도서에 대한 분석정보를 관리자 단말로 제공하는 단계; 상기 관리자 단말에 입력된 음성정보를 수신하는 단계; 상기 음성정보를 분석하여 상기 대상 도서에 대한 보조정보를 인식하는 단계; 및 상기 보조정보의 분석에 의해 상기 제1 키값 또는 상기 제2 키값 중 적어도 어느 하나 이상을 변환하여 상기 분류번호를 수정하는 단계를 더 포함한다.
또한, 상기 분석정보를 관리자 단말로 제공하는 단계는, 상기 대상 도서에 상응하는 전문분야를 결정하는 단계; 및 상기 전문분야에 해당하는 하나 이상의 관리자를 결정하여 상기 분석정보를 제공하는 단계를 포함한다.
또한, 상기 대상 도서의 개수가 임계개수 이상이고, 음성에 의한 보조정보를 활용하는 횟수가 임계비율 이상인 경우, 모든 대상 도서에 대한 분류번호 생성 프로세스를 수행한 이후, 처음부터 다시 순서대로 대상 도서들의 분류번호 생성 프로세스를 재수행한다.
본 발명의 다른 측면에 따르면, 대상 도서에 대한 도서명을 입력받아 저장하기 위한 저장부; 미리 학습된 정보를 기반으로, 입력된 대상 도서의 도서명을 분석하여 제1 키값을 결정하고, 상기 대상 도서의 도서명을 이용하여 취득한 상세정보를 분석하여 제2 키값을 결정하는 인공지능부; 및 상기 제1 키값과 상기 제2 키값을 이용하여 상기 대상 도서에 대한 분류번호를 생성하는 분류처리부를 포함하는, 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성 시스템이 제공된다.
여기서, 입력 또는 수신된 음성정보를 분석하기 위한 음성인식부를 더 포함하되, 상기 인공지능부는 상기 음성인식부에 의해 인식된 음성인식정보를 추가 분석하여 상기 제1 키값 또는 상기 제2 키값 결정에 활용한다.
또한, 상기 대상 도서의 개수가 임계개수 이상이고, 음성에 의한 보조정보를 활용하는 횟수가 임계비율 이상인 경우, 모든 대상 도서에 대한 분류번호 생성 프로세스를 수행한 이후, 처음부터 다시 순서대로 대상 도서들의 분류번호 생성 프로세스를 재수행시키는 제어부를 더 포함한다.
본 발명에 따르면, 인력에 의함이 아닌 인공지능을 이용함으로써 보다 정확하고 간편히 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성을 수행할 수 있다.
또한, 본 발명에 따르면, 관리자의 음성으로 인공지능을 보조함으로써 인공지능에 의한 오류를 최소화하며, 동시에 실시간으로 인공지능을 고도화할 수 있다.
도 1은 본 발명의 일 실시예에 따른 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성을 위한 전체 시스템을 개략적으로 도시한 구성도.
도 2는 본 발명의 일 실시예에 따른 인공지능을 이용한 분류번호 생성하는 분류시스템의 구성을 도시한 블록도.
도 3은 본 발명의 일 실시예에 따른 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성의 개략적인 과정을 도시한 흐름도.
도 4 및 도 5는 본 발명의 각 실시예에 따른 음성을 활용한 분류번호 생성 과정을 도시한 흐름도들.
도 6은 본 발명의 일 실시예에 따른 음성으로 관리자를 식별하여 보조정보를 활용하는 과정을 도시한 흐름도.
도 7은 본 발명의 일 실시예에 따른 정확도를 높이기 위한 도서 분류 재수행 과정을 도시한 흐름도.
도 8은 본 발명의 일 실시예에 따른 인공지능과 음성을 이용한 분류번호 생성의 구체적 프로세스를 도시한 흐름도.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 후술될 제1 임계값, 제2 임계값 등의 용어는 실질적으로는 각각 상이하거나 일부는 동일한 값인 임계값들로 미리 지정될 수 있으나, 임계값이라는 동일한 단어로 표현될 때 혼동의 여지가 있으므로 구분의 편의상 제1, 제2 등의 용어를 병기하기로 한다.
본 명세서에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
또한, 각 도면을 참조하여 설명하는 실시예의 구성 요소가 해당 실시예에만 제한적으로 적용되는 것은 아니며, 본 발명의 기술적 사상이 유지되는 범위 내에서 다른 실시예에 포함되도록 구현될 수 있으며, 또한 별도의 설명이 생략될지라도 복수의 실시예가 통합된 하나의 실시예로 다시 구현될 수도 있음은 당연하다.
또한, 첨부 도면을 참조하여 설명함에 있어, 도면 부호에 관계없이 동일한 구성 요소는 동일하거나 관련된 참조부호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
도 1은 본 발명의 일 실시예에 따른 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성을 위한 전체 시스템을 개략적으로 도시한 구성도이다.
도 1을 참조하면, 본 실시예에 따른 전체 시스템은 분류시스템(30) 및 하나 이상의 도서DB(50-1, ??, 50-m, 이하 50으로 통칭)를 포함하되, 분류시스템(30)을 관리하기 위한 하나 이상의 관리자 단말(10-1, ..., 10-n, 이하 10으로 통칭)을 더 포함할 수 있다.
분류시스템(30)은 인공지능을 운용하며, 인공지능을 이용하여 도서를 분류하며, 인공지능은 인터넷망과 같은 통신망을 이용하여 외부의 도서DB(50, 예를 들어 특정 서점 사이트에서 운용되는 데이터베이스 등)로부터 정보를 취득하여 도서 분류에 이용한다.
또한, 분류시스템(30)의 인공지능을 학습시키거나 도서의 분류 기능 수행 시 안정된 동작을 위한 보조적인 기능을 위해 관리자는 관련 정보를 제공할 수 있다. 예를 들어, 관리자는 분류시스템(30)에서 지원되는 입력수단을 이용하거나 관리자 단말(10)을 이용하여 분류시스템(30)에게 음성으로 도서 분류를 위한 관련정보를 제공할 수 있다.
도 2는 본 발명의 일 실시예에 따른 인공지능을 이용한 분류번호 생성하는 분류시스템(30)의 구성을 도시한 블록도이다.
도 2를 참조하면, 분류시스템(30)은 입력부(210), 통신부(220), 출력부(230), 저장부(240) 및 제어부(250)를 포함하되, 제어부(250)는 인공지능부(251), 분류처리부(252)를 포함할 수 있다. 제어부(250)의 각 구성부(251, 252)는 반드시 하드웨어적으로 구현될 필요는 없으며 응용 프로그램과 같이 소프트웨어적으로 구현될 수 있음은 당업자에게는 자명할 것이다.
입력부(210)는 분류하고자 하는 도서(이하 대상 도서라 칭함)에 대한 기본정보(예를 들어, 도서명 등)를 입력받기 위한 입력 수단이다. 일례에 따르면 관리자는 복수의 대상 도서에 대한 도서명을 파일(예를 들어, 엑셀파일 등)로 입력할 수 있다.
또한, 입력부(210)는 상술한 바와 같이 관리자로부터 음성정보를 입력받기 위한 수단(예를 들어, 음성입력수단인 마이크로폰 등)을 더 포함한다. 이에 대해서는 차후 보다 상세히 설명하기로 한다.
통신부(220)는 도서DB(50), 관리자 단말(10)과 통신하기 위한 통신수단으로서 이는 당업자에게는 자명할 것이므로 더욱 상세한 설명은 생략한다. 일례에 따르면 분류시스템(30)은 입력부(210) 없이, 통신부(220)를 이용하여 관리자로부터 대상 도서의 기본정보와 음성정보를 통신망(예를 들어, 내부 네트워크 또는 인터넷망 등)을 통해서만 취득할 수도 있다.
출력부(230)는 생성한 분류번호를 출력하기 위한 수단으로서, 예를 들어 디스플레이(display)를 포함할 수 있다. 또한 출력부(230)를 통해 관리자를 위한 알림정보를 출력할 수 있는데, 예를 들어 분류번호 생성 오류 발생에 따른 알림정보, 분류를 위한 추가적인 보조정보 요청을 위한 알림정보 등이 출력될 수 있다.
저장부(240)는 취득한 대상 도서의 도서명을 저장하기 위한 수단이며, 저장부(240)에는 인공지능을 이용한 도서분류 기능을 수행하기 위한 백데이터(back data)가 저장될 수 있다.
제어부(250)는 각 구성부의 전반적인 제어기능을 수행한다.
특히, 제어부(250)는 대상 도서의 도서명과 같은 기본정보를 이용하여 도서분류 기능을 수행하는데, 제어부(250)의 인공지능부(251)는 미리 학습된 정보를 기반으로, 입력된 대상 도서의 도서명을 분석하여 제1 키값을 결정하고, 대상 도서의 도서명을 이용하여 취득한 상세정보를 분석하여 제2 키값을 결정한다. 그리고, 제어부(250)의 분류처리부(252)는 제1 키값과 제2 키값을 이용하여 대상 도서에 대한 분류번호를 생성한다. 본 실시예에서는 키값 결정과 키값을 이용한 분류번호 생성의 주체를 달리하였으나, 인공지능부가 키값 생성과 분류번호 생성을 모두 수행할 수도 있으며, 이하에서는 설명의 편의상 인공지능부가 키값과 분류번호를 모두 생성하는 것을 위주로 설명하기로 한다.
분류시스템(30)은 방대한 양의 도서의 용이한 관리하기 위해, 도서를 분류하고 그에 따른 분류번호를 부여한다. 도서의 분류는 주제별, 저자별, 국가별 등 다양한 기준으로 수행될 수 있다.
분류시스템(30)에서 운용되는 인공지능은 딥러닝 기법 등을 이용하여 학습한 내용을 기반으로 도서를 분류하는데, 일례에 따르면 다음과 같은 기준을 이용하여 도서를 분류할 수 있다.
- 서명, 머리말, 초록, 목차, 저자의 전공분야에서 자료의 주제를 파악
- 자료의 학문에 따라 분류하고 다음으로 형식으로 분류(예 생물학개론- 1)생물학 2)개론)
- 동등한 복수주제는 분류표상 선행주제로 분류(예 경영경제연구-경제로, 영어영문학-영문학으로)
- 상관주제는 영향을 받는 주제로 분류
- 2개 주제 취급 시 더 완전한 주제로 분류
- 3개 이상주제 취급 시 상위학문으로 분류
- 주제 또는 지리로 세분할 수 있는 것은 주제로 우선분류
- 전기서는 피전자의 치적분야(직업, 주제분야)에 우선 분류 없을 경우 그 사람이 속한 시대로 분류
-둘이상의 문학작품은 DRAMA-POETTY-FICTION-ESSAY-SPEECHES-LETTERS-MISCELLANY 순으로 분류
- 언어는 1차로 표목으로 사용된 분류
- 2개 표목언어 사용시 사용정도가 적은 언어로 분류
- 언어는 학문-언어-언어의 제요소순으로 분류
- 문학은 원저작에 상용된 언어로 분류
인공지능부(251)는 이러한 미리 설정 및 학습된 조건들을 기반으로 대상 도서에 대한 키값을 생성하며, 그 키값을 이용하여 고유의 분류번호를 생성하는 것이다.
본 실시예의 분류시스템(30)에 의하면, 인공지능에 의한 분류번호 자동부여로 시간을 절약하고 인력운영의 효율성을 제공할 수 있으며, 또한 분류번호 자동부여로 통일성을 부여하여 기관마다 마크데이타의 통일성을 유지할 수 있다.
이하, 분류시스템(30)에서 수행되는 분류번호 생성 방식에 대해 보다 상세히 설명하기로 한다.
도 3은 본 발명의 일 실시예에 따른 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성의 개략적인 과정을 도시한 흐름도이다.
도 3을 참조하면, 대상 도서에 대한 도서명 정보를 취득한다(S10).
상술한 바와 같이, 대상 도서는 복수개일 수 있으며, 일일이 도서명 정보를 입력받는 형태일 수도 있으나, 관리자는 엑셀파일과 같은 파일 형태로 각 대상도서의 도서명을 입력하는 형식일 수 있다. 또는 음성으로 각 대상 도서에 대한 도서명을 입력할 수도 있다.
분류시스템(30)은 취득한 대상 도서의 도서명에 대한 인공지능 분석에 의해 제1 키값을 결정한다(S20). 예를 들어, 도서명 분석에 의해 주류, 강목, 요목 분류를 통해 제1 키값(예를 들어, 813)을 결정한다.
그리고, 분류시스템(30)은 대상 도서의 도서명을 이용하여 외부의 도서DB(50)를 검색 및 탐색하여 상세정보(부제, 목차, 서평, 광고, 저자약력, 색인, 의견, 요약서, 소개서, 해제, 발문 등)를 취득하고, 상세정보의 인공지능 분석에 의해 제2 키값을 결정한다(S30). 예를 들어, 상세정보의 분석을 통해 제2 키값인 [9]을 결정한다.
분류시스템(30)은 결정한 제1 키값 및 제2 키값을 이용하여 대상 도서에 대한 분류번호(예를 들어, 813.9)를 생성한다(S40). 본 실시예에서는 제1 키값과 제2 키값을 단순 결합하여 분류번호를 생성하는 방식을 예로 들었으나, 제1 키값과 제2 키값을 합친 값(또는 곱한값 또는 나눈값)과 같이 두 키값을 활용하여 분류번호를 생성할 수도 있다.
본 실시예에 따르면, 관리자는 단순히 도서명만을 입력하면, 인공지능에 의해 도서명과 그에 따라 취득되는 상세정보를 이용한 분류번호를 자동 생성할 수 있게 된다.
다른 일례에 따르면, 인공지능의 보다 정확한 분류를 위해 보조적인 정보를 관리자가 제공할 수 있다.
도 4 및 도 5는 본 발명의 각 실시예에 따른 음성을 활용한 분류번호 생성 과정을 도시한 흐름도들이다.
먼저 도 4를 참조하면, 분류시스템(30)은 대상 도서의 분류번호를 생성하면 분석정보와 함께 관리자에게 제공한다(S410). 예를 들어, 도서명, 분석에 이용한 중요정보(목차, 저자명 등), 생성한 분류번호를 관리자가 확인하도록 구비된 디스플레이로 출력하거나 관리자 단말(10)로 실시간 전송한다.
이후, 관리자로부터 음성이 입력(또는 통신망을 통해 수신)되는지 여부를 판단하고(S420), 일정시간(예를 들어, 1분 등) 경과하도록 입력되지 않으면 생성한 분류번호를 저장한다(S430).
이와 달리 음성이 수신되면, 음성정보를 분석(예를 들어, 음성인식 기술을 이용하여 텍스트 변환 후 분석)하여 보조정보를 인식한다(S440). 예를 들어, 관리자는 인공지능에 의한 분류번호 생성에 문제가 있다 판단하는 경우, 해당 대상 도서에 대한 부가적인 정보를 음성으로 입력하는 것이다.
관리자의 음성에 따른 보조정보가 인식되면, 보조정보를 분석하여 제1 키값 및/또는 제2 키값을 변환하고, 변환된 키값을 이용하여 분류번호를 수정하여 저장한다(S450).
이후, 관리자의 보조정보에 의해 분류번호(및 키값)가 수정되었으므로, 인공지능아 다음번에는 해당 내용을 분류프로세스에 반영하도록 인공지능이 스스로 학습을 통한 업데이트를 수행하도록 한다(S460).
본 실시예는 분류번호의 생성 이후 음성을 입력하는 예시이며, 다른 일례에 따르면 각 키값(제1 키값 또는 제2 키값)의 결정 시에도 관리자로부터의 음성을 함께 이용할 수도 있다. 이를 위해 분류시스템(30)은 각 키값 생성 시 관리자가 음성을 부가정보로서 입력할 수 있는 인터페이스를 제공한다.
다른 실시예에 따른 도 5를 참조하면, 제1 키값을 위한 도서명에 대한 분석 또는 제2 키값을 위한 상세정보의 취득 또는 분석에 실패하거나, 정보가 부족하여 보조정보가 필요한지 여부를 판단한다(S510).
판단 결과에 따라 제1 또는 제2 키값을 결정하거나(S520), 상술한 바와 같이 분석에 실패하거나 보조정보가 필요하다 판단되는 경우엔 관리자에게 알림정보를 제공한다(S530). 구비된 출력수단을 이용하거나 통신망을 통해 관리자 단말(10)로 알림정보를 제공할 수 있다.
이후 관리자로부터 취득되는 음성정보에 따른 보조정보를 활용하여 제1 키값 및/또는 제2 키값을 결정한다(S540).
즉, 본 실시예는 보조정보가 필요하다 판단되는 경우에만, 분석된 정보를 하나 이상의 관리자에게 노출하고, 관리자로부터 입력되는 음성을 분석하여 보조정보를 생성하는 것이다.
도 6은 본 발명의 일 실시예에 따른 음성으로 관리자를 식별하여 보조정보를 활용하는 과정을 도시한 흐름도이다.
도 6을 참조하면, 분류시스템(30)은 입력된 음성의 목소리를 분석하여(S610), 목소리에 상응하는 관리자를 식별한다(S620).
식별된 관리자에 설정된 전문가정보에 따라 음성정보에 대한 중요도를 결정하여 대상 도서의 키값 결정에 반영한다(S630).
예를 들어, 대상 도서가 과학분야인 경우, 과학이 전문분야인 관리자는 중요도 100, 전문분야가 수학인 경우 중요도 90, 전문분야가 소설인 경우 중요도 80으로 결정되어, 음성에 의한 보조정보의 반영비율을 중요도에 따라 달리 적용한다.
본 실시예에 따르면, 분류의 정확도를 높이기 위해 관리자로부터의 정보를 활용하되, 관리자에 의한 정보를 무분별하게 적용함에 따라 발생되는 분류의 오류 발생을 줄일 수도 있다.
마찬가지로, 도 4에서와 같이 생성한 분류번호를 포함한 분석정보를 관리자에게 제공할 때에도, 대상 도서에 상응하는 전문분야를 인식하고, 해당 전문분야에 해당하는 하나 이상의 관리자를 결정하여 분석정보를 제공할 수도 있다.
일반적으로 도서의 분류 작업은 대량의 도서에 대해서 수행된다. 따라서 인공지능부가 각 대상 도서를 분류하면서 스스로 학습에 의해 분류방식이 고도화될 수도 있다. 이러한 점을 이용하여 보다 정확한 도서의 분류 프로세스를 유도할 수 있다.
도 7은 본 발명의 일 실시예에 따른 정확도를 높이기 위한 도서 분류 재수행 과정을 도시한 흐름도이다.
도 7을 참조하면, 복수개의 대상 도서에 대한 분류번호 생성이 완료되면(S710), 음성정보의 활용 횟수가 임계비율 이상인지 판단한다(S720). 예를 들어, 10,000개의 대상 도서의 분류 프로세스 수행 시, 관리자의 음성에 의한 보조정보의 활용 횟수가 15회인 경우 그 비율이 0.15%로서 임계비율인 0.1%를 초과한 경우인 것이다.
여기서, 임계비율은 대상 도서의 개수에 따라 달라질 수 있다. 예를 들어 대상도서가 많아질수록 임계비율은 다소 낮아질 수 있다. 또한 일례에 따르면 임계비율과의 비교는 대상 도서의 개수의 임계개수(예를 들어, 100개 등) 이상인 경우에만 수행할 수 있으며, 이는 곧 분류프로세스의 재수행은 임계개수 이상의 도서에 대한 분류에만 의미가 있을 수 있기 때문이다.
음성정보의 활용이 임계비율 이상인 경우 업데이트된 인공지능을 이용하여 처음부터 순서대로 대상 도서들에 대한 분류를 재수행한다(S730).
이와 달리 음성정보의 활용이 임계비율 이하인 경우에는, 음성정보를 활용한 대상 도서에 대해서만 분류 프로세스를 재수행한다(S740)..
도 8은 본 발명의 일 실시예에 따른 인공지능과 음성을 이용한 분류번호 생성의 구체적 프로세스를 도시한 흐름도이다.
도 8을 참조하면, 도서명을 엑셀파일로서 입력하면, 서명(도서명)을 이용하여 주제 등의 대분류를 수행하고, 도서DB(50)를 이용한 검색 및 관리자의 음성인식에 의해, 세목 등을 분석함으로써 분류번호를 생성하는 예시가 도시되어 있다.
상술한 본 발명에 따른 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성 방법은 컴퓨터로 읽을 수 있는 기록 매체에 컴퓨터가 읽을 수 있는 코드로서 구현되는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체로는 컴퓨터 시스템에 의하여 해독될 수 있는 데이터가 저장된 모든 종류의 기록 매체를 포함한다. 예를 들어, ROM(Read Only Memory), RAM(Random Access Memory), 자기 테이프, 자기 디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있을 수 있다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 통신망으로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 읽을 수 있는 코드로서 저장되고 실행될 수 있다.
또한, 상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
10 : 관리자 단말
30 : 분류시스템
50 : 도서DB

Claims (13)

  1. 입력된 대상 도서의 도서명에 대해 인공지능 분석에 의해 제1 키값을 결정하는 단계;
    상기 대상 도서의 도서명을 이용하여 상세정보를 취득하고, 취득된 상세정보에 대한 상기 인공지능 분석에 의해 제2 키값을 결정하는 단계; 및
    상기 제1 키값과 상기 제2 키값을 이용하여 상기 대상 도서에 대한 분류번호를 생성하는 단계를 포함하는, 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성 방법.
  2. 청구항 1에 있어서,
    온라인을 통해 외부의 도서DB에서 상기 상세정보를 취득하는, 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성 방법.
  3. 청구항 1에 있어서,
    상기 제1 키값 또는 상기 제2 키값 결정 시, 입력되는 음성을 추가 분석하여 함께 활용하는, 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성 방법.
  4. 청구항 3에 있어서,
    상기 제 1키값 또는 상기 제2 키값 결정 시,
    보조정보 필요 여부를 판단하는 단계; 및
    보조정보 필요로 판단되는 경우에만, 분석된 정보를 하나 이상의 관리자에게 노출하고, 상기 관리자로부터 입력되는 음성을 분석하여 보조정보를 생성하는 단계를 포함하는, 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성 방법.
  5. 청구항 4에 있어서,
    상기 보조정보를 이용하여 상기 인공지능을 업데이트시키는 단계를 더 포함하는, 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성 방법.
  6. 청구항 4에 있어서,
    상기 음성에 대한 목소리분석에 의해 관리자를 식별하고, 식별된 관리자에 설정된 전문가정보에 따라 상기 보조정보에 대한 중요도를 결정하는, 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성 방법.
  7. 청구항 1에 있어서,
    상기 분류번호를 포함하는 상기 대상 도서에 대한 분석정보를 관리자 단말로 제공하는 단계;
    상기 관리자 단말에 입력된 음성정보를 수신하는 단계;
    상기 음성정보를 분석하여 상기 대상 도서에 대한 보조정보를 인식하는 단계; 및
    상기 보조정보의 분석에 의해 상기 제1 키값 또는 상기 제2 키값 중 적어도 어느 하나 이상을 변환하여 상기 분류번호를 수정하는 단계를 더 포함하는, 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성 방법.
  8. 청구항 7에 있어서,
    상기 분석정보를 관리자 단말로 제공하는 단계는,
    상기 대상 도서에 상응하는 전문분야를 결정하는 단계; 및
    상기 전문분야에 해당하는 하나 이상의 관리자를 결정하여 상기 분석정보를 제공하는 단계를 포함하는, 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성 방법.
  9. 청구항 3에 있어서,
    상기 대상 도서의 개수가 임계개수 이상이고, 음성에 의한 보조정보를 활용하는 횟수가 임계비율 이상인 경우,
    모든 대상 도서에 대한 분류번호 생성 프로세스를 수행한 이후, 처음부터 다시 순서대로 대상 도서들의 분류번호 생성 프로세스를 재수행하는, 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성 방법.
  10. 제 1항의 방법을 수행하기 위한 컴퓨터에 의해 실행되는 애플리케이션이나 프로그램 모듈과 같은 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체.
  11. 대상 도서에 대한 도서명을 입력받아 저장하기 위한 저장부;
    미리 학습된 정보를 기반으로, 입력된 대상 도서의 도서명을 분석하여 제1 키값을 결정하고, 상기 대상 도서의 도서명을 이용하여 취득한 상세정보를 분석하여 제2 키값을 결정하는 인공지능부; 및
    상기 제1 키값과 상기 제2 키값을 이용하여 상기 대상 도서에 대한 분류번호를 생성하는 분류처리부를 포함하는, 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성 시스템.
  12. 청구항 11에 있어서,
    입력 또는 수신된 음성정보를 분석하기 위한 음성인식부를 더 포함하되,
    상기 인공지능부는 상기 음성인식부에 의해 인식된 음성인식정보를 추가 분석하여 상기 제1 키값 또는 상기 제2 키값 결정에 활용하는, 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성 시스템.
  13. 청구항 12에 있어서,
    상기 대상 도서의 개수가 임계개수 이상이고, 음성에 의한 보조정보를 활용하는 횟수가 임계비율 이상인 경우,
    모든 대상 도서에 대한 분류번호 생성 프로세스를 수행한 이후, 처음부터 다시 순서대로 대상 도서들의 분류번호 생성 프로세스를 재수행시키는 제어부를 더 포함하는, 도서목록정보 구축을 위한 인공지능을 이용한 분류번호 생성 시스템.
KR1020210088791A 2021-07-07 2021-07-07 도서목록정보(marc data) 구축을 위한 인공지능을 이용한 분류번호(kdc, ddc) 생성 방법 및 시스템 KR102665966B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210088791A KR102665966B1 (ko) 2021-07-07 2021-07-07 도서목록정보(marc data) 구축을 위한 인공지능을 이용한 분류번호(kdc, ddc) 생성 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210088791A KR102665966B1 (ko) 2021-07-07 2021-07-07 도서목록정보(marc data) 구축을 위한 인공지능을 이용한 분류번호(kdc, ddc) 생성 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20230008306A true KR20230008306A (ko) 2023-01-16
KR102665966B1 KR102665966B1 (ko) 2024-05-14

Family

ID=85109887

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210088791A KR102665966B1 (ko) 2021-07-07 2021-07-07 도서목록정보(marc data) 구축을 위한 인공지능을 이용한 분류번호(kdc, ddc) 생성 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR102665966B1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060002102A (ko) * 2004-07-01 2006-01-09 엔에이치엔(주) 도서 본문 검색 시스템 및 방법
KR100991661B1 (ko) 2010-05-31 2010-11-04 이병준 도서의 디디씨/케이디씨 자동 분류 시스템 및 그 방법
KR102015089B1 (ko) * 2018-10-26 2019-08-27 유제승 실시간 마크 데이터 생성 방법 및 시스템
KR102107848B1 (ko) * 2019-10-15 2020-05-07 주식회사이씨오 도서 추천 서비스 방법

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060002102A (ko) * 2004-07-01 2006-01-09 엔에이치엔(주) 도서 본문 검색 시스템 및 방법
KR100991661B1 (ko) 2010-05-31 2010-11-04 이병준 도서의 디디씨/케이디씨 자동 분류 시스템 및 그 방법
KR102015089B1 (ko) * 2018-10-26 2019-08-27 유제승 실시간 마크 데이터 생성 방법 및 시스템
KR102107848B1 (ko) * 2019-10-15 2020-05-07 주식회사이씨오 도서 추천 서비스 방법

Also Published As

Publication number Publication date
KR102665966B1 (ko) 2024-05-14

Similar Documents

Publication Publication Date Title
US11727203B2 (en) Information processing system, feature description method and feature description program
WO2020186778A1 (zh) 错词纠正方法、装置、计算机装置及存储介质
CN112149399B (zh) 基于rpa及ai的表格信息抽取方法、装置、设备及介质
US20220414463A1 (en) Automated troubleshooter
CN110727802B (zh) 知识图谱构建方法及装置、存储介质及电子终端
JP2020030818A (ja) 提案依頼書(rfp)に基づいて提案書を生成するためのシステム及び方法
CN111143556A (zh) 软件功能点自动计数方法、装置、介质及电子设备
CN115687647A (zh) 公证文书生成方法、装置、电子设备及存储介质
US11630869B2 (en) Identification of changes between document versions
CN113220951B (zh) 一种基于智能内容的医学临床支持方法和系统
CN117891447A (zh) 一种企业管理软件开发方法、装置、设备及介质
US20200387505A1 (en) Information processing system, feature description method and feature description program
RU2546064C1 (ru) Распределенная система и способ языкового перевода
CN117473054A (zh) 基于知识图谱的通用智能问答方法及装置
CN117033309A (zh) 一种数据转换方法、装置、电子设备及可读存储介质
US20220406210A1 (en) Automatic generation of lectures derived from generic, educational or scientific contents, fitting specified parameters
CN113609833B (zh) 文件的动态生成方法、装置、计算机设备及存储介质
KR102665966B1 (ko) 도서목록정보(marc data) 구축을 위한 인공지능을 이용한 분류번호(kdc, ddc) 생성 방법 및 시스템
KR102492008B1 (ko) 회의록 관리 방법 및 장치
CN114417010A (zh) 面向实时工作流的知识图谱构建方法、装置和存储介质
CN114491209A (zh) 基于互联网信息抓取的企业业务标签挖掘的方法和系统
CN114090777A (zh) 文本数据处理方法及装置
CN111949781A (zh) 一种基于自然语句句法分析的智能交互方法及装置
CN113377969B (zh) 意图识别数据处理系统
US11314931B2 (en) Assistant dialog model generation

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant