JP2021515953A - リアルタイムマークデータ生成方法及びシステム - Google Patents

リアルタイムマークデータ生成方法及びシステム Download PDF

Info

Publication number
JP2021515953A
JP2021515953A JP2020565284A JP2020565284A JP2021515953A JP 2021515953 A JP2021515953 A JP 2021515953A JP 2020565284 A JP2020565284 A JP 2020565284A JP 2020565284 A JP2020565284 A JP 2020565284A JP 2021515953 A JP2021515953 A JP 2021515953A
Authority
JP
Japan
Prior art keywords
book
information
mark data
database
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020565284A
Other languages
English (en)
Other versions
JP6925547B2 (ja
Inventor
ジェ スン ユ,
ジェ スン ユ,
Original Assignee
デヤン インテリジェンス カンパニー リミテッド
デヤン インテリジェンス カンパニー リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020180128908A external-priority patent/KR102015089B1/ko
Priority claimed from KR1020190067498A external-priority patent/KR102227421B1/ko
Application filed by デヤン インテリジェンス カンパニー リミテッド, デヤン インテリジェンス カンパニー リミテッド filed Critical デヤン インテリジェンス カンパニー リミテッド
Publication of JP2021515953A publication Critical patent/JP2021515953A/ja
Application granted granted Critical
Publication of JP6925547B2 publication Critical patent/JP6925547B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/211Schema design and management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2379Updates performed during online database operations; commit processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis

Abstract

本発明は、リアルタイムマークデータの生成方法及びシステムに関するものであり、本発明の一実施形態によるリアルタイムマークデータ生成方法は、(a)マークデータが生成されている図書の図書情報及びマークデータを用いてデータベースを構築するステップと、(b)新規図書の図書情報が入力され、入力された新規図書の図書情報及びデータベースに基づいて新規図書のマークデータを生成するステップと、(c)生成された新規図書のマークデータをユーザに提供するステップと、を有する。【選択図】図2

Description

本発明は、図書館利用者が希望図書を申し込む際にリアルタイムでマークデータを生成する方法及びシステムに関し、より詳しくは、マークデータの生成を必要とする新規図書の書誌事項とカテゴリ情報及び人工知能(AI)を活用したビッグデータの解析(分析)を行うことで、マークデータを自動生成してユーザの希望する形式に合わせて送信することができる、希望図書を申し込む際にリアルタイムでマークデータを生成して、これをユーザである図書館又は図書館サーバに送信する方法及びこれを実現可能なシステムに関する。
マーク(MARC:Machine Readable Catalog、機械可読目録)データとは、図書に関する全般的な情報をコンピュータが目録データとして識別して蓄積し、流通できるようにコード化された一連の標準形式のメタデータを意味する。現在、韓国では、米国標準(USMARC)とカナダ標準(CAN/MARC)の統合形式であるMARC21を基本とし、2005年統合書誌用韓国文献自動化目録(KORMARC)形式を韓国産業規格(KS規格)として採用して使っている。このような統合書誌用KORMARC形式は、図書の書名、著者名、版事項、発行事項、形態事項、主題、周期などの図書に関する全般的な情報を含む。
従来では、図1に示すように、図書の販売先がマークデータを生成して図書納品先に提供するか、或いは、韓国国立中央図書館又は韓国教育学術情報院がマークデータを直接生成してアップロードすると、他の図書館がそれをダウンロードして使用する方式を用いてきた。
しかし、マークデータは、書名、著者名、出版日などのように図書に記載されている客観的な情報を含む項目だけでなく、韓国十進分類法(KDC:Korean Decimal Classification、以下「KDC」という)又はデューイ十進分類法(DDC:Dewey Decimal Classification、以下「DDC」という)のようにこれを付与する司書の主観が反映される項目も含んでいるため、従来の方法により品質のマークデータを生成するには専門知識のある司書が不可欠であり、それが故に、図書納品先が提供する方法では良質のマークデータを提供することは困難であるという問題がある。
また、図書館で働いている専門知識を持った司書がマークデータを生成する業務を行うとしても、未だエラーが発生する可能性があり、図書館毎にそれぞれ異なるマークデータが生成される可能性があり、図書館毎に膨大な量の情報を検索して入力する作業を繰り返す必要があるため、かなりの時間がかかり、非効率的であるという問題がある。
このような問題を解決するために、従来マークデータを自動生成するための様々な試み(大韓民国登録特許第10−0991661号など)がなされていたが、これらは、本から直接取得可能な書誌情報のみを利用してマークデータを生成しようとしたため、実際の図書館で利用できる十分な項目のマークデータを生成できないか又は精度が大幅に低下するという問題が依然として存在している。
このように、書誌情報だけでは得られないKDC/DDC、参考文献及び索引の有無の表示、出版地、著者が個人か団体か、主題語、図書館別合わせ請求記号、図書館別図書登録番号などを含む図書のマークデータを自動生成し、特に利用者が希望図書を申し込む際に、このように生成されたマークデータをユーザの希望する形式に合わせて送信又は提供できる技術が求められており、本発明は、これに関連するものである。
本発明は、上記従来の問題点に鑑みてなされたものであって、本発明の目的は、AIを活用したビッグデータ解析により、マークデータのうちから基本書誌事項だけでは生成できなかった非書誌事項(例えば、KDC/DDC、参考文献及び索引の有無の表示、出版地、著者が個人か団体か、主題語、図書館別合わせ請求記号、図書館別図書登録番号など)も正確に生成し、利用者が希望図書を申し込む際に、ユーザである各図書館に送信するリアルタイムマークデータの生成方法を提供することにある。
また、本発明の目的は、マークデータの生成を自動化することにより、大量の図書に対してもリアルタイムで正確なマークデータを生成してマークデータの生成効率を最大限に高め、それを、希望図書を申し込む際にユーザに送信するリアルタイムマークデータの生成システムを提供することにある。
本発明の技術的課題は、以上で言及した技術的課題に制限されず、言及していない他の技術的課題は、以下の記載から通常の技術者に明確に理解されるであろう。
本発明の一実施形態によるリアルタイムマークデータ生成方法は、(a)マークデータが生成されている図書の図書情報及び前記マークデータを用いてデータベース100を構築するステップと、(b)新規図書の図書情報が入力され、前記入力された新規図書の図書情報及び前記データベース100に基づいて前記新規図書のマークデータを生成するステップと、(c)前記生成された新規図書のマークデータをユーザに提供するステップと、を有する。
前記図書情報は、図書の書誌情報、カテゴリ情報、及び目次情報を含み得る。
前記ステップ(a)では、前記マークデータが生成されている図書の図書情報に対応する非書誌情報がマッピングされたマッピングテーブルを形成して前記データベースに格納し、前記非書誌情報は、韓国十進分類法(KDC)/デューイ十進分類法(DDC)、参考文献及び索引の有無、出版地、著者が個人か団体か、主題語のうちの少なくともいずれか一つを含み得る。
前記ステップ(b)は、(b−1)入力部を介して、前記新規図書の図書情報が入力されるステップと、(b−2)抽出部が、前記データベースから入力された図書情報にマッピングされた非書誌情報を抽出するステップと、(b−3)解析部が、入力された書誌情報に対する形態素解析を行うことで、前記データベースに格納された図書との類似度を算出するステップと、(b−4)生成部が、前記類似度に基づいて、前記抽出された非書誌情報を更新して前記マークデータを生成するステップと、を含み得る。
前記類似度は、同一形態素数とカテゴリ重みとの積により算出され得る。
前記ステップ(c)では、前記生成されたマークデータのうちからユーザの希望する項目をフィルタリングして提供し得る。
本発明の一実施形態によるマークデータ生成システム10は、マークデータが生成されている図書の図書情報及び前記マークデータを格納するデータベースと、新規図書の図書情報が入力されてマークデータを生成するマーク生成部と、外部端末と通信することにより、前記図書情報又は前記マークデータを送受信する通信部と、制御部と、を備え、前記データベースは、図書情報に対応する非書誌情報がマッピングされたマッピングテーブルを形成して格納し、前記非書誌情報は、KDC/DDC、参考文献及び索引の有無、出版地、著者が個人か団体か、主題語のうちの少なくともいずれか一つを含む。
前記マーク生成部は、前記新規図書の図書情報が入力される入力部と、前記新規図書の図書情報に対応する非書誌情報を抽出する抽出部と、前記新規図書の書誌情報に対して形態素解析を行う解析部と、前記非書誌情報を更新してこれを含む新規図書のマークデータを生成する生成部と、を含み得る。
上記目的を達成するためになされた本発明の一態様によるリアルタイムマークデータの生成及び送信方法は、マーク(MARC:Machine Readable Catalog)データが生成されている図書の図書情報及び前記マークデータを用いてデータベースを構築する構築ステップと、新規図書の図書情報が利用者から入力され、前記入力された新規図書の図書情報及び前記データベースに基づいて前記新規図書のマークデータを生成する生成ステップと、前記生成された新規図書のマークデータを希望図書の申し込みの際にユーザ又はユーザサーバに送信する送信ステップと、を有する。
前記図書情報は、図書に関する書誌情報、カテゴリ情報、及び目次情報のうちの少なくともいずれか一つを含み得る。
前記構築ステップでは、前記マークデータが生成されている図書の図書情報に対応する非書誌情報がマッピングされたマッピングテーブルを形成して前記データベースに格納し、前記非書誌情報は、KDC/DDC、参考文献及び索引の有無、出版地、著者が個人か団体か、主題語のうちの少なくともいずれか一つを含み得る。
前記生成ステップは、入力部を介して、前記新規図書の図書情報が入力されるステップと、抽出部により、前記データベースから入力された図書情報にマッピングされた非書誌情報を抽出するステップと、解析部により、入力された書誌情報に対する形態素解析を行うことで、前記データベースに格納された図書との類似度を算出するステップと、生成部により、前記類似度に基づいて、前記抽出された非書誌情報を更新して前記マークデータを生成するステップと、を含み得る。
前記類似度は、同一形態素数とカテゴリ重みとの積により算出され得る。
前記送信ステップでは、前記生成されたマークデータのうちからユーザの希望する項目をフィルタリングしてユーザに送信し、前記マークデータには、図書の基本書誌情報が更に含まれ得る。
上記目的を達成するためになされた本発明の一態様によるリアルタイムマークデータの生成及び送信システムは、マーク(MARC:Machine Readable Catalog)データが生成されている図書の図書情報及び前記マークデータを格納するデータベースと、新規図書の図書情報が入力されてマークデータを生成するマーク生成部と、外部端末と通信することにより、前記図書情報又は前記マークデータを送受信する通信部と、制御部と、を備える。
前記データベースは、前記受信された図書情報に対応する非書誌情報がマッピングされたマッピングテーブルを形成して格納し、前記通信部は、リアルタイムで生成された前記マークデータをユーザサーバに送信し得る。
前記マーク生成部は、前記新規図書の図書情報が入力される入力部と、前記新規図書の図書情報に対応する非書誌情報を抽出する抽出部と、前記新規図書の書誌情報に対して形態素解析を行う解析部と、前記非書誌情報を更新してこれを含む新規図書のマークデータを生成する生成部と、を含み得る。
本発明によれば、新規図書の書誌情報、カテゴリ情報だけでなく、これに対するAIを活用したビッグデータの解析により、実際の図書館システム内でも活用できる正確且つ十分な項目を含む良質のマークデータを生成して提供することができる。
具体的には、マークデータのうちから、図書の基本書誌情報だけでは取得できない非書誌情報、例えば、KDC/DDC、参考文献及び索引の有無の表示、出版地、著者が個人か団体か、主題語、図書館別合わせ請求記号、図書館別図書登録番号などの情報を自動生成して、各図書館に提供することができる。
また、本発明によれば、必ずしも専門知識を持った司書でなくても良質のマークデータを生成することが可能であり、その結果、図書館の効率的な人員運用が可能である。
また、このようなビッグデータが格納されたシステムを介してマークデータの生成を自動化することにより、大量の図書に対してもリアルタイムで正確なマークデータを生成して、マークデータの生成効率を最大化することができる。
また、マークデータを生成し、図書館毎に必要な形式に合わせてフィルタリングして提供することにより、図書館毎に別個のマークデータを生成する必要がなく、全ての図書館で利用可能な統合サービスを提供することができ、このように各図書館が同じ体系を持つマークデータを活用するため、図書館及び図書館利用者の両方が効率的に図書館サービスを提供又は利用することができる。
特に、図書館に希望図書を申し込む際に、正確なメタ情報を収集するために役に立ち、既存のメタ情報に含まれていないマーク(MARC)情報を送信できるため、図書館で非常に有用に使用可能である。
本発明の効果は、以上で言及した効果に制限されず、言及していない他の効果は、以下の記載から通常の技術者に明確に理解されるであろう。
従来技術によるマークデータの提供方法を示す図である。 本発明の一実施形態によるマークデータの生成及び提供方法を示す図である。 本発明の一実施形態によるマークデータ生成システム10を用いたマークデータの生成を概略的に示す図である。 本発明の一実施形態によるリアルタイムマークデータ生成システム10の構成を示す図である。 本発明の一実施形態によるマーク生成部200の構成を示す図である。 本発明の一実施形態によるリアルタイムマークデータ生成方法を示すフローチャートである。 本発明の一実施形態によるマーク生成部200が新規図書のマークデータを生成する方法を示すフローチャートである。 一実施形態によるマークデータのフィルタリングを示す図である。 生成されたマークデータを、本発明によるリアルタイムマーク生成システム10からユーザサーバに送信する過程を図式的に示す図である。 生成されたマークデータを、本発明によるリアルタイムマーク生成システム10からユーザサーバに送信する過程を図式的に示す図である。
以下、本発明を実施するための形態の具体例を、図面を参照しながら詳細に説明する。本発明の利点及び特徴並びにこれらを達成する方法は、図面に結び付けて詳細に後述する実施形態を参照すれば明らかになるであろう。しかし、本発明は、後述する実施形態に何ら限定されるものではなく、異なる様々な形態に実現可能であり、単にこれらの実施形態は本発明の開示を完全たるものにし、且つ本発明が属する技術分野において通常の知識を有する者に発明の範囲を完全に知らせるために提供するものである。なお、明細書の全体に亘って同じ参照符号は同じ構成要素を示す。
他に定義がなければ、本明細書において使用される全ての用語(技術及び科学的用語を含む)は、本発明の属する技術分野における通常の技術者が共通的に理解可能な意味として使用される。また、一般的に使用される辞書に定義されている用語は、特に明白に定義されていない限り、理想的又は過度に解釈されない。本明細書で使用している用語は、実施形態を説明するためのものであり、本発明を制限しようとするものではない。本明細書において、単数形は、文句において特に断らない限り、複数形も含む。
図面において、本発明を明確に説明するための説明とは関係ない部分は省略し、明細書の全般に亘って、同一又は類似の構成要素については同一の参照符号を付した。そして、ある部分がある構成要素を「含む」とした場合、これは、特に断りのない限り、他の構成要素を除外するものではなく、他の構成要素を更に含んでいてもよいということを意味する。また、明細書で記述した「部」とは、特定の機能を実行する一つの単位又はブロックを意味する。
図1は、従来技術によるマークデータの提供方法を示す図であり、図2は、本発明の一実施形態によるマークデータの生成及び提供方法を示す図である。
図1を参照すると、従来では、一般に図書の販売先がマークデータを生成して図書納品先に提供するか、或いは韓国国立中央図書館又は韓国教育学術情報院がマークデータを直接生成してアップロードすると、他の図書館がそれをダウンロードして使用する方式を用いてきた。
しかし、マークデータは、書名、著者名、出版日などのように図書に記載されている客観的な情報を含んでいる項目だけでなく、韓国十進分類法(KDC:Korean Decimal Classification、以下「KDC」という)又はデューイ十進分類法(DDC:Dewey Decimal Classification、以下「DDC」という)のようにこれを付与する司書の主観が反映される項目も含んでいるため、従来の方法により良質のマークデータを生成するには専門知識のある司書が不可欠であり、それが故に、図書納品先が提供する方法では良質のマークデータを提供することは困難であるという問題がある。
また、図書館で働いている専門知識を持った司書がマークデータを生成する業務を行うとしても、未だエラーが発生する可能性があり、図書館毎に膨大な量の情報を検索して入力する作業を繰り返す必要があるため、かなりの時間がかかり、非効率的であるという問題がある。
図2を参照すると、本発明は、上記問題を解決するために案出されたものであり、各図書館が本発明によるマークデータ生成システム10に図書情報を入力すると、マークデータを自動生成し、生成されたマークデータを図書館に直接送信して提供する。
以下、図3〜図10を参照して、本発明によるリアルタイムマークデータ生成システム及びこれを用いたマークデータ生成方法について詳述する。
また、本明細書では、KDC/DDC情報の生成を例示として説明するが、必ずしもこれに限定されるものではなく、以下に説明する本発明と同一の技術的思想を用いることで、参考文献及び索引の有無の表示、出版地、著者が個人か団体か、主題語、図書館別合わせ請求記号、図書館別図書登録記号などの図書の基本書誌情報だけでは取得できない様々な情報を生成することができることは言うまでもない。
図3は、本発明の一実施形態によるマークデータ生成システム10を用いたマークデータの生成を概略的に示す図である。
図3を参照すると、本発明は、利用者が希望図書を(ユーザである)図書館若しくは図書館サーバに申し込むとき、新規図書の書誌情報及びカテゴリ情報を含む図書情報が入力され、これを使用してマークデータを生成し、ユーザに提供するリアルタイムマークデータ生成方法及びシステムを提供する。
マークデータとは、図書に関する全般的な情報を、コンピュータがリストデータとして識別して蓄積、流通できるようにコード化した一連の標準メタデータ形式を意味するものであり、本発明は、ビッグデータに基づいて入力された書誌情報及びカテゴリ情報などの限定的な情報を用いてマークデータを構成する項目に関する情報を推定し、それをマークデータとして生成して提供する。
ここで、書誌情報は、書名、著者名、出版社、又は国際標準図書番号(ISBN:International Standard Book Number、以下「ISBN」という)情報を含み、カテゴリ情報は、例えば、総類、哲学、宗教、社会科学、自然科学、技術科学、芸術、言語、文学、歴史などを含むが、必ずしもこれらに限定されるものではなく、これらの上下の項目を含め、ユーザの設定に応じて多様に分類できることは言うまでもない。
また、新規図書は、必ずしも一定期間内に新しく刊行された図書のみを意味するのではなく、ユーザの意思に基づいて新たにマークデータを生成する必要のある全ての図書を含む。
図4は、本発明の一実施形態によるリアルタイムマークデータ生成システム10の構成を示す図である。
図4を参照すると、本実施形態によるリアルタイムマークデータ生成システム10は、データベース100、マーク生成部200、通信部300、及び制御部400を含む。
データベース100は、マークデータが既に生成されている図書の図書情報及び当該図書情報に対応するマークデータを格納する。
データベース100に格納される図書情報は、書誌情報、カテゴリ情報、及び目次情報を含む。書誌情報は、書名、著者名、出版社、ISBN情報などを含み、カテゴリ情報は、例えば、総類、哲学、宗教、社会科学、自然科学、技術科学、芸術、言語、文学、歴史などを含むが、必ずしもこれらに限定されるものではなく、これらの上下の項目を含め、ユーザの設定に応じて多様に分類できることは言うまでもない。
一実施形態によると、データベース100に格納されている図書情報は、参照情報を更に含む。参照情報は、本の紹介、要約、原書の言語、原書名、及び原著者名などを含むが、必ずしもこれらに限定されるものではなく、ユーザの設定に応じて、図書に関連する様々な情報が含まれてもよい。
また、データベース100は、各図書の書誌情報や参照情報をなす形態素に関する情報を更に格納する。これは、後述する解析部230が形態素解析を介して新規図書と格納された図書との類似度を算出するに当たり、使用するが、これに関連しては、後の解析部230を説明しながら詳述する。
データベース100に格納される図書情報及びマークデータを、公知の入力手段(キーボード、マウス、タッチパッド、又はタッチスクリーンなど)を介して直接データベース100に入力するか、又は図書館などが備えている外部サーバから図書情報及びマークデータを受信して格納する。或いは、後述するように、本発明によるリアルタイムマークデータ生成方法により生成された新規図書のマークデータも、新規図書の図書情報と共にデータベース100に格納する。
一方、本発明の一実施形態によるデータベース100は、格納された図書の図書情報と非書誌情報とを対応させたマッピングテーブルを形成して格納する。非書誌情報は、例えば、KDC/DDC、参考文献及び索引の有無の表示、出版地、著者が個人か団体か、主題語などを含む。ここで、KDC(Korean Decimal Classification、韓国十進分類法)、DDC(Dewey Decimal Classification、デューイ十進分類法)は、主題による図書分類体系であり、0〜9の数字を用いて、百の位、十の位、一の位、及び小数点以下に下がりながら上位項目から下位項目に降順で分類される方式で図書を分類する分類体系を意味する。データベース100に格納されるマークデータには、このような図書のKDC又はDDC情報が含まれる。
本発明によるデータベース100は、マークデータが既に生成されている図書の図書情報と、当該図書のマークデータに含まれている非書誌情報とを対応させたマッピングテーブルを形成して格納する。
マーク生成部200は、新規図書の図書情報が入力され、入力された新規図書の図書情報に基づいてマークデータを生成する。
図5は、本発明の一実施形態によるマーク生成部200の構成を示す図である。
図5を参照すると、本実施形態によるマーク生成部200は、入力部210、抽出部220、解析部230、及び生成部240を含む。
入力部210は、マークデータを生成する新規図書の図書情報の入力を受ける。このとき、入力部210に入力される図書情報は、公知の入力手段によって直接入力されるか、又は後述する通信部300を介して外部サーバからのデータの形で受信して入力される。入力部210を介して入力される図書情報は、新規図書の書誌情報、カテゴリ情報、又は目次情報を含む。
抽出部220は、入力された新規図書の図書情報にマッピングされている非書誌情報を抽出する。上述したように、データベース100には、既に格納された図書の図書情報とこれに対応する非書誌情報との対応関係を示すマッピングテーブルが格納され、抽出部220は、このようなマッピングテーブルに基づいて、入力部210を介して入力された図書情報にマッピングされた非書誌情報を抽出する。例えば、入力部210を介して入力された図書情報のうち、カテゴリ情報は、ユーザの推定により非構造化データとして入力されたカテゴリ情報にマッピングされるKDC、DDCであり、抽出部220は、マッピングテーブル上で入力されたカテゴリ情報にマッピングされたKDC、DDCを抽出する。
解析部230は、入力された新規図書の書誌情報に対して形態素解析を行い、それをデータベース100に既に格納された図書の書誌事項を形成する形態素と比較して類似度を算出する。形態素解析とは、人間が使用している言語をコンピュータなどの機械装置により解釈する技術である自然言語処理の一種であり、言葉や文章を意味のある最小限の単位である形態素に分解して解析する自然言語の処理方法のことである。
一方、類似度は、(同一形態素数)×(カテゴリ重み)により算出され、類似度を算出する方法及び実施形態については、後述するマークデータ生成方法を説明しながら詳細に説明する。
一実施形態によると、本実施形態による解析部230は、参照情報を含めて形態素解析を行い、類似度を算出する。参照情報は、本の紹介、目次、要約、原書の言語、原書名、原著者名などを含むが、必ずしもこれらに限定されるものではないことは言うまでもない。
生成部240は、解析部230が算出した類似度に基づいて非書誌情報を更新し、それを含むマークデータを生成する。
抽出部220を用いて抽出されたKDC又はDDCは、ユーザの推定により非構造化データとして入力されたカテゴリ情報にマッピングされるKDC、DDCであることから、やや広い範囲をカバーするか又は精度が低い可能性があるため、生成部240は、解析部230が算出した類似度に基づいて、抽出部220が抽出したKDC又はDDCを更新することにより、より正確なKDC、DDCを算出し、このように高精度で算出されたKDC又はDDCを含むマークデータを生成する。
通信部300は、外部端末と通信することにより、図書情報及び/又はマークデータを送受信する。
外部端末とは、本発明による通信部300と通信可能な通信手段を有する電子機器を意味するものであり、ユーザ端末、図書館にあるコンピュータやサーバなどを含む。
即ち、本発明によるリアルタイムマークデータ生成システム10は、利用者が希望図書を申し込む際に、通信部300を介して外部端末から図書情報及び/又はマークデータを受信し、データベース100に格納するか又は新規図書のマークデータを生成し、生成されたマークデータを外部端末又はサーバに送信してユーザに新規図書のマークデータを提供する。
制御部400は、マークデータ生成システム10の全体的な動作を制御する。
以下、上述した本発明によるリアルタイムマークデータ生成システム10を用いたリアルタイムマークデータ生成方法について、より詳細に説明する。
図6は、本発明の一実施形態によるリアルタイムマークデータ生成方法を示すフローチャートである。
図6を参照すると、本実施形態によるリアルタイムマークデータ生成方法は、利用者が希望図書を申し込む際に、(a)マークデータが生成されている図書の図書情報及びマークデータをデータベース100に構築及び格納するステップと、(b)新規図書の図書情報が入力され、入力された新規図書の図書情報及びデータベース100に基づいて新規図書のマークデータを生成するステップと、(c)生成された新規図書のマークデータをユーザに送信するステップと、を有する。
ステップ(a)において、既にマークデータが生成されている図書の図書情報及びマークデータをデータベース100に格納してデータベース100を構築する。図書情報及びマークデータを、公知の入力手段を介して直接データベース100に入力するか、或いは図書館などが備えている外部サーバから既に格納されている図書情報及びマークデータを受信して格納する。
図書情報は、図書の書誌情報、カテゴリ情報、及び目次情報を含む。書誌情報は、書名、著者名、出版社、ISBN情報などを含み、カテゴリ情報は、例えば、総類、哲学、宗教、社会科学、自然科学、技術科学、芸術、言語、文学、歴史などを含むが、必ずしもこれらに限定されるものではなく、これらの上下の項目を含め、ユーザの設定に応じて多様に分類できることは言うまでもない。
また、図書情報は、参照情報を更に含む。参照情報は、本の紹介、要約、原書の言語、原書名、原著者名などを含むが、必ずしもこれらに限定されるものではなく、ユーザの設定に応じて、図書に関連する様々な情報が含まれてもよい。
一実施形態によると、データベース100は、格納されている図書の図書情報と非書誌情報とを対応させたマッピングテーブルを形成して格納する。
即ち、ステップ(a)では、非書誌情報を含むマークデータが既に生成されている図書に関する情報を用いてデータベース100を構築し、このようにデータベース100に格納されている図書の図書情報を非書誌情報にマッピングさせたマッピングテーブルを形成して、データベース100に格納する。
ステップ(b)において、マーク生成部200は、新規図書の図書情報が入力され、入力された新規図書の図書情報及びステップ(a)で構築されたデータベース100に基づいて、新規図書のマークデータを生成する。
図7は、本発明の一実施形態によるマーク生成部200が新規図書のマークデータを生成する方法を示すフローチャートである。
図7を参照すると、本実施形態による新規図書のマークデータ生成方法は、(b−1)入力部210を介して、新規図書の図書情報が入力されるステップと、(b−2)抽出部220が、データベース100から入力された図書情報にマッピングされた非書誌情報を抽出するステップと、(b−3)解析部230が、入力された書誌情報に対する形態素解析を行うことで、データベース100に格納された図書との類似度を算出するステップと、(b−4)生成部240が、類似度に基づいて、抽出された非書誌情報を更新してマークデータを生成するステップと、を含む。
ステップ(b−1)では、入力部210を介して新規図書の書誌情報及びカテゴリ情報を含む図書情報が入力される。
即ち、ステップ(b−1)において、ユーザは、マークデータを生成しようとする新規図書の書誌情報、及びユーザが推定したカテゴリ情報を入力する。このように、ユーザから入力される書誌情報及びカテゴリ情報は、公知の入力手段を介して直接入力部210に入力されるか、又は通信部300を介して外部サーバから受信して入力部210に入力される。
ここで、ユーザが入力した図書情報の書誌情報は、書名、著者名、出版社、ISBNなどの、図書に記載されている客観的な情報を含み、カテゴリ情報は、ユーザの主観的な解釈に基づいて推定したカテゴリである。
ステップ(b−1)で入力される図書情報は、書誌情報、カテゴリ情報、及び目次情報の他の参照情報を更に含む。参照情報は、本の紹介、要約、原書の言語、原書名、原著者名などを含むが、必ずしもこれらに限定されるものではないことは言うまでもない。
ステップ(b−2)では、抽出部220を介して、ステップ(b−1)で入力された新規図書の図書情報にマッピングされている非書誌情報を抽出する。
本発明によるデータベース100には、カテゴリ情報を含む図書情報とこれに対応する非書誌情報との対応関係を示すマッピングテーブルが格納され、ステップ(b−2)では、このようなマッピングテーブルに基づいて、ステップ(b−1)でユーザが入力した図書情報にマッピングされた非書誌情報を抽出する。
ステップ(b−3)において、解析部230は、入力された書誌情報に対する形態素解析を行うことで、データベース100に格納された図書との類似度を算出する。
形態素解析とは、人間が使用している言語をコンピュータなどの機械装置により解釈する技術である自然言語処理の一種であり、言葉や文章を意味のある最小限の単位である形態素に分解して解析する自然言語の処理方法のことである。
解析部230は、ステップ(b−1)で入力された新規図書の書誌情報に対して形態素解析を行い、これを、データベース100に既に格納された図書の書誌事項を形成する形態素と比較して類似度を算出する。
類似度は、(同一形態素数)×(カテゴリ重み)により算出可能であり、これを数式で表すと以下の通りである。
Figure 2021515953
(S:類似度、N:同一形態素数、w:カテゴリ重み)
同一形態素数(N)は、同一の形態素が示される頻度が多いほど、新規図書に類似している可能性が高いことを数式化したものである。
カテゴリ重み(w)は、ユーザが入力したカテゴリ情報に類似するカテゴリを有する図書であればあるほど、新規図書に類似している可能性が高いことを数式化したものである。
一実施形態によると、カテゴリ重みは、ステップ(b−2)で抽出されたKDC、DDCと、百の位、十の位、及び一の位が順次一致する図書であればあるほど高い重みが設定される。
KDC及びDDCは、0〜9の数字を用いて、百の位、十の位、一の位、及び小数点以下に下がりながら上位項目から下位項目に降順で分類される方式で図書を分類する分類体系であり、百の位、十の位、及び一の位が順次一致すればするほど、互いに類似するカテゴリの図書である可能性が高い。
即ち、カテゴリ重みでは、ステップ(b−2)で算出された新規図書のKDC、DDCと、百の位、十の位、及び一の位が全て一致する図書のカテゴリ重みを最も高く設定し、その次に百の位及び十の位が一致する図書、更にその次に百の位が一致する図書、最終的に百の位が一致していない図書の順に設定する。
数式では表現されていないが、一実施形態によると、類似度を算出するに当たり、各形態素に応じて異なる重み(加重値)が与えられるように設定される。
解析部230によって図書の書誌情報から抽出された各形態素は、各図書が含まれているカテゴリとの関連の程度が互いに異なる可能性があり、これを考慮して、形態素毎に異なる重みが与えられるように設定してもよい。
この場合、各形態素に与えられる重みにおいて、形態素が同一のカテゴリ内に示される頻度が高いほど、より高い重みが与えられるように設定される。
一実施形態によると、本実施形態による解析部230は、新規図書の書誌情報だけでなく参照情報に対しても形態素分析を行う。参照情報は、本の紹介、目次、要約、原書の言語、原書名及び原著者名などを含む。
ステップ(b−4)において、生成部240は、ステップ(b−3)で算出された類似度に基づいて、抽出された非書誌情報を更新してマークデータを生成する。
例えば、上述したように、ステップ(b−2)で抽出されたKDC又はDDCは、ユーザの推定により非構造化データとして入力されたカテゴリ情報にマッピングされるKDC、DDCであることから、やや広い範囲をカバーするか又は精度が低い可能性があるため、ステップ(b−4)では、入力された図書の書誌情報に基づいて、抽出されたKDC又はDDCを更新することにより、より正確なKDC、DDCを算出し、このように高精度で算出されたKDC又はDDCを含むマークデータを生成する。
一方、ステップ(b−4)により生成された新規図書のマークデータは、新規図書の図書情報と共に、本発明によるデータベース100に自動更新されて格納される。
ステップ(c)では、ステップ(b)で生成された新規図書のマークデータを、ユーザ所有の端末又はユーザが運用するサーバ(例えば、図書館サーバ)に送信し、ユーザに提供する。
一実施形態によると、ステップ(c)では、生成されたマークデータのうち、ユーザの希望する項目をフィルタリングして提供する。
上述したように、本発明によるマークデータ生成方法に基づいて生成されたマークデータは、書名、著者名、版事項、発行事項、形態事項、主題、周期などを含む図書に関する全般的な情報をコード化して格納したデータである。各ユーザ又は図書館は、これらのうちから利用したい項目だけを選別的に選択して提供する。
図8は、一実施形態によるマークデータのフィルタリングを示す図である。
図8を参照すると、図書館A及びNは、図書館毎に定義された図書館定義フィルタA〜図書館定義フィルタNを介して選択範囲に該当する項目のみを選択し、非選択領域に該当する項目を排除することにより、リアルタイムマークデータ生成システムで生成されたマークデータのいずれかの項目だけをフィルタリングして提供する。
上述したように、本明細書では、KDC/DDC情報の生成を例示として説明したが、本発明の技術的思想は、必ずしもこれに限定されるものではなく、KDC/DDC情報を含めて参考文献及び索引の有無の表示、出版地、著者が個人か団体か、主題語、図書館別合わせ請求記号、図書館別図書登録記号などの図書の基本書誌情報だけでは取得できない様々な情報を生成することができる。
図9及び図10は、本発明によるリアルタイムマーク生成システム10において、利用者(ここでは、図書を購入したい図書の申し込みを行う人を意味する)が希望図書を申し込む際に、入力或いは送信された新規図書の図書情報が入力され、リアルタイムで生成された新規図書のマークデータを生成した後、生成されたマークデータをユーザサーバ(例えば、図書館サーバ、受信サーバなど)に送信する過程をそれぞれ図式的に示す図である。
図9に示すように、本発明によるリアルタイムマーク生成システム10において、ユーザに送信されるマークデータには図書メタ情報が含まれているため、マークデータのみが送信されても、ユーザサーバはマークデータをパーシングして図書メタ情報を抽出することができる。また、ユーザサーバでは、抽出された図書メタ情報にマークデータが含まれている手書きリストを作成することができる。このとき、マークデータは、本発明のリアルタイムマーク生成システム10からユーザサーバに送信した時点のデータになる。
従って、本発明によるリアルタイムマークデータの生成及び送信方法では、リアルタイムマーク生成システム10からユーザサーバに送信する際に、規格化された標準データフォーマットであるマークデータのみを使用するため、ユーザ又はユーザサーバは、最初の連動時に、送信先に別個の規格を伝える必要なしに(本発明を使用する)様々な供給源からマークデータを受信することができるという利点を有する。
図10は、本発明によりリアルタイムで生成された新規図書のマークデータを生成した後、生成されたマークデータをユーザサーバ(例えば、図書館サーバ、受信サーバなど)に送信する過程の他の変形例を示す図である。
上述した図8の過程とは異なり、この変形例は、本発明のリアルタイムマーク生成システム10がユーザサーバにマークデータを送信するとき、リアルタイムで生成されたマークデータと共に図書のメタ情報を単一の値として一遍に送信する方式である。
このように、ユーザサーバは、リアルタイムで生成されたマークデータと共に図書のメタ情報を単一の値として一遍に送信されることにより、より迅速且つ正確に図書メタ情報を用いて手書きリストを作成することができ、共に送信されたマークデータを含めることができる。このような方式によりリアルタイムマークデータが送信される場合には、最小限の変更で既存システムに適用できるという利点がある。
以上、説明した本発明の実施形態は例示の目的のために開示されたものであり、これらによって本発明が限定されるものではない。また、本発明の技術分野における通常の知識を有する者であれば、本発明の思想及び範囲内において様々な修正及び変更を加えることが可能であり、これらの修正及び変更は本発明の範囲に属すると見なすべきである。
本発明は、図書館利用者が希望図書を申し込む際にリアルタイムでマークデータを生成する方法及びシステムに関するものであり、マークデータの生成を必要とする新規図書の書誌事項とカテゴリ情報及びAIを活用したビッグデータ解析によりマークデータを自動生成してユーザの希望する形式に合わせて送信することができ、希望図書の申し込みの際にリアルタイムでマークデータを生成し、これをユーザである図書館又は図書館サーバに送信することができる。また、新規図書の書誌情報、カテゴリ情報だけでなく、これに対するAIを活用したビッグデータ解析により、実際の図書館システム内でも活用することができる正確且つ十分な項目を含む良質のマークデータを生成して提供することができるため、産業上の利用可能性がある。
10 (リアルタイム)マークデータ生成システム
100 データベース
200 マーク生成部
210 入力部
220 抽出部
230 解析部
240 生成部
300 通信部
400 制御部

Claims (8)

  1. リアルタイムマークデータの生成及び送信方法であって、
    マーク(MARC:Machine Readable Catalog)データが生成されている図書の図書情報及び前記マークデータを用いてデータベースを構築する構築ステップと、
    新規図書の図書情報が利用者から入力され、前記入力された新規図書の図書情報及び前記データベースに基づいて前記新規図書のマークデータを生成する生成ステップと、
    前記生成された新規図書のマークデータをユーザ又はユーザサーバに送信する送信ステップと、を有することを特徴とするリアルタイムマークデータの生成及び送信方法。
  2. 前記図書情報は、図書に関する書誌情報、カテゴリ情報、及び目次情報のうちの少なくともいずれか一つを含むことを特徴とする請求項1に記載のリアルタイムマークデータの生成及び送信方法。
  3. 前記構築ステップでは、前記マークデータが生成されている図書の図書情報に対応する非書誌情報がマッピングされたマッピングテーブルを形成して前記データベースに格納し、
    前記非書誌情報は、韓国十進分類法(KDC)/デューイ十進分類法(DDC)、参考文献及び索引の有無、出版地、著者が個人か団体か、主題語のうちの少なくともいずれか一つを含むことを特徴とする請求項1に記載のリアルタイムマークデータの生成及び送信方法。
  4. 前記生成ステップは、
    入力部を介して、前記新規図書の図書情報が入力されるステップと、
    抽出部により、前記データベースから入力された図書情報にマッピングされた非書誌情報を抽出するステップと、
    解析部により、入力された書誌情報に対する形態素解析を行うことで、前記データベースに格納された図書との類似度を算出するステップと、
    生成部により、前記類似度に基づいて、前記抽出された非書誌情報を更新して前記マークデータを生成するステップと、を含むことを特徴とする請求項1に記載のリアルタイムマークデータの生成及び送信方法。
  5. 前記類似度は、同一形態素数とカテゴリ重みとの積により算出されることを特徴とする請求項4に記載のリアルタイムマークデータの生成及び送信方法。
  6. 前記送信ステップでは、前記生成されたマークデータのうちからユーザの希望する項目をフィルタリングしてユーザに送信し、
    前記マークデータには、図書の基本書誌情報が更に含まれることを特徴とする請求項1に記載のリアルタイムマークデータの生成及び送信方法。
  7. マーク(MARC:Machine Readable Catalog)データが生成されている図書の図書情報及び前記マークデータを格納するデータベースと、
    新規図書の図書情報が入力されてマークデータを生成するマーク生成部と、
    外部端末と通信することにより、前記図書情報又は前記マークデータを送受信する通信部と、
    制御部と、を備え、
    前記データベースは、前記受信された図書情報に対応する非書誌情報がマッピングされたマッピングテーブルを形成して格納し、
    前記通信部は、リアルタイムで生成された前記マークデータをユーザサーバに送信することを特徴とするリアルタイムマークデータの生成及び送信システム。
  8. 前記マーク生成部は、
    前記新規図書の図書情報が入力される入力部と、
    前記新規図書の図書情報に対応する非書誌情報を抽出する抽出部と、
    前記新規図書の書誌情報に対して形態素解析を行う解析部と、
    前記非書誌情報を更新してこれを含む新規図書のマークデータを生成する生成部と、を含むことを特徴とする請求項7に記載のリアルタイムマークデータの生成及び送信システム。

JP2020565284A 2018-10-26 2019-10-07 リアルタイムマークデータ生成方法及びシステム Active JP6925547B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
KR10-2018-0128908 2018-10-26
KR1020180128908A KR102015089B1 (ko) 2018-10-26 2018-10-26 실시간 마크 데이터 생성 방법 및 시스템
KR10-2019-0067498 2019-06-07
KR1020190067498A KR102227421B1 (ko) 2019-06-07 2019-06-07 이용자가 희망 도서 신청 시 실시간 마크 데이터를 생성하고 전송하는 방법 및 이를 위한 시스템
PCT/KR2019/013088 WO2020085674A1 (ko) 2018-10-26 2019-10-07 이용자가 희망 도서 신청 시 실시간으로 마크 데이터를 생성하고 전송하는 방법 및 이를 위한 시스템

Publications (2)

Publication Number Publication Date
JP2021515953A true JP2021515953A (ja) 2021-06-24
JP6925547B2 JP6925547B2 (ja) 2021-08-25

Family

ID=70331561

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020565284A Active JP6925547B2 (ja) 2018-10-26 2019-10-07 リアルタイムマークデータ生成方法及びシステム

Country Status (5)

Country Link
US (1) US11409718B2 (ja)
EP (1) EP3872743A4 (ja)
JP (1) JP6925547B2 (ja)
CN (1) CN112534465A (ja)
WO (1) WO2020085674A1 (ja)

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4209692B2 (ja) 2003-01-28 2009-01-14 株式会社日立製作所 図書管理システム及び書誌情報管理方法
US20060167933A1 (en) * 2005-01-07 2006-07-27 Hassan Behbehani International standard question number
KR100537058B1 (ko) * 2005-09-13 2005-12-16 주식회사 이지막 마크 데이터를 효율적으로 제공하기 위한 온라인 마크데이터 제공 시스템 및 방법
US7667863B1 (en) * 2005-10-27 2010-02-23 Eldred John H Method for modification of publication covers
US7890337B2 (en) * 2006-08-25 2011-02-15 Jermyn & Associates, Llc Anonymity-ensured system for providing affinity-based deliverables to library patrons
US7720873B2 (en) * 2007-06-21 2010-05-18 International Business Machines Corporation Dynamic data discovery of a source data schema and mapping to a target data schema
KR100839200B1 (ko) 2007-07-27 2008-06-19 주식회사 학술정보 인터넷을 통한 도서정보 상호교류 통한 데이터베이스 구축 시스템 및 방법
KR20090032546A (ko) 2007-09-28 2009-04-01 이종엽 도서용 마크 데이터 처리 시스템 및 그 방법
US8949241B2 (en) * 2009-05-08 2015-02-03 Thomson Reuters Global Resources Systems and methods for interactive disambiguation of data
KR100991661B1 (ko) 2010-05-31 2010-11-04 이병준 도서의 디디씨/케이디씨 자동 분류 시스템 및 그 방법
KR20120078928A (ko) * 2011-01-03 2012-07-11 삼성전자주식회사 전자 책 콘텐츠 관리를 위한 방법 및 장치
US20130085973A1 (en) * 2011-09-30 2013-04-04 Sirsi Corporation Library intelligence gathering and reporting
KR20130096796A (ko) * 2012-02-23 2013-09-02 삼성전자주식회사 전자책의 리소스 검색 장치 및 방법
KR101479322B1 (ko) 2012-03-22 2015-01-05 조문환 마크 데이터 구축 방법
US8682796B2 (en) * 2012-08-23 2014-03-25 Sirsi Corporation Digital resource acquisition
JP2014059728A (ja) * 2012-09-18 2014-04-03 Crew Systems Inc 電子書籍システム
CN104718546B (zh) * 2012-09-26 2017-12-05 株式会社东芝 文档分析装置以及记录介质
CN202995762U (zh) * 2012-11-10 2013-06-12 西安景行数创信息科技有限公司 图书馆新书入馆实时提醒系统
KR101589705B1 (ko) 2013-07-10 2016-01-29 조문환 구매요청도서 마크 데이터 구축방법
KR20150007109A (ko) * 2013-07-10 2015-01-20 조정환 구매요청도서 마크 데이터 구축방법
US20160140096A1 (en) * 2014-11-17 2016-05-19 Kobo Inc. Excerpt selection feature for an e-reading device
US10321167B1 (en) * 2016-01-21 2019-06-11 GrayMeta, Inc. Method and system for determining media file identifiers and likelihood of media file relationships
CN105760942A (zh) * 2016-02-18 2016-07-13 李晓秋 一种图书借阅方法和装置
CN105893485B (zh) * 2016-03-29 2019-02-12 浙江大学 一种基于图书目录的专题自动生成方法
US11520412B2 (en) * 2017-03-06 2022-12-06 Microsoft Technology Licensing, Llc Data input system/example generator
CN107862069A (zh) * 2017-11-21 2018-03-30 广州星耀悦教育科技有限公司 一种分类数据库的构建方法以及图书分类的方法
CN108595504B (zh) * 2018-03-20 2023-09-29 山东中教传媒有限公司 一种图书管控服务平台
US11062035B2 (en) * 2018-04-30 2021-07-13 Innoplexus Ag Secure document management using blockchain
KR102015089B1 (ko) 2018-10-26 2019-08-27 유제승 실시간 마크 데이터 생성 방법 및 시스템

Also Published As

Publication number Publication date
EP3872743A4 (en) 2022-07-13
CN112534465A (zh) 2021-03-19
JP6925547B2 (ja) 2021-08-25
WO2020085674A1 (ko) 2020-04-30
EP3872743A1 (en) 2021-09-01
US11409718B2 (en) 2022-08-09
US20210209071A1 (en) 2021-07-08

Similar Documents

Publication Publication Date Title
Riaz et al. Opinion mining on large scale data using sentiment analysis and k-means clustering
KR100816934B1 (ko) 문서검색 결과를 이용한 군집화 시스템 및 그 방법
US20080097937A1 (en) Distributed method for integrating data mining and text categorization techniques
WO2021019831A1 (ja) 管理システム及び管理方法
KR20100113423A (ko) 역 벡터 공간 모델을 이용한 키워드 추천방법 및 그 장치
JP2014109871A (ja) 文書管理システムおよび文書管理方法並びに文書管理プログラム
CN110489653A (zh) 舆情信息查询方法和装置、系统、电子设备、存储介质
US20040083422A1 (en) System and method for automatically generating patent analysis reports
KR20170027576A (ko) 연구 이력 매칭 기반의 연구자 추천 장치 및 방법
CN109376219A (zh) 文本属性字段的匹配方法、装置、电子设备及存储介质
JP5048852B2 (ja) 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体
JP5827206B2 (ja) 文書管理システムおよび文書管理方法並びに文書管理プログラム
KR102015089B1 (ko) 실시간 마크 데이터 생성 방법 및 시스템
JP6925547B2 (ja) リアルタイムマークデータ生成方法及びシステム
JP2013105207A (ja) 秘匿化データの検索のための情報処理方法及び装置
KR102227421B1 (ko) 이용자가 희망 도서 신청 시 실시간 마크 데이터를 생성하고 전송하는 방법 및 이를 위한 시스템
WO2015118619A1 (ja) 文書分析システム及び文書分析方法並びに文書分析プログラム
CN114969371A (zh) 一种联合知识图谱的热度排序方法及装置
CN110737749B (zh) 创业计划评价方法、装置、计算机设备及存储介质
US11816421B2 (en) Summary creation method, summary creation system, and summary creation program
JP6964891B2 (ja) 窓口業務管理装置、窓口業務管理方法及び窓口業務管理プログラム
JP6542546B2 (ja) 文書データ処理方法およびシステム
JP2008234290A (ja) 検索方法および検索装置
WO2018003115A1 (ja) 分析支援装置、分析支援方法、および分析支援プログラム
JP7431379B1 (ja) データ処理装置及びデータ処理方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201118

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201118

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20201118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210706

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210803

R150 Certificate of patent or registration of utility model

Ref document number: 6925547

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150