KR20170080768A - 데이터 스크래핑 시스템, 방법 및 컴퓨터 프로그램 - Google Patents
데이터 스크래핑 시스템, 방법 및 컴퓨터 프로그램 Download PDFInfo
- Publication number
- KR20170080768A KR20170080768A KR1020150189547A KR20150189547A KR20170080768A KR 20170080768 A KR20170080768 A KR 20170080768A KR 1020150189547 A KR1020150189547 A KR 1020150189547A KR 20150189547 A KR20150189547 A KR 20150189547A KR 20170080768 A KR20170080768 A KR 20170080768A
- Authority
- KR
- South Korea
- Prior art keywords
- scraping
- data
- information
- module
- inquiry
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/02—Banking, e.g. interest calculation or account maintenance
-
- G06F17/30722—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Theoretical Computer Science (AREA)
- Technology Law (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Development Economics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Description
도 2는 일 실시예에 따른 데이터 스크래핑 시스템의 구성을 나타내는 블록도이다.
도 3은 도 2에 도시된 관리 모듈 및 스크래핑 모듈의 상세 구성을 나타내는 블록도이다.
도 4는 도 3에 도시된 스크래핑 모듈의 하드웨어 제원을 나타내는 블록도이다.
도 5는 일 실시예에 따른 데이터 스크래핑 방법의 각 단계를 나타내는 순서도이다.
도 6은 도 5에 도시된 실시예의 보다 구체적인 형태를 나타내는 순서도이다.
Claims (7)
- 스크래핑이 필요한 조회 또는 수행을 호출하는 서비스 프로그램을 구비하며, 스크래핑을 위한 사용자 정보를 수신하고, 내부 스케줄 알고리즘을 사용하여 사용자 정보와 작업을 할당하는 관리 모듈; 및
상기 관리 모듈에 의해 할당된 사용자 정보와 작업에 기초하여, 서로 상이한 복수의 기관에 통신 가능하게 연결되어 상기 복수의 기관으로부터 호출된 조회 또는 수행에 대응되는 데이터를 스크래핑하도록 구성된 스크래핑 모듈을 포함하되,
상기 스크래핑 모듈은, 스크래핑될 데이터 항목을 지정하는 메타 데이터베이스를 포함하며, 상기 기관이 제공하는 데이터 셋으로부터 상기 메타 데이터베이스에 기반하여 스크래핑할 데이터를 추출하도록 구성된, 데이터 스크래핑 시스템.
- 제 1항에 있어서,
상기 스크래핑 모듈은, 호출된 조회 또는 수행에 대응되는 데이터를 스크래핑하기 위하여 상기 복수의 기관에서 요구하는 인증 방식에 대한 정보를 포함하며, 상기 사용자 정보가 상기 인증 방식으로 처리된 인증값을 상기 기관에 전송하도록 구성된, 데이터 스크래핑 시스템.
- 제 1항에 있어서,
상기 관리 모듈은 호출된 조회 또는 수행에 대응되는 데이터를 사용자 장치에 제공하도록 더 구성되며, 상기 사용자 장치는 모바일 컴퓨팅 장치를 포함하는 데이터 스크래핑 시스템.
- 데이터 스크래핑 시스템을 이용한 데이터 스크래핑 방법으로서,
사용자 장치로부터, 사용자에 의해 호출된 조회 또는 수행의 정보 및 사용자 정보를 포함하여 스크래핑에 필요한 정보를 수신하는 단계;
스크래핑될 데이터 항목의 정보를 메타 데이터베이스에 저장하는 단계;
내부 스케줄 알고리즘을 사용하여 스크래핑 모듈에 사용자 정보와 작업을 할당하는 단계; 및
상기 스크래핑 모듈이, 할당된 상기 사용자 정보와 작업에 기초하여, 서로 상이한 복수의 기관과 통신함으로써 상기 복수의 기관으로부터 호출된 조회 또는 수행에 대응되는 데이터를 스크래핑하는 단계를 포함하되,
상기 데이터를 스크래핑하는 단계는, 상기 기관이 제공하는 데이터 셋으로부터 상기 메타 데이터베이스에 기반하여 스크래핑할 데이터를 추출하는 단계를 포함하는 데이터 스크래핑 방법.
- 제 4항에 있어서,
상기 스크래핑 모듈은, 호출된 조회 또는 수행에 대응되는 데이터를 스크래핑하기 위하여 상기 복수의 기관에서 요구하는 인증 방식에 대한 정보를 포함하며,
상기 데이터를 스크래핑하는 단계는, 상기 스크래핑할 데이터를 추출하는 단계 전에, 상기 사용자 정보가 상기 인증 방식으로 처리된 인증값을 상기 기관에 전송하는 단계를 더 포함하는 데이터 스크래핑 방법.
- 제 4항에 있어서,
상기 데이터를 스크래핑하는 단계 후에, 호출된 조회 또는 수행에 대응되는 데이터를 사용자 장치에 제공하는 단계를 더 포함하되, 상기 사용자 장치는 모바일 컴퓨팅 장치를 포함하는 데이터 스크래핑 방법.
- 하드웨어와 결합되어 제 4항 내지 제 6항 중 어느 한 항에 따른 데이터 스크래핑 방법을 실행하도록 매체에 저장된 컴퓨터 프로그램.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150189547A KR101815235B1 (ko) | 2015-12-30 | 2015-12-30 | 데이터 스크래핑 시스템, 방법 및 컴퓨터 프로그램 |
JP2016008726A JP6209626B2 (ja) | 2015-12-30 | 2016-01-20 | データスクレイピングシステム、方法及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150189547A KR101815235B1 (ko) | 2015-12-30 | 2015-12-30 | 데이터 스크래핑 시스템, 방법 및 컴퓨터 프로그램 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170080768A true KR20170080768A (ko) | 2017-07-11 |
KR101815235B1 KR101815235B1 (ko) | 2018-01-08 |
Family
ID=59272038
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020150189547A Active KR101815235B1 (ko) | 2015-12-30 | 2015-12-30 | 데이터 스크래핑 시스템, 방법 및 컴퓨터 프로그램 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP6209626B2 (ko) |
KR (1) | KR101815235B1 (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101944776B1 (ko) | 2017-10-13 | 2019-02-01 | 한국정보통신주식회사 | 스크래핑 분석 알림 서비스 제공 방법 및 그 장치 |
KR20190124630A (ko) * | 2018-04-25 | 2019-11-05 | 주식회사쿠콘 | 스크립트 엔진을 이용한 데이터 스크래핑 시스템, 방법 및 컴퓨터 프로그램 |
KR20200022289A (ko) * | 2018-08-22 | 2020-03-03 | 주식회사 핑거 | 웹 브라우저 기반 스크래핑 시스템 및 방법 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101982085B1 (ko) | 2018-04-25 | 2019-05-27 | 주식회사쿠콘 | 스크립트 엔진을 이용한 데이터 스크래핑 시스템, 방법 및 컴퓨터 프로그램 |
KR102009336B1 (ko) | 2018-04-25 | 2019-08-12 | 주식회사쿠콘 | 미리 스크래핑된 빅데이터를 이용한 클라우드 스크래핑 시스템 및 방법과, 이를 위한 컴퓨터 프로그램 |
KR102625971B1 (ko) | 2018-07-02 | 2024-01-19 | 주식회사 비즈모델라인 | 기업 환경 마일리지 제공 추천 방법 |
JP6722735B2 (ja) * | 2018-09-14 | 2020-07-15 | クーコン カンパニー リミテッドCoocon Co.,Ltd. | スクレイピングを通じた資金振替・振込方法とそのシステム及びコンピュータプログラム |
JP7156615B2 (ja) * | 2020-06-22 | 2022-10-19 | クーコン カンパニー リミテッド | スクレイピングを通じた資金振替・振込方法とそのシステム及びコンピュータプログラム |
KR102369147B1 (ko) | 2021-05-20 | 2022-03-02 | 쿠팡 주식회사 | 전자 장치 및 그의 데이터 관리 방법 |
KR102767615B1 (ko) * | 2022-06-23 | 2025-02-12 | 이연우 | 사용자 맞춤형 자동차 서비스의 통합 제공 방법 및 장치 |
KR20240055224A (ko) | 2022-10-19 | 2024-04-29 | 주식회사쿠콘 | 하이브리드 스크래핑을 이용한 정보 스크래핑 방법과 시스템 및 이를 위한 컴퓨터 프로그램 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000163375A (ja) * | 1998-11-30 | 2000-06-16 | Hitachi Ltd | 複数ediシステム間でのアクセス権限管理方法 |
AU2001247950A1 (en) * | 2000-02-02 | 2001-08-14 | Ezlogin.Com, Inc. | Clipping and manipulating elements contained in a web page |
JP5576005B2 (ja) * | 2000-11-07 | 2014-08-20 | 株式会社三菱東京Ufj銀行 | 認証代行装置 |
JP2004303037A (ja) * | 2003-03-31 | 2004-10-28 | Ntt Comware Corp | 銀行統合支援システム、方法およびプログラム |
KR100624705B1 (ko) * | 2006-05-16 | 2006-09-15 | 웹케시 주식회사 | 스크래핑 머신을 이용한 스크린 스크래핑 분산처리 방법 및그 시스템 |
JP2009054166A (ja) * | 2008-09-18 | 2009-03-12 | Kazuhiro Yamamoto | 掲載データのクリッピングシステム |
JP2010176387A (ja) * | 2009-01-29 | 2010-08-12 | Nec Corp | 電子スクラップシステム、電子スクラップ方法、電子スクラップサーバ、および利用者端末 |
CA2820707A1 (en) * | 2010-12-09 | 2012-06-14 | Exacttarget, Inc. | System, method, and computer-readable program for real-time monitoring of activity |
JP2015207074A (ja) * | 2014-04-18 | 2015-11-19 | 日本電気株式会社 | 情報資産管理システム、情報資産管理装置、情報資産管理方法、及び、そのプログラム |
-
2015
- 2015-12-30 KR KR1020150189547A patent/KR101815235B1/ko active Active
-
2016
- 2016-01-20 JP JP2016008726A patent/JP6209626B2/ja active Active
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101944776B1 (ko) | 2017-10-13 | 2019-02-01 | 한국정보통신주식회사 | 스크래핑 분석 알림 서비스 제공 방법 및 그 장치 |
KR20190124630A (ko) * | 2018-04-25 | 2019-11-05 | 주식회사쿠콘 | 스크립트 엔진을 이용한 데이터 스크래핑 시스템, 방법 및 컴퓨터 프로그램 |
KR20200022289A (ko) * | 2018-08-22 | 2020-03-03 | 주식회사 핑거 | 웹 브라우저 기반 스크래핑 시스템 및 방법 |
Also Published As
Publication number | Publication date |
---|---|
JP2017120607A (ja) | 2017-07-06 |
KR101815235B1 (ko) | 2018-01-08 |
JP6209626B2 (ja) | 2017-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101815235B1 (ko) | 데이터 스크래핑 시스템, 방법 및 컴퓨터 프로그램 | |
KR102340474B1 (ko) | 스크립트 엔진을 이용한 데이터 스크래핑 시스템, 방법 및 컴퓨터 프로그램 | |
KR101982085B1 (ko) | 스크립트 엔진을 이용한 데이터 스크래핑 시스템, 방법 및 컴퓨터 프로그램 | |
US20230185949A1 (en) | System and method for automatically securing sensitive data in public cloud using a serverless architecture | |
TW202023224A (zh) | 事件驅動的區塊鏈工作流程處理 | |
US20150371031A1 (en) | Method, system, and authentication device | |
CN102446121A (zh) | 根据用户指定的虚拟机指标分配虚拟机 | |
EP3842980A1 (en) | System and method for automatically securing sensitive data in public cloud using a serverless architecture | |
US11586687B2 (en) | Apparatus, method and computer program for cloud scraping using pre-scraped big data | |
CN111638976A (zh) | 基于共享内存的数据传输方法及系统 | |
US20230050048A1 (en) | Isolating And Reinstating Nodes In A Distributed Ledger Using Proof Of Innocence | |
KR20230092086A (ko) | Erp 시스템 연계를 통한 금융 정보 통합 중계 시스템 및 방법과 이를 위한 컴퓨터 프로그램 | |
CN108241732B (zh) | 电子装置、信息处理的方法及存储介质 | |
JP2007299328A (ja) | 計算処理方法および計算処理システム | |
KR102755745B1 (ko) | 보험금 청구대행 기반 자동보상 구독 서비스 제공 시스템 | |
CN110796021A (zh) | 一种应用于自助设备的身份认证方法和装置 | |
KR100624705B1 (ko) | 스크래핑 머신을 이용한 스크린 스크래핑 분산처리 방법 및그 시스템 | |
US10298682B2 (en) | Controlling device data collectors using omni-collection techniques | |
CN105229662A (zh) | 访问控制装置和访问控制方法以及程序 | |
KR20180130910A (ko) | 스크래핑 장치 및 방법 | |
JP2020046730A (ja) | スクレイピングを通じた資金振替・振込方法とそのシステム及びコンピュータプログラム | |
KR20240094217A (ko) | 분산 조회 방식의 스크래핑 서비스 시스템과 방법 및 이를 위한 컴퓨터 프로그램 | |
KR20240055224A (ko) | 하이브리드 스크래핑을 이용한 정보 스크래핑 방법과 시스템 및 이를 위한 컴퓨터 프로그램 | |
KR20240094218A (ko) | 페이지 스크래핑 서비스 시스템과 방법 및 이를 위한 컴퓨터 프로그램 | |
HK40013969A (en) | Event-driven blockchain workflow processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20151230 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20170411 Patent event code: PE09021S01D |
|
AMND | Amendment | ||
PG1501 | Laying open of application | ||
E601 | Decision to refuse application | ||
PE0601 | Decision on rejection of patent |
Patent event date: 20171017 Comment text: Decision to Refuse Application Patent event code: PE06012S01D Patent event date: 20170411 Comment text: Notification of reason for refusal Patent event code: PE06011S01I |
|
AMND | Amendment | ||
PX0901 | Re-examination |
Patent event code: PX09011S01I Patent event date: 20171017 Comment text: Decision to Refuse Application Patent event code: PX09012R01I Patent event date: 20170612 Comment text: Amendment to Specification, etc. |
|
PX0701 | Decision of registration after re-examination |
Patent event date: 20171220 Comment text: Decision to Grant Registration Patent event code: PX07013S01D Patent event date: 20171116 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I Patent event date: 20171017 Comment text: Decision to Refuse Application Patent event code: PX07011S01I Patent event date: 20170612 Comment text: Amendment to Specification, etc. Patent event code: PX07012R01I |
|
X701 | Decision to grant (after re-examination) | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20171228 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20171228 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20201102 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20211130 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20221130 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20231031 Start annual number: 7 End annual number: 7 |