KR100624705B1 - 스크래핑 머신을 이용한 스크린 스크래핑 분산처리 방법 및그 시스템 - Google Patents
스크래핑 머신을 이용한 스크린 스크래핑 분산처리 방법 및그 시스템 Download PDFInfo
- Publication number
- KR100624705B1 KR100624705B1 KR1020060043785A KR20060043785A KR100624705B1 KR 100624705 B1 KR100624705 B1 KR 100624705B1 KR 1020060043785 A KR1020060043785 A KR 1020060043785A KR 20060043785 A KR20060043785 A KR 20060043785A KR 100624705 B1 KR100624705 B1 KR 100624705B1
- Authority
- KR
- South Korea
- Prior art keywords
- scraping
- user
- screen
- task
- machine
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/60—Software deployment
- G06F8/65—Updates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/455—Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
- G06F9/45504—Abstract machines for programme code execution, e.g. Java virtual machine [JVM], interpreters, emulators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Hardware Design (AREA)
- Computer Security & Cryptography (AREA)
- Information Transfer Between Computers (AREA)
Abstract
Description
Claims (9)
- 스크린 스크래핑 분산처리 시스템에 있어서,스크린 스크래핑이 필요한 조회나 수행을 호출하는 계좌통합 서비스 프로그램을 구비하며 스크래핑을 위한 사용자 정보를 내부 스케줄 알고리즘을 사용하여 각 스크래핑 머신에 사용자 정보와 작업을 할당하는 사용자 PC; 및상기 사용자 PC와 각 기관에 연결된 인터넷망 사이에 설치되며, 내부에 구비된 복수 개의 스크린 스크래핑 가상 머신을 통해 스크린 스크래핑을 수행하는 복수 개의 스크래핑 머신;을 포함하는 스크린 스크래핑 분산처리 시스템.
- 제 1 항에 있어서, 상기 사용자 PC는:잔액 거래내역 조회나 계좌간 이체를 포함하며 스크린 스크래핑이 필요한 조회나 수행을 호출하는 업무용 프로그램;사용자 PC와 스크래핑 머신의 프로그램이나 라이브러리, 인증서를 갱신하고 동기화하기 위한 전처리 작업이나 파일 송수신을 담당하는 업 데이터부;상기 업무용 프로그램에서 전달받은 스크래핑을 위한 사용자 정보를 내부 스케줄 알고리즘을 사용하여 각 스크래핑 머신에 사용자 정보와 작업을 할당하는 작업 할당 스케줄러;상기 스크래핑 머신에 설치된 인증서와 상기 사용자 PC에 설치된 인증서가 동일한지를 검사하여 사용자 PC를 기준으로 업 데이트하여 동기화 작업을 수행하는 인증서 분배 기능부; 및복수 개의 스크래핑 머신과 그 내부의 스크래핑 가상 머신의 전원의 온(ON)/오프(OFF) 상태와 상기 스크래핑 머신과 그 내부의 스크래핑 가상 머신에 설치된 운영체계의 버전 정보, 현재 사용자의 입력을 기다리는지의 여부와 CPU, 메인 메모리, USB 호스트 컨트롤러, 하드 디스크 드라이브, 네트워크 인터페이스 카드의 점유율, 남는 공간, 사용 상태, 네트워크 점유 상태를 조회하는 스크래핑 머신 관리부;를 포함하는 것을 특징으로 하는 스크린 스크래핑 분산처리 시스템.
- 제 2 항에 있어서, 상기 복수 개의 스크래핑 머신은:상기 사용자 PC의 작업 할당 스케줄러에서 요청이 있을 경우 상기 스크래핑 머신과 상기 작업 할당 스케줄러가 서로 인증된 프로그램인가를 확인하는 인증 관리부;상기 작업 할당 스케줄러에서 전송된 스크래핑을 위한 사용자 정보를 스크래핑 엔진부에 전송하고 그 결과를 상기 작업 할당 스케줄러에 전송하는 스크래핑 작업 관리부;상기 스크래핑 작업 관리부를 최신 버전으로 업 데이트하거나 상기 스크래핑 작업 관리부가 비정상적인 수행을 하거나 오류로 인한 문제 발생시 프로세스를 중지시키고 상기 스크래핑 작업 관리부를 재실행하는 스크래핑 작업 모니터;상기 스크래핑 작업 관리부와 스크래핑 작업모니터를 사용함에 있어 서비스에 오작동, 수행 시간, 수행 작업의 간략한 내용, 최적화용 정보, 스크래핑 작업의 권한 정보를 저장하고 관리하는 감사용 자료 관리부; 및상기 인증 관리부, 상기 스크래핑 작업 관리부, 스크래핑 작업 모니터, 스크래핑 환경 관리부, 감사용 자료 관리부의 로그를 API호출이나 OLE 프로토콜을 사용하여 저장하는 DB 파일부;를 각각 포함하는 것을 특징으로 하는 스크린 스크래핑 분산처리 시스템.
- 제 3 항에 있어서, 상기 스크래핑 작업 관리부는:상기 작업 할당 스케줄러에서 전송된 스크래핑을 위한 사용자 정보를 API(Application Program Interface) 호출이나 OLE(Object Linking and Embedding) 프로토콜을 사용하여 상기 스크래핑 엔진부에 전송하고, 그 결과를 상기 작업 할당 스케줄러에 소켓이나 SSL(Secure Sockets Layer) 통신으로 전송하는 것을 특징으로 하는 스크린 스크래핑 분산처리 시스템.
- 제 1 항에 있어서,상기 계좌 통합 서비스 프로그램과 복수 개의 스크래핑 머신 사이의 구간에서는 공개키기반구조(PKI)의 시스템 인증으로 상기 계좌 통합 서비스 프로그램과 스크래핑 머신을 인증하고 사용자 정보 및 결과는 SSL(Secure Sockets Layer)로 통신을 하는 것을 특징으로 하는 스크린 스크래핑 분산처리 시스템.
- 제 1 항 내지 제 5 항 중 어느 한 항에 기재된 스크린 스크래핑 분산처리 시 스템의 스크린 스크래핑 분산처리 방법에 있어서,(a)상기 작업 할당 스케줄러로부터 스크래핑에 필요한 정보를 받고 스크래핑 머신 정보 읽기를 수행하는 단계;(b)상기 스크래핑 작업 모니터의 버전과 상기 스크래핑 작업 관리부의 버전 및 상기 스크래핑 머신 내의 인증서 버전을 순차적으로 확인 및 동기화하는 단계;(c)상기 스크래핑 작업의 스케줄 종류를 입력하여 작업을 할당하는 단계;(d)상기 단계 후 사용자 대행시 필요한 정보를 수신한 다음 스크랩 모듈의 통신 방식을 선택하는 단계;(e)상기 선택한 스크랩 모듈의 통신 방식에 따라 각각의 인증 페이지와 목적 페이지에 필요한 정보를 전송하거나 입력하는 단계;(f)상기 단계 후 정보 취득 및 작업을 수행하는 단계;(g)상기 단계 후 인증 정보와 보안 모듈을 순차적으로 해지하는 단계; 및(h)상기 단계 후 남은 스크래핑 작업이 없으면 스크래핑 결과를 취합하거나 반환한 후 프로그램을 종료하고, 남은 스크래핑 작업이 있으면 상기 (c)단계로 돌아가는 단계;를 포함하는 스크린 스크래핑 분산처리 방법.
- 제 6 항에 있어서, 상기 (c)단계에서의 스크래핑 작업의 스케줄 종류는,사용자 임의 배정 방식, 균등 분배 방식, 실시간 작업 분배 방식을 포함하는 것을 특징으로 하는 스크린 스크래핑 분산처리 방법.
- 제 6 항에 있어서, 상기 (e)단계에서 스크랩 모듈의 통신 방식은:소켓 통신 방식과 웹 브라우저 통신 방식을 포함하는 것을 특징으로 하는 스크린 스크래핑 분산처리 방법.
- 제 6 항에 있어서, 상기 스크린 스크래핑 분산처리 방법은:상기 스크린 스크래핑을 할 때, 상기 스크래핑 머신과 그 내부에 구현된 복수 개의 스크린 스크래핑 가상 머신을 통해 스크린 스크래핑을 수행하는 것을 특징으로 하는 스크린 스크래핑 분산처리 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060043785A KR100624705B1 (ko) | 2006-05-16 | 2006-05-16 | 스크래핑 머신을 이용한 스크린 스크래핑 분산처리 방법 및그 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060043785A KR100624705B1 (ko) | 2006-05-16 | 2006-05-16 | 스크래핑 머신을 이용한 스크린 스크래핑 분산처리 방법 및그 시스템 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR100624705B1 true KR100624705B1 (ko) | 2006-09-15 |
Family
ID=37631620
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020060043785A KR100624705B1 (ko) | 2006-05-16 | 2006-05-16 | 스크래핑 머신을 이용한 스크린 스크래핑 분산처리 방법 및그 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100624705B1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101815235B1 (ko) * | 2015-12-30 | 2018-01-08 | 주식회사쿠콘 | 데이터 스크래핑 시스템, 방법 및 컴퓨터 프로그램 |
KR20200022289A (ko) * | 2018-08-22 | 2020-03-03 | 주식회사 핑거 | 웹 브라우저 기반 스크래핑 시스템 및 방법 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030233333A1 (en) | 2002-06-14 | 2003-12-18 | Lee Dae Hyung | Remittance intermediating service system and method of providing the same |
-
2006
- 2006-05-16 KR KR1020060043785A patent/KR100624705B1/ko active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030233333A1 (en) | 2002-06-14 | 2003-12-18 | Lee Dae Hyung | Remittance intermediating service system and method of providing the same |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101815235B1 (ko) * | 2015-12-30 | 2018-01-08 | 주식회사쿠콘 | 데이터 스크래핑 시스템, 방법 및 컴퓨터 프로그램 |
KR20200022289A (ko) * | 2018-08-22 | 2020-03-03 | 주식회사 핑거 | 웹 브라우저 기반 스크래핑 시스템 및 방법 |
KR102179792B1 (ko) | 2018-08-22 | 2020-11-17 | 주식회사 핑거 | 웹 브라우저 기반 스크래핑 시스템 및 방법 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8275827B2 (en) | Software-based network attached storage services hosted on massively distributed parallel computing networks | |
KR101815235B1 (ko) | 데이터 스크래핑 시스템, 방법 및 컴퓨터 프로그램 | |
US9684505B2 (en) | Development environment system, development environment apparatus, development environment providing method, and program | |
KR101982085B1 (ko) | 스크립트 엔진을 이용한 데이터 스크래핑 시스템, 방법 및 컴퓨터 프로그램 | |
JP3415456B2 (ja) | ネットワークシステム及びコマンド使用権限制御方法ならびに制御プログラムを格納した記憶媒体 | |
US7039670B2 (en) | Massively distributed processing system with modular client agent and associated method | |
US8959222B2 (en) | Load balancing system for workload groups | |
US20090138551A1 (en) | Method of Managing Workloads and Associated Distributed Processing System | |
JP3892002B2 (ja) | リソース割り当て方法及びプログラム | |
CN103973770A (zh) | 信息处理系统 | |
KR20080090248A (ko) | 관리 소프트웨어 구현을 위한 인증 방법 | |
CN114168307A (zh) | 创建实例的方法、设备以及系统 | |
KR100624705B1 (ko) | 스크래핑 머신을 이용한 스크린 스크래핑 분산처리 방법 및그 시스템 | |
US7953622B2 (en) | Implementing meeting moderator failover and failback | |
JP2019192190A (ja) | 予めスクレイプしたビッグデータを用いたクラウドスクレイピングシステム及び方法と、そのためのコンピュータプログラム | |
JP7421271B2 (ja) | 企業間情報連携システムおよび企業間情報連携方法 | |
CN111638976A (zh) | 基于共享内存的数据传输方法及系统 | |
JP2007299328A (ja) | 計算処理方法および計算処理システム | |
US8849974B2 (en) | Social network based information discovery about network data processing systems | |
US9137227B2 (en) | Matching entitlement information for multiple sources | |
US11354714B1 (en) | Systems and methods for dynamic interface generation for commerce platform onboarding | |
JP2022088326A (ja) | ブロックチェーン・ネットワークにおけるワールドステート・データベースを選択的に更新するための方法、システム、およびコンピュータ・プログラム | |
JP2007172018A (ja) | データ保管方法およびデータ保管システム | |
JP7222792B2 (ja) | 情報処理システム、情報処理装置、情報処理装置の制御方法及びプログラム | |
KR100694536B1 (ko) | 씨알에스 에이전트 시스템 및 통신모듈을 이용한 실시간예약시스템 및 이 시스템을 이용한 실시간 예약방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
A302 | Request for accelerated examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130603 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20140519 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20150611 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20160907 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20180731 Year of fee payment: 13 |
|
FPAY | Annual fee payment |
Payment date: 20190731 Year of fee payment: 14 |