KR20180122017A - 실시간 데이터플로우 프로그래밍을 위한 효율적인 상태 머신 - Google Patents

실시간 데이터플로우 프로그래밍을 위한 효율적인 상태 머신 Download PDF

Info

Publication number
KR20180122017A
KR20180122017A KR1020187030471A KR20187030471A KR20180122017A KR 20180122017 A KR20180122017 A KR 20180122017A KR 1020187030471 A KR1020187030471 A KR 1020187030471A KR 20187030471 A KR20187030471 A KR 20187030471A KR 20180122017 A KR20180122017 A KR 20180122017A
Authority
KR
South Korea
Prior art keywords
state
token
input
data
pattern
Prior art date
Application number
KR1020187030471A
Other languages
English (en)
Other versions
KR102128571B1 (ko
Inventor
제이슨 루카스
압히섹 샤르마
Original Assignee
포그혼 시스템스 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 포그혼 시스템스 인코포레이티드 filed Critical 포그혼 시스템스 인코포레이티드
Publication of KR20180122017A publication Critical patent/KR20180122017A/ko
Application granted granted Critical
Publication of KR102128571B1 publication Critical patent/KR102128571B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/448Execution paradigms, e.g. implementations of programming paradigms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/35Creation or generation of source code model driven
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3664Environments for testing or debugging software
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • G06F17/30867
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/31Programming languages or programming paradigms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/34Graphical or visual programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/448Execution paradigms, e.g. implementations of programming paradigms
    • G06F9/4498Finite state machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer And Data Communications (AREA)
  • Debugging And Monitoring (AREA)
  • Stored Programmes (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Testing Or Calibration Of Command Recording Devices (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Devices For Executing Special Programs (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

효율적인 상태 머신 기반 패턴 매칭 기술은 입력큐의 토큰을 처리하고, 역추적없이, 한 개 이상의 기설정된 입력패턴을 매칭시키는 토큰의 시퀀스에서 패턴을 식별한다. 토큰은 데이터를 포함하거나 포함하지 않을 수 있으며, 시간 구성요소를 포함할 수 있다. 토큰은 물리적 성질을 디지털 양으로 변환하는, 센서에 의해 생성된 데이터 스트림일 수 있다. 패턴 매칭 기술은 한 방향의 입력큐를 처리하고, 이전에 검사된 토큰을 검사하지 않는다. 일 구현에 있어서, 매칭될 특정한 패턴은 상태 머신을 사용하여 지정되며, 상태 머신은 상태 테이블에서 지정되며, 상태 스택을 사용하여 동작한다.

Description

실시간 데이터플로우 프로그래밍을 위한 효율적인 상태 머신
본 발명은 컴퓨팅 분야에 관한 것이며, 더욱 상세하게는 산업기계에 의해 생성된 다량의 데이터를 처리하기 위해 에지 컴퓨팅에서 사용될 수 있는 실시간 데이터플로우 프로그래밍을 위한 효율적인 상태 머신에 관한 것이다.
전통적인 기업 소프트웨어 애플리케이션 호스팅은 데이터 센터 또는 "클라우드" 인프라에 의존하여 규모의 경제 및 시스템 효율을 활용한다. 하지만, 이러한 데이터센터는 기업이 대부분의 비즈니스 운영을 행하는 물리적인 운영 지점 (예를 들면, 공장, 창고, 소매점, 및 기타)으로부터 임의로 떨어져있을 수 있다. 산업용 사물 인터넷 (IIoT) 은 매우 높은 빈도의 이벤트를 추적하는 센서로 물리적인 운영의 기기에 의존하는 장치나 사용사례의 수집을 의미한다.
제조, 석유 및 가수, 광업, 운송, 전력 및 물, 재생 에너지, 헬스케어, 소매, 스마트 빌딩, 스마트 시티, 및 연결된 차량을 포함하는 사물 인터넷 (IoT) 아래에 여러 분야의 산업용 기계가 있다. 클라우드 컴퓨팅의 성공에도 불구하고, 많은 단점이 존재한다. 연결성이 항상 존재하는 것이 아니고, 대역폭이 충분하지 않으며, 대기시간의 변화가 너무 높고, 대역폭이 존재한다고 하더라도 비용이 너무 비싸기 때문에, 모든 데이터를 클라우드 스토리지로 보내는 것이 실용적이지 않다. 연결성, 대역폭, 및 비용이 문제가 되지 않더라도, 실시간 의사결정 및 예측 유지관리가 존재하지 않아 기계에 심각한 손상을 초래할 수 있다.
그러므로, 산업기계에서 생성된 다량의 데이터를 처리하기 위해 개선된 에지 분석을 포함하는 개선된 컴퓨팅 시스템, 아키텍처, 및 기술 및 실시간 데이터플로우 프로그래밍을 위한 더욱 효율적인 상태 머신이 필요하다.
효율적인 상태 머신 기반 패턴 매칭 기술은 입력큐의 토큰을 처리하고, 역추적없이, 한 개 이상의 기설정된 입력패턴을 매칭시키는 토큰의 시퀀스에서 패턴을 식별한다. 토큰은 데이터를 포함하거나 포함하지 않을 수 있으며, 시간 구성요소를 포함할 수 있다. 토큰은 물리적 성질을 디지털 양으로 변환하는, 센서에 의해 생성된 데이터 스트림일 수 있다. 패턴 매칭 기술은 한 방향의 입력큐를 처리하고, 이전에 검사된 토큰을 검사하지 않는다. 일 구현에 있어서, 매칭될 특정한 패턴은 상태 머신을 사용하여 지정되며, 상태 머신은 상태 테이블에서 지정되며, 상태 스택을 사용하여 동작한다.
특정한 일 구현에서, 패턴매칭 기술은 에지컴퓨팅 시스템, 에지에서의 지능화를 가능하게 만드는 방법에서 사용된다. 특징은, 게이트웨이 장치 또는 내장된 시스템상에 호스팅된 소프트웨어 계층에서 센서데이터에 의해 트리거링하는 것을 포함한다. 소프트웨어 계층은 근거리 통신망에 접속된다. 서비스, 애플리케이션, 및 데이터처리 엔진의 리포지토리 (repository) 는 소프트웨어 계층에 의해 접근가능하다. 소프트웨어 계층에 의해 가능한 센서데이터를 표현 언어를 통한 특정 조건의 등장의 구문적 기술(descriptions)과의 매칭. 계속적으로 표현식을 실행함으로서 패턴 이벤트의 자동발견, 게이트 장치를 가로지르는 서비스 및 애플리케이션 및 애플리케이션 및 해석 표현식을 체인연결하는 소프트웨어 계층에 의해 관리되는 네트워크 상의 내장 시스템을 지능적으로 결합, 리소스 유용성에 기초한 애플리케이션 및 분석의 레이아웃의 최적화, 소프트웨어 계층의 건강의 모니터링, 원시 센서 데이터 또는 로컬 타임 계열 데이터베이스 또는 클라우드 스토리지에 센서 데이터 또는 표현식의 결과의 저장을 포함한다. 서비스 및 구성요소는 컨테이너로 운반되어 임의의 게이트웨이 환경에서의 매끄러운 실행을 보증한다.
에지 인텔리전스는 사물인터넷 (IoT) 데이터의 소스에서 가능하다. 시스템은 실시간 에지 분석 및 애플리케이션에 대한 IoT 장치 젠서 데이터로의 풍부한 액세스 (스트림 또는 배치모드, 또는 둘다) 를 제공한다. 시스템은 낮은 메모리 풋프린트 기계에서 동작하는 고성능 분석엔진을 통해, 해석 함수 및 식을 실행하는 고도로 효율적이고 표현적인 컴퓨터 언어를 포함한다. 시스템은 클라우드로 집계 데이터를 게시하여, 추가의 머신 러닝을 가능하게 한다. 시스템은 에지 앱을 개발하기 위한 소프트웨어 개발 키트를 포함한다. 클라우드 기반 매니지먼트 콘솔은 이제 전개, 구성, 응용, 및 해석표현의 관리를 가능하게 한다.
에지 인프라 및 플랫폼의 특정한 구현은 FogHorn Systems, Inc. 포그혼 (FogHorn) 에 의해 행해진다. FogHorn 웹사이트 www.foghorn-systems.com, 출판물 (백서, 사용자 가이드, 튜토리얼, 비디오, 기타를 포함) 및 FogHorn 기술에 관한 다른 출판물, 및 제품이 참조로서 포함된다.
FogHorn 은 산업용 및 상업용 사물 인터넷(IoT) 데이터에 대한 에지 지능화를 가능하게 하기 위한 플랫폼을 제공한다. 수십억의 산업용 및 상업용 사물 인터넷(IoT)장치에 의해 생성된 데이터의 양은 전체 인터넷을 제압할 수 있을 만큼 충분히 거대하다. FogHorn 플랫폼은 그것이 유래된-네트워크의 에지에서 IoT 데이터를 처리하고, 분석하며, 반응한다. FogHorn의 "intelligent edge" 소프트웨어 플랫폼은 전례없는 수준의 자동화, 운영효율, 비용절감 등을 가능하게 한다.
산업용 사물인터넷(IIoT)은 센서, 기계, 및 컴퓨터 등과 같은 상호접속된 산업용 및 상업용 장치로 이루어진다. IIoT의 목표는 더 큰 장치제어, 데이터 매니지먼트, 기계 자동화, 및 분산된 기업에서의 동작효율을 더 크게하는 것이다. 회사들은 에지에서, 포크연산을 적용하여 실시간 분석 및 자동화된 반응을 사용하여, 개발된 적이 없는 IIoT 기회를 포착할 수 있지만, 도한, 시스템 폭 매니지먼트 및 최적화를 위한 클라우드 연산을 저울질하고 있다. 만약 추가 컴퓨팅 리소스를 추가하는 것이 가능하지 않다면, FogHorn 에지 컴퓨팅 플랫폼은 또한 기존의 프로그램가능한 논리 콘트롤러 (PLCs)(예를 들면, 브라운필드(brownfield) 기회)에서 실행하도록 디자인되었다. 브라운필드는 설립된 시스템을 차지하는 동안, 정보기술(IT) 문제 분야를 해결하기 위한 새로운 시스템의 구현을 말한다. 새로운 소프트웨어 아키텍처는 기존의 구동중인 소프트웨어를 고려한다.
에지 인텔리젼트 플랫폼은 IIoT 장치가 상주하는 에지에 가까운 데이터 처리 및 분석을 늘이는 포그 연산 개념에 의존하는 소프트웨이 기반 솔루션이다. 모든 데이터를 멀리 떨어진 중앙집중형 클라우드에 보내는 것보다는 에지장치와 아주 가깝게 유지하는 것이 최대성능, 더 빠른 반응시간, 및 더효율적인 매인터넌스 및 동작정책을 가능하게 한다. 그것은 또한 전체적인 밴드폭 요구조건 및 넓은 분산 네트워크를 관리하는 비용을 현저하게 감소시킴다.
에지에서의 IIoT 동작에 촛점을 맞추는 것은 모든 밴드폭 요구조건을 감소시키며, 시간에 민감한 조건에 반응하여 즉시 자동화가 가능하게 된다. 산업분야에서, 10억개의 새로운 IIoT 장치를 총괄적으로 추가하고, 이러한 장치는 매일 많은 페타바이트의 데이터를 생성한다. 이러한 모든 데이터를 클라우드에 보내는 것은 엄청난 비용이 들뿐 아니라, 더 큰 보안상의 위험을 야기한다. 에지에서의 동작은 더 빠른 동작시간, 줄어든 위험, 및 전체적으로 더 낮은 비용을 확보해준다.
2015년 8월27일에 출원된 미국특허출원 제62/210981호 및 2016년 8월29일에 출원된 제15/250720호는 참조로서 포함되며 에지컴퓨팅 환경 및 플랫폼을 기재한다. 2017년 3월23일에 출원된 미국특허출원 제15/467,313호는 참조로서 포함되며 실시간 데이터플로우 프로그래밍에서 패턴구동되는 반응의 구성을 기재한다. 2017년 3월23일에 출원된 미국특허출원 제15/467,318호는 참조로서 포함되며 실시간 데이터플로우 프로그래밍 언어를 위한 도구 및 방법을 기재한다.
일 구현에 있어서, 방법은 센서 (예를 들면, 물리적인 양을 모니터링하고, 모니터링된 물리적인 양을 디지털 형태의 데이터스트림으로 변환하는 하드웨어 장치)로부터 데이터 스트림을 수신하는 단계, 각 토큰이 데이터가 수신된 때의 시간 스탬프와 함께 저장된 데이터 스트림의 데이터 (또는 데이터가 없음) 를 포함하는 입력큐 (예를 들면, FIFO 메모리)에 데이터 스트림을 저장하는 단계, 한 방향에서 입력큐를 통해 토큰을 독출함으로서 한 개 이상의 기설정된 패턴을 일치시키는 데이터 스트림에서의 패턴을 식별하거나 이전에 독출한 임의의 토큰은 다시 독출하지 않는 단계; 및 데이터스트림에서 기설정된 패턴을 식별시에, 기설정된 패턴이 식별되는 출력큐에서 양의 표시를 출력하는 단계를 포함한다.
또 다른 구현에 있어서, 시스템은 FIFO 메모리로서 조직된 컴퓨터 메모리에서의 메모리 위치를 포함하며, 각 토큰이 데이터를 포함하는 (또는 데이터를 포함하지 않고) 처리될 토큰 및 토큰이 입력큐에 들어가는 시간 스탬프를 저장하는 입력큐, 역추적 없이 입력큐에서 토큰을 처리하며, 한 개 이상의 기설정된 입력 패턴과 일치하는 토큰의 시퀀스에서의 패턴을 식별하며, 일치되는 입력 패턴을 식별시에, 출력되는 이벤트 출력을 생성하는 드라이버 구성요소, FIFO 메모리로서 조직된 컴퓨터 메모리에서의 메모리 위치를 포함하며, 드라이버 구성요소에 의해 생성된 아웃고잉 이벤트의 시퀀스를 저장하는 출력큐, 상태 테이블 포맷으로 소정입력패턴을 저장하는 상태 테이블 구성요소, 및 번역상태번호, 기호, 데드라인, 또는 임의의 조합을 포함하는 스택 프레임을 갖는LIFO 메모리로서 조직된 컴퓨터 메모리에서의 제3메모리 위치를 포함하는 상태 스택을 포함한다.
또 다른 구현에 있어서, 방법은 FIFO 메모리로서 조직된 컴퓨터 메모리에서의 제1메모리 위치를 포함하는 입력큐로서, 각 토큰이 데이터를 포함하는 (또는 데이터를 포함하지 않고) 처리될 토큰 및 토큰이 입력큐에 들어가는 시간 스탬프를 저장하는 입력큐를 제공하는 단계, 역추적 없이 입력큐에서 토큰을 처리하며, 한 개 이상의 기설정된 입력 패턴과 일치하는 토큰의 시퀀스에서의 패턴을 식별하며, 일치되는 입력 패턴을 식별시에, 출력되는 이벤트 출력을 생성하는 드라이버 구성요소를 제공하는 단계, FIFO 메모리로서 조직된 컴퓨터 메모리에서의 제2메모리 위치를 포함하며, 드라이버 구성요소에 의해 생성된 아웃고잉 이벤트의 시퀀스를 저장하는 출력큐를 제공하는 단계, 상태 테이블 포맷으로 소정입력패턴을 저장하는 상태 테이블 구성요소를 제공하는 단계, 및 스택 프레임을 저장하는 상태 스택 구성요소 (예를 들면, LIFO 메모리)를 제공하는 단계를 포함한다.
본 발명의 다른 목적, 특징, 및 장점은 이하의 상세한 설명 및 첨부도면을 참조하면 더욱 명백해지며 도면 전체에 걸쳐서 유사한 참조번호는 동일한 특징을 나타낸다.
도1은 클라이언트 서버 시스템 및 네트워크의 블록도를 도시한다.
도2는 클라이언트 또는 서버의 더 상세한 도면을 도시한다.
도3은 컴퓨터 시스템의 블록도를 도시한다.
도4는 센서 스트림과 클라우드 사이의 에지 컴퓨팅 플랫폼의 블록도이다.
도5는 에지 분석을 포함하는 에지 컴퓨팅 플랫폼의 더 상세한 블록도를 도시한다.
도6은 에지 인프라와 클라우드 인프라 사이의 동작흐름을 도시한다.
도7은 결정성 유한 오토마톤 (DFA) 및 상태 감소된 기계로 변환된 강화된 비결정성 유한 오토마톤 (NFA) 을 도시한다.
도8은 토큰 알파의 수신시의 상태 A로부터 B로의 전이를 도시한다.
도9는 추가 상태 전이인 상태 X를 거친 상태 A로부터 상태B로의 전이를 도시한다.
도10은 구문해석에 의해 형성된 추상구문트리의 일 예를 도시한다.
도11은 교대에 대한 서브그래프를 도시한다.
도12는 결합에 대한 서브그래프를 도시한다.
도13은 구조를 갖는 클로저(closure)를 도시한다.
도14는 시간상 전방최우측 또는 TFR(1) (timed forward right-most) 패턴 매칭이라 일컬어지는 기술을 사용하는 패턴 매처의 구성요소를 도시한다.
도15A 및 15B는 "pet" 의 일 예인 상태 머신도를 도시한다.
도1은 본 발명의 일실시예를 구체화하는 분산 컴퓨터 네트워크 (100) 의 개략 블록도이다. 컴퓨터 네트워크(100)는 복수의 통신 링크 (128)를 통해 통신 네트워크(124)와 연결된 다수의 클라이언트 시스템 (113, 116, 110) 및 서버시스템 (122)를 포함한다. 통신 네트워크(124)는 분산 네트워크100의 다양한 구성요소가 서로 통신하고 정보를 교환할 수 있도록 해주는 매커니즘을 제공한다.
통신 네트워크(124) 자체는 서로 연결된 많은 컴퓨터 시스템 및 통신 링크로 이루어질 수 있다. 통신 링크 (128)는 하드웨어 링크, 광 링크, 위성 또는 다른 무선 통신 링크, 파동 전파 링크, 또는 정보의 통신을 위한 다른 임의의 매커니즘일 수 있다. 통신 링크 (128) 는 DSL, 케이블, 이더넷, 또는 다른 하드웨어 링크, 수동 또는 능동 광 링크, 3G, 3.5G, 4G 및 다른 이동성, 위성, 또는 다른 무선 통신 링크, 파동 전파 링크, 또는 정보 통신을 위한 다른 임의의 메커니즘일 수 있다.
다양한 통신 프로토콜이 도1에 도시된 다양한 시스템 사이의 통신을 가능하게 하기 위하여 사용될 수 있다. 이러한 통신 프로토콜은 VLAN, MPLS, TCP/IP, 터널링, HTTP 프로토콜, 무선 응용 통신 프로토콜 (WAP), 벤더 고유의 프로토콜, 맞춤형 프로토콜 등을 포함할 수 있다. 일 실시예에서, 통신 네트워크(124)는 인터넷일 수 있지만, 다른 실시예에서, 통신 네트워크(124)는 근거리 통신망 (LAN), 광역 네트워크 (WAN), 무선 네트워크, 인트라넷, 전용 네트워크, 공용 네트워크, 교환망 및 이들의 결합을 포함하는 임의의 적절한 통신 네트워크 일 수 있다.
도1의 분산 컴퓨터 네트워크(100) 은 본 발명을 구체화하는 일실시예의 일 예일 뿐이며 청구항에서 기재된 본 발명의 범위를 제한하는 것은 아니다. 본 발명이 속하는 기술 분야의 당업자는 다른 변경, 수정, 및 대안을 인정할 것이다. 예를 들면, 한 개 이상의 서버 시스템(122)이 통신 네트워크(124)에 접속될 수 있다. 다른 예로서, 다수의 클라이언트 시스템(113, 116, 119)이 액세스 프로바이더(미도시) 또는 다른 서버 시스템을 통해 통신 네트워크(124)에 접속될 수 있다.
일반적으로, 클라이언트 시스템(113, 116, 119)은 정보를 제공하는 정보시스템으로부터 정보를 요청한다. 이 때문에, 일반적으로 서버 시스템은 클라이언트 시스템 보다 연산 및 저장 용량이 더 크다. 하지만, 특정한 컴퓨터 시스템은 컴퓨터 시스템이 정보를 요청하는지 또는 제공하는 지에 따라 클라이언트 또는 서버 양자로서 기능할 수 있다. 또한, 본 발명의 태양이 클라이언트 서버 환경을 사용하는 것으로 기재되었지만, 본 발명은 또한 독립형 컴퓨터 시스템으로도 구현될 수 있다는 것은 명백하다.
서버(122)는 클라이언트 시스템(113,116, 119) 으로부터 정보요청을 수신하고, 요청을 만족시키기 위해 필요한 처리를 수행하며, 요청하는 클라이언트 시스템으로 요청에 대응되는 결과를 포워딩하는 역할을 한다. 요청을 만족시키기 위해 필요한 처리는 서버시스템 (122)에 의해 행해질 수 있으며, 그 대신에 통신 네트워크(124)에 접속된 다른 시스템에 위임될 수도 있다.
클라이언트 시스템(113, 116, 119)은 사용자가 서버시스템(122)에 의해 저장된 정보에 접속하고 질의할 수 있도록 한다. 특정한 실시예에서, 클라이언트 시스템은 데스크탑 애플리케이션, 모바일 스마트폰, 또는 테블릿 애플리케이션과 같은 독립형 애플리케이션으로서 동작할 수 있다. 또 다른 실시예에서, 클라이언트 시스템 상에서 실행하는 "웹 브라우저" 애플리케이션은 사용자에게 서버 시스템(122)에 의해 저장된 정보를 선택, 접속, 검색, 또는 질의할 수 있도록 한다. 웹브라우저의 예로는 마이크로소프트의 인터넷 익스플로러 브라우저 프로그램, 모질라의 파이어폭스 브라우저, 구글의 크롬 브라우저, 애플의 사파리 브라우저 등이 있다.
클라이언트 서버 환경에서, 일부 자원 (예를 들면, 파일, 음악, 비디오, 또는 데이터)은 클라이언트 측에 저장되지만, 다른 자원은 서버와 같이 네트워크의 다른 곳에 저장되거나 전달되며 네트워크 (예를 들면, 인터넷) 를 통해 접속가능하다. 그러므로 사용자의 데이터는 네트워크 또는 "클라우드"에 저장될 수 있다. 예를 들면, 사용자는 클라우드 (예를 들면, 서버)에 원격으로 저장된 클라이언트 장치상에서 문서작업을 할 수 있다. 클라이언트 장치 상의 데이터는 클라우드와 동기화 될 수 있다.
도 2는 본 발명의 예시적인 클라이언트 또는 서버 시스템을 도시한다. 일 실시예에서, 사용자는 도2에 도시된 바와 같이 컴퓨터 워크스테이션 시스템을 통해 시스템과 인터페이스한다. 도2는 모니터(203), 스크린(205), 엔클로저(207) (또한, 시스템 유닛, 캐비넷, 또는 케이스라고도 함), 키보드, 또는 다른 인체 입력장치(209), 및 마우스 또는 다른 포인팅 장치(211) 을 포함하는 컴퓨터 시스템(201)을 도시한다. 마우스(211)는 마우스 버튼(213)과 같은 한 개 이상의 버튼을 가질 수 있다.
본 발명이 특정한 폼 팩터 (예를 들면, 데스크 탑 컴퓨터의 폼 팩터) 를 갖는 임의의 컴퓨팅장치로 제한되는 것이 아니며, 다양한 폼 팩터의 모든 유형의 컴퓨팅 장치를 포함할 수 있다는 것을 이해해야 한다. 사용자는 데이터를 수신 또는 전송할 수 있는 스마트폰, 개인용 컴퓨터, 랩탑, 전자 태블릿 장치, GPS 수신기, 휴대용 미디어 플레이어, 개인용 정보 단말 (PDA), 다른 네트워크 접속 장치, 및 다른 처리 장치를 포함하는 임의의 컴퓨팅 장치와 인터페이스 할 수 있다.
예를 들면, 특별할 구현으로서, 클라이언트 장치는 애플 아이폰 (예를 들면, 애플 아이폰6), 애플 아이패드(예를 들면, 애플 아이패드 또는 애플 아이패드 미니), 애플 아이팟 (예를 들면, 애플 아이팟 터치), 삼성 갤럭시 제품 (예를 들면, 갤럭시 S 시리즈 제품 또는 갤럭시 노트 시리즈 제품), 구글 넥서스 장치 (예를 들면, 구글 넥서스 6, 구글 넥서스 7, 또는 구글 넥서스 9), 및 마이크로소프트 장치 (예를 들면, 마이크로소프트 서피스 태블릿) 과 같은 스마트 폰, 또는 테블릿 장치일 수 있다. 일반적으로, 스마트폰은 터치스크린 디스플레이를 통해 접속가능한 전화부분 (및 관련된 라디오) 및 컴퓨터 부분을 포함한다.
전화부분 (예를 들면, 연락처 및 전화번호) 및 컴퓨터 부분 (예를 들면, 브라우저, 사진, 게임, 비디오, 및 음악을 포함하는 애플리케이션 프로그램) 의 데이터를 저장하기 위한 비휘발성 메모리가 제공된다. 일반적으로, 스마트폰은 사진 및 비디오를 촬영하기 위한 카메라 (전방을 향하는 카메라, 후면 카메라, 또는 양자 모두)를 포함한다. 예를 들면, 스마트폰 또는 테블릿은 한 개 이상의 다른 장치로 스트리밍 될 수 있는 라이브 비디오를 촬영하기 위해 사용될 수 있다.
엔클로저(207)는 프로세서, 메모리, 대용장 저장장치(217) 등과 같은 친숙한 컴퓨터 구성요소 (이들 중 일부는 도시하지 않음) 를 수용한다. 대용량 저장장치(217)는 대용량 디스크 드라이브, 플로피 디스크, 자기 드시크, 광디스크, 광자기 디스크, 고정형 디스크, 하드 디스크, CD-ROM, 기록가능 CD, DVD, 기록가능 DVD (예를 들면, DVD-R, DVD+R, DVD-RW, DVD+RW, HD-DVD, 또는 블루레이 디스크), 플래시 및 기타 비휘발성 고체 저장장치 (예를 들면, USB 플래시 드라이브 또는 고체상태 드라이브 (SSD), 배터리 백업된 휘발성 메모리, 테이프 저장장치, 판독장치, 및 다른 유사한 매체, 및 이들의 조합을 포함할 수 있다.
본 발명의 컴퓨터로 구현되거나 컴퓨터로 실행가능한 버전 또는 컴퓨터 프로그램 제품은 컴퓨터로 판독가능한 매체에 저장되거나 관련되어 구현될 수 있다. 컴퓨터로 판독가능한 매체는 실행을 위한 한 개 이상의 프로세서에 명령을 제공하는데 참여하는 임의의 매체를포함할 수 있다. 그러한 매체는 비휘발성, 휘발성, 및 전송형 매체를 포함하지만, 이에 한정되지 않는 많은 형태를 취할 수 있다. 예를 들면, 비휘발성 매체는 플래시 메모리, 광 디스크 또는 자기 디스크를 포함한다. 휘발성 매체는 캐시 메모리 또는 RAM 과 같은 정적 또는 동적 메모리를 포함한다. 전송 매체는 동축 케이블, 구리선, 광섬유선, 및 버스 내에 배열된 배선을 포함한다. 전송매체는 라디오파 또는 적외선 데이터 통신 동안 생성된 것과 같은, 전자기, 무선 주파수, 음향 또는 광파의 형태를 취할 수 있다.
예를 들면, 본 발명의 소프트웨어의 이진의 기계로 실행가능한 버전이 RAM 또는 캐시 메모리, 또는 대용량 저장장치(217)에 저장되거나 상주할 수 있다. 본 발명의 소프트웨어의 소스 코드는 또한 대용량 장치(217) (예를 들면, 하드디스크, 자기 디스크, 테이프, 또는 CD-ROM) 상에 저장되거나 상주할 수 있다. 또 다른 예로서, 본 발명의 코드는 유선, 라디오파, 또는 인터넷과 같은 네트워크를 통해 전송될 수 있다.
도3은 본 발명의 소프트웨어를 실행하기 위해 사용되는 컴퓨터시스템(201)의 블록도를 도시한다. 도2에 도시한 바와 같이, 컴퓨터 시스템(201)은 모니터(203), 키보드(209), 및 대용량 저장장치(217)을 포함한다. 컴퓨터 시스템(201)은 또한 중앙처리장치(302), 시스템 메모리(304), 입/출력(I/O)제어기(306), 디스플레이 어댑터(308), 직렬 또는 범용 시리얼 버스(USB) 포트(312), 네트워크 인터페이스(318), 및 스피커(320)와 같은 서브 시스템을 더 포함한다. 본 발명은 또한 추가의 또는 더 적은 수의 서브 시스템을 갖는 컴퓨터 시스템을 사용할 수 있다. 예를 들면, 컴퓨터 시스템은 한 개 이상의 프로세서(302) (예를 들면, 멀티프로세서 시스템)를 포함하거나 시스템은 캐시메모리를 포함할 수 있다.
322와 같은 화살표는 컴퓨터 시스템(201)의 시스템 버스 아키텍처를 나타낸다. 하지만, 이러한 화살표는 서브 시스템을 연결하도록 기능하는 임의의 상호접속 방식의 예시이다. 예를 들면, 스피커는 포트를 통해 다른 서브 시스템에 접속될 수 있으며, 중앙 프로세서(320)에 내부적으로 직접 접속될 수 있다. 프로세서는 정보를 병렬로 처리할 수 있는 복수개의 프로세서 또는 한 개의 멀티코어 프로세서를 포함할 수 있다. 도2에 도시된 컴퓨터 시스템(201)은 본 발명과 함께 사용하기에 적합한 컴퓨터 시스템의 일 예에 불과하다. 본 발명에서 사용하기에 적합한 서브시스템의 다른 구성은 당업자에게 이미 명백할 것이다.
컴퓨터 소프트웨어 제품은 C, C++, C#, 파스칼, 포트란, Perl, Matlab (from MathWorks, www.mathworks.com), SAS, SPSS, 자바스크립트, AJAX, 자바, Python, 얼랑(Erlang), and Ruby on Rails 와 같은 다양한 적절한 프로그래밍 언어 중 일부로 기록될 수 있다. 컴퓨터 소프트웨어 제품은 데이터 입력 및 데이터 디스플레이 모듈을 갖는 독립적인 애플리케이션일 수 있다. 혹은, 컴퓨터 소프트웨어 제품은 분산 개체들로서 예시될 수 있는 클래스일 수 있다. 컴퓨터 소프트웨어 제품은 또한 Java Beans (Oracle 사의 제품) 또는 Enterprise Java Beans (Oracle 사의 EJB) 와 같은 컴포넌트 소프트웨어 일 수 있다.
본 시스템용 오퍼레이팅 시스템은 Microsoft Windows® 패밀리 (예를 들면, Windows 95, 98, Me, Windows NT, Windows 2000, Windows XP, Windows XP x64 Edition, Windows Vista, Windows 7, Windows 8, Windows 10, Windows CE, Windows Mobile, Windows RT), Symbian OS, Tizen, Linux, HP-UX, UNIX, Sun OS, Solaris, Mac OS X, Apple iOS, Android, Alpha OS, AIX, IRIX32, or IRIX64 중 한 개 일 수 있다. 다른 오퍼레이팅 시스템도 사용될 수 있다. Microsoft Windows는 마이크로소프트 사의 상표이다.
또한, 컴퓨터는 네트워크에 접속될 수 있으며, 이 네트워크를 사용하여 다른 컴퓨터와 인터페이스 할 수 있다. 이 네트워크는 인트라넷 또는 인터넷 일 수 있다. 네트워크는 (예를 들면, 구리를 사용하는) 유선 네트워크, 전화 네트워크, 패킷 네트워크, (예를 들면, 광섬유를 사용하는) 광 네트워크, 또는 무선 네트워크 또는 이들의 임의의 조합일 수 있다. 예를 들면, 데이터 및 다른 정보는 컴퓨터와 Wi-Fi (단지 몇가지 예를 들면, IEEE 표준 802.11, 802.11a, 802.11b, 802.11e, 802.11g, 802.11i, 802.11n, 802.11ac, 및 802.11ad), 근거리 무선 통신 (NFC), 무선 주파수 인식 (RFID), 모바일 또는 셀룰러 무선 (예를 들면, 2G, 3G, 4G, 3GPP LTE, WiMAX, LTE, LTE Advanced, Flash-OFDM, HIPERMAN, iBurst, EDGE Evolution, UMTS, UMTS-TDD, 1xRDD, 및 EV-DO) 과 같은 프로토콜을 사용하는 무선 네트워크를 사용하는 본 발명의 시스템의 구성요소 (또는 단계) 사이를 통과할 수 있다. 예를 들면, 컴퓨터로부터의 신호는 적어도 부분적으로, 무선으로 구성요소 또는 다른 컴퓨터로 전송될 수 있다.
일 실시예에서, 컴퓨터 워크스테이션 시스템상에서 실행시키는 웹브라우저로, 사용자는 인터넷과 같은 네트워크를 통해 월드와이드웹 (www) 상에서 시스템에 접속한다. 웹브라우저는 웹 페이지 또는 HTML, XML, 텍스트, PDF, 및 포스트스크립트와 같은 다양한 포맷의 다른 컨텐츠를 다운로드 하기 위해 사용되며, 정보를 시스템의 다른 부분으로 업로드하기 위해 사용될 수 있다. 웹브라우저는 URI (uniform resource identifiers) 를 사용하여 웹 상의 리소스와 웹 상의 파일을 전송하는 HTTP (hyper transfer protocol) 을 식별할 수 있다.
다른 구현들에서, 사용자는 네이티브 및 넌네이티브 애플리케이션 중 하나 또는 둘 모두를 통해 시스템에 접속한다. 네이티브 애플리케이션은 특정한 컴퓨팅 시스템상에 국부적으로 설치되며, 연산 시스템 또는 컴퓨팅 시스템의 한 개 이상의 하드웨어 장치, 또는 이들의 조합에 특유하다. 이러한 애플리케이션 (때때로 "앱" 이라고 부르기도 함) 은 직접 인터넷 업그레이드 패칭 매커니즘 또는 애플리케이션 스토어 (예를 들면, 애플 아이듄스 및 앱 스토어, 구글 플레이 스토어, 윈도우즈 폰 스토어, 및 블랙베리 앱 월드 스토어)를 통해 (예를 들면, 주기적으로) 업데이트 될 수 있다.
시스템은 플랫폼 독립적인 넌네이티브 애플리케이션에서 구동된다. 예를 들면, 클라이언트는 한 개 또는 복수개의 서버와의 네트워크 접속을 사용하여 한 개 이상의 서버로부터 웹 애플리케이션을 통해 시스템에 접속할 수 있고, 웹 브라우저에서 웹 애플리케이션을 로드할 수 있다. 예를 들면, 웹 애플리케이션은 웹 브라우저에 의해 인터넷을 통해 애플리케이션 서버로부터 다운로드 될 수 있다. 넌네이티브 애플리케이션 또한 디스크와 같은 다른 소스로부터 얻을 수 있다.
도4는 일반적으로 센서(409) 및 클라우드(412) 사이인 에지 게이트웨이 또는 등가물 상에서 실행되는 에지 컴퓨팅 플랫폼(406)의 블록도를 도시한다. 에지 컴퓨팅 플랫폼은 산업기계 및 다른 산업용 사물용 인터넷 (IoT) 의 관리 및 최적화에 중요한 에지 인텔리전스를 이끌어낼 수 있다. 에지 게이트웨이의 구성요소는 이하의 것을 포함한다. 인제스천(ingestion, 421), 보강(enrichment, 425), 복합 이벤트 처리(CEP) 엔진(429), 애플리케이션(432), 표현 언어(435)를 통한 분석, 및 전송(438). 클라우드는 에지 프로비저닝 및 오케스트레이션 443 및 클라우드 및 에지 분석 및 앱 이식성 446을 포함 할 수 있다.
상술한 바와 같이, 에지 컴퓨팅 플랫폼의 특정한 구현은 FogHorn 으로부터 구현된다. FogHorn 은 급속히 부상하고 있는 "에지 인텔리전스" 분야의 리더이다. FogHorn 의 획기적인 솔루션은 제어 시스템 및 물리적인 센서에 가까운 고성능 처리, 분석, 및 이종 애플리케이션을 호스팅함으로써, 폐쇄 루프 장치 최적화를 위한 에지 인텔리전스를 가능하게 한다. 이것은 제조, 석유 및 가스, 전력 및 물, 운송, 광업, 재생가능 에너지, 스마스 시티 등의 산업고객을 위해 현장에서의 빅 데이터 및 실시간 처리를 가지고 온다. FogHorn 기술은 클라우드 컴퓨팅, 고성능 에지 게이트웨이, 및 IoT 시스템 통합에 있어서 세계 유수의 산업 인터넷 혁신기업 및 주요 업체에 의해 받아들여지고 있다.
FogHorn 은 스트림 및 배치(batch) 모드 모두에서 에지 앱에 대한 강화된 IoT 장치 및 센서 데이터 접속, 분석기능을 실행하기 위한 매우 효율적이고 표현력있는 DSL, 풋 프린트가 적은 기계상에서 실행될 수 있는 강력한 소형 분석 엔진, 추가적인 기계 학습을 위한 집계된 데이터를 클라우드로 보내기 위한 게시 기능, 에지 앱을 전개하기 위한 SDK (폴리글롯), 구성, 앱, 및 분석 표현의 에지 전개를 관리하기 위한 관리 콘솔을 제공한다.
FogHorn 은 산업용 기계로부터 실시간으로, 현장에서 센서 데이터의 스트리밍 처리를 가능하게 하는 효율적이고 확장성이 뛰어난 분석 플랫폼을 제공한다. FogHorn 소프트웨어 스택은 에지 및 클라우드 상에서 실행되는 서비스의 조합니다.
"에지" 솔루션은 처리되지 않은 데이터를 오프라인 분석을 위해 클라우드 환경에 게시하기 위해 로컬 저장소 리포지토리로의 센서 데이터의 인제스천을 지원할 수 있다. 하지만, 많은 산업 환경 및 장치는 인터넷 연결의 부족으로 인해 이러한 데이터를 사용할 수 없게 만든다. 인터넷 연결이 된다고 하더라도, 생성 된 엄청난 양의 데이터가 사용 가능한 대역폭을 초과하거나 클라우드로 전송하는 데 너무 많은 비용이 발생할 수 있다. 또한, 데이터가 클라우드에 업로드되고, 데이터 센터에서 처리되고, 그 결과가 에지로 전송될 때까지, 어떤 조치를 취하기에는 너무 늦을 수 있다.
FogHorn 솔루션은 분석 엔진이라고도 알려진 고도로 소형화 된 복합 이벤트 처리 (CEP:complex event processing) 엔진과 데이터의 유입되는 센서 스트림의 다수에 대한 규칙을 표현하는 강력하고 표현적인 도메인 특정 언어 (DSL)를 제공함으로써 이 문제를 해결한다. 이들 표현으로부터의 출력이 즉각적으로 사용되어 산업 운영 및 프로세스의 효율과 안전을 실시간으로 개선할 뿐만 아니라 비용이 많이 드는 기계 고장 또는 가동중단을 방지할 수 있다.
FogHorn 플랫폼은 높은 처리량 또는 게이트웨이 환경 뿐만 아니라 낮은 풋프린트 환경에서 실행할 수 있는 능력, 유입되는 스트리밍 센서 데이터에 작용할 수 있는 확장성이 뛰어난 고성능 CEP 엔진, 강화된 데이터 접속을 갖는 에지상의 이종 앱 개발 및 전개, 클라우드와 에지를 통한 애플리케이션의 이동성, 고급 기계 학습 (ML) 및 클라이드 및 에지 간의 모델 전송을 포함한다 발군의 FogHorn 은 다른 데이터 전송 프로토콜 뿐만 아니라 주된 산업용 데이터 인제스천 프로토콜 (예를 들면, OPC-UA, Modbus, MQTT, DDS 및 기타)를 지원한다. 또한, 사용자는 맞춤형 프로토콜 어댑터를 FogHorn 의 데이터 인제스천 계층으로 쉽게 플러그인 할 수 있다.
FogHorn 에지 서비스는 IIoT 장치가 상주하는 네트워크의 에지에서 동작한다. 에지 소프트웨어 스택은 센서 및 산업용 장치로부터 고속 데이터 버스로 데이터를 인제스천 한 다음 스트리밍 데이터에 대한 사용자 정의 분석 표현식을 실행하여 통찰을 얻고 장치를 최적화하는 기능을 수행한다. 이러한 분석 표현식은 FogHorn 의 확장성이 뛰어나고 작은 풋프린트 복합 이벤트 처리 (CEP) 엔진에 의해 실행된다.
FogHorn 에지 서비스는 또한 시간 기반 센서 데이터 쿼리에 대한 로컬 시계열 데이터베이스와 스트림 모드와 배치 모드 양자에서 데이터를 사용할 수 있는 애플리케이션 개발을 위한 다중 언어 SDK를 포함한다. 선택적으로, 이러한 데이터는 또한 고객이 선택한 클라우드 저장 목적지에 게시될 수도 있다.
FogHorn 플랫폼은 또한 클라우드 또는 온프레미스 (on-premises) 환경에서 실행되어 원격으로 에지를 구성 및 관리하는 서비스를 포함한다. FogHorn 의 클라우드 서비스는 분석 표현식을 개발 및 전개하고, 도커(www.docker.com) 라고 알려진 애플리케이션을 사용하여 에지에 애플리케이션을 전개하며, 고객의 ID 접속 관리 및 지속성 솔루션으로 서비스 통합을 관리하기위한 관리 UI 를 포함한다. 플랫폼은 또한 클라우드에서 개발된 기계학습 모델을 에지에서 실행될 수 있는 센서 표현식으로 변환 할 수 있다.
예를 들면, 애플리케이션은 실시간 데이터 모니터링 및 분석, 예측 유지보수 스케줄링, 및 자동화된 흐름의 방향수정을 적용하여 공동화현상의 발생으로 인해 펌프에 비용이 많이 드는 손상이 발생하는 것을 방지한다. 다른 예는, 전력발생을 최대화 하고, 장비수명을 연장하며, 정확한 에너지 예측을 위한 역사적인 분석을 적용하기 위하여 FogHorn 에지 인텔리전스 소프트웨어를 사용하는 풍력에너지 관리 시스템이다.
도5는 에지 컴퓨팅 플랫폼의 보다 상세한 블록도를 도시한다. 이 플랫폼은 데이터 인제스천(512), 데이터 처리(515), 및 데이터 게시(518)의 세 개의 논리적 계층들 또는 섹션들을 갖는다. 데이터 인제스천 구성요소는 센서들 또는 데이터를 생성하는 장치들(523)에 접속되는 에이전트(520)을 포함한다. 에이전트는 각각 프로토콜 서버로부터 한 개 이상의 프로토콜을 통해 센서로부터 데이터를 수집 또는 인제스천한다. 에이전트는 MQTT, OPC UA, Modbus, DDS 와 같이, 프로토콜을 위한 클라이언트들 또는 브로커들일 수 있다. 센서에 의해 제공되고 출력되는 데이터는 일반적으로 이진 데이터 스트림이다. 센서로부터 이들 데이터의 전송 또는 전달은 푸시 또는 풀 방식으로 행해질 수 있다.
푸시는 주어진 트랜젝션을 위한 요청이 송신자(예를 들면, 센서) 에 의해 초기화되는 통신 스타일을 나타낸다. 풀 (또는 get) 은 정보의 전송을 위한 요청이 수신자(예를 들면, 에이전트) 에 의해 초기화되는 통신 스타일을 나타낸다. 또 다른 통신기술은 폴링 (polling) 이며, 수신자나 에이전트가 주기적으로 센서가 보낼 데이터를 가지고 있는지를 문의하거나 체크하는 것을 말한다.
MQTT (이전의 MQ Telemetry Transport)는 TCP/IP 프로토콜의 최상위에서 사용하기 위한 ISO 표준 게시-구독 기반 "라이트웨이트(lightweight)" 메시징 프로토콜이다. 또 다른 프로토콜로는 고급 메시지 큐잉 프로토콜, IETF 제한 애플리케이션 프로토콜, XMPP, 및 WAMP(Web Application Messaging Protocol)가 있다.
OPC UA (OPC Unified Architecture) 는 OPC 재단에 의해 개발된 상호운용성을 위한 산업용 M2M 통신 프로토콜이다. 이것은 OPC (Open Platform Communications) 의 후속버전이다.
모드버스(Modbus)는 원래 프로그래머블 로직 컨트롤러들(PLCs; Programmable Logic Controllers)과 함께 사용하기 위해 1979년에 Modicon(현재 Schneider Electric)에 의해 공개된 직렬 통신 프로토콜이다. 이것은 단순하고 견고하며, 이후 모든 의도들과 목적들을 위해 표준 통신 프로토콜이 되었다. 이것은 현재 산업용 전자장치를 접속하는 수단으로서 보편적으로 사용된다.
데이터 처리(515)는 데이터 인제스천 계층의 에이전트(520)에 연결된 데이터 버스(532)를 포함한다. 데이터 버스는 모든 접속된 구성요소들 간의 데이터 및 제어 메시지를 위한 가장 중요한 백본이다. 구성요소들은 데이터 버스를 통해 흐르는 데이터 및 제어 메시지를 구독한다. 분석엔진(535)은 그러한 중요한 구성요소 중 하나이다. 분석엔진은 표현언어(538)로 발전된 분석표현식에 기초하여 분석데이터의 분석을 수행한다. 데이터 버스에 접속된 다른 구성요소들은 구성서비스(541), 매트릭스 서비스(544), 및 에지 메니저(547)을 포함한다. 또한, 데이터버스는 원시 이진 데이터를 소모가능한 데이터 포맷 (예를 들면, JSON) 으로 디코딩하며 또한 추가적으로 필요하고 유용한 메타데이터로 데코레이팅 (decorating), 함으로서 센서로부터 유입데이터를 보강하는 "디코더 서비스"를 포함한다. 또한, 보강은 데이터 디코딩, 메타 데이터 데코레이션, 데이터 정규화 등을 포함하지만, 이에 한정되는 것을 아니다.
JSON (때때로, JavaScript Object Notation 라고 언급됨) 는 사람이 읽을 수 있는 텍스트를 사용하여 속성 값 페이를 구성하는 데이터 오프젝트를 전송하는 개방형 표준 포맷이다. JSON 은 비동기 브라우저 또는 서버 통신 (AJAJ) 또는 둘다에 사용되는 공통 데이터 포맷이다. JSON 의 대체가능한 예로서 AJAX 에 의해 사용되는 XML 이 있다.
에지 매니저는 클라우드(412)에 접속하며, 특히 클라우드 매니저(552)에 접속한다. 클라우드 매니저는 또한 클라우드에 존재하는 고객 아이덴티티 및 엑세스 관리 (IAM)(555) 및 사용자 인터페이스 콘솔(558)용 프록시에 접속된다. 또한, 클라우드를 통해 접속가능한 앱(561)이 존재한다. 아이덴티티 및 엑세스 관리는 올바른 개인이 적절한 시기와 적절한 이유로 적절한 리소스에 접속할 수 있게 해주는 보안 및 비지니스 규율이다.
데이터 처리(515)내에서 소프트웨어 개발 키트(SDK)(564) 구성요소는 또한 데이터 버스에 접속되어 에지 게이트웨이 상에서 전개될 수 있는 애플리케이션의 생성을 가능하게 한다. 이러한 데이터 개발 키트는 또한 로컬 시계열 데이터베이스에 접속되어 데이터를 인출한다. 애플리케이션은 도커(Docker) 와 같은 컨테이너 기술을 사용하는 것과 같이 컨테이너화 될 수 있다.
도커 컨테이너는 코드, 런타임, 시스템 도구들, 및 시스템 라이브러리들과 같이 서버 상에 설치될 수 있는 어떠한 것을 실행하기위해 필요한 모든 것을 포함하는 완전한 파일 시스템 내로 소프트웨어 조각을 랩업(wrap up) 한다. 이것은 소프트웨어가 그것이 실행되는 환경에 관계없이 동일한 것을 항상 실행할 수 있도록 보장한다.
데이터 퍼블리케이션(518)은 클라우드에서 저장 위치(573)에 접속된 데이터 퍼블리셔(data publisher)(570) 을 포함한다. 또한, 소프트웨어 개발 키트(564)의 애플리케이션(567)은 시계열 데이터베이스(576)에서 데이터에 접속할 수 있다. 시게열 데이터베이스(TSDB)는 시계열 데이터, 시간 (예를 들면, 날짜-시간 또는 날짜 시간 범위)에 의해 색인된 숫자들의 배열을 처리하기 위해 최적화된 소프트웨어 시스템이다. 시계열 데이터베이스는 일반적으로 새로운 정보가 데이터 베이스에 추가되고, 오래된 데이터가 제거되는 롤링 또는 순환적인 버퍼 또는 큐이다. 데이터 퍼블리셔(570)는 또한 데이터 버스에 접속되며 로컬 시계열 데이터 베이스 또는 클라우스 스토리지에 저장될 필요가 있는 데이터를 구독한다.
도6은 에지(602)와 클라우드 인프라들 간의 동작흐름을 도시한다. 일부 특정 에지 인프라는 상술하였다. 데이터는 센서들(606)로부터 수집된다. 이들 센서는, 산업용, 소매, 헬스케어, 또는 의료기기, 또는 전력 또는 통신 애플리케이션, 또는 이들의 조합을 위한 것일 수 있다.
에지 인프라는 데이터처리(612), 로컬 시계열 데이터베이스(615), 클라우드 싱크(618), 분석 복합 이벤트 처리 엔진(CEP)(621), 분석 실시간 스트리밍 도메인 특정 언어(DSL)(624)(예를 들면, 포크혼의 Vel 언어), 및 실시간 집계 및 액세스(627)을 포함한다. 플랫폼은 이하에 더 자세하게 후술할 가상 센서(630)를 포함할 수 있다. 가상센서는 보강된 실시간 데이터 액세스를 제공한다.
플랫폼은 소프트웨어 개발 키트 또는 SDK를 사용하여 개발될 수 있는 앱 또는 애플리케이션(1, 2, 3)과 같은 한 개 이상의 앱(633)을 통해 접속가능하다. 앱은 기계학습을 수행할 뿐 아니라, 이종 (예를 들면, 다수의 다른 언어로 개발됨) 이며 복합 이벤트 처리 엔진(621)을 활용할 수 있다. 앱은 에지 플랫폼 개발자 또는 에지 플랫폼의 고객 (파트너라고 언급될 수 있음) 에 의해 제공될 수 있는 앱스토어(637)을 사용하여 배포될 수 있다. 앱 스토어를 통해, 사용자는 앱을 다운로드 하거나 다른 사람과 공유할 수 있다. 앱은 기계학습, 원격 모니터링, 예측가능한 유지보수, 동작가능한 인텔리전스, 및 이들의 임의의 조합을 포함하는 분석 및 애플리케이션(639)일 수 있다.
이러한 앱의 경우, 에지와 클라우드 사이에 동적 앱 이동성이 존재한다. 예를 들면, FogHorn 소프트웨어 개발 키트를 사용하여 개발된 애플리케이션은 에지상에서 또는 클라우드에서 전개될 수 있으며, 그에 의하여 에지와 클라우드 사이의 앱 이동성을 얻을 수 있다. 앱은 에지의 일부 또는 클라우드의 일부로서 사용될 수 있다. 일 구현에서, 이러한 특징은 앱들이 컨테이너와 되어 있기 때문에 가능한 것이며, 따라서 앱들은 앱들이 실행되는 플랫폼과 독립적으로 작동할 수 있다. 이것은 분석 표현식에 대해서도 동일하다.
클라우드 또는 사설 데이터 센터(644)에 데이터의 모니터링 또는 저장을 포함하는 통합 경영 및 관리(640)를 위해 허용하는 데이터 앱이 존재한다.
물리적인 센서는 아날로그 또는 디지털 측정으로서 그러한 환경의 일부 특성을 측정하는 전자 변환기이다. 아날로그 측정은 일반적으로 아날로그-디지털 변환기를 사용하여 디지털 양으로 변환된다. 센서 데이터는 필요에 따라 측정(폴링)되거나 균일한 속도로 스트림으로서 사용가능하다. 일반적인 센서 사양은 범위, 정확도, 해상도, 드리프트, 안정성, 및 기타 속성이다. 대부분의 측정 시스템 및 애플리케이션은 처리, 운송, 및 저장을 위해 센서 데이터를 직접적으로 사용하거나 전달한다.
시스템은 분석 표현 언어를 사용하여 만들어진 소프트웨어 기반 센서인 가상센서라고도 불리는 "프로그램가능한 소프트웨어 정의 센서"를 갖는다. 일 구현에 있어서, 분석 표현 언어는 FogHorn의 분석표현 언어이다. 이러한 표현언어는 Vel 이라고 알려져있다. Vel 언어는 실행 지연이 낮고 제약이 적은 풋프린트 환경에서 실시간 스트리밍 분석을 지원하도록 효율적으로 구현된다. 예를 들면, 시스템의 지연은 약 10 밀리초 또는 그 이하일 수 있다.
일 구현에 있어서, 프로그램가능한 소프트웨어 정의 센서는 "센서표현언어" 또는 "SXL" 이라고 불리는 선언형 애플리케이션 프로그램 인터페이스(API)로 생성된다. SXL 언어의 특별한 구현은 Foghorn의 Vel 이다. Vel 센서는 이러한 구성을 통해 생성된 Vel 센서이며, 물질적인 Vel-센서를 포함하는 다수의 소스에 의해 생성된 처리 데이터로부터 파생된 측정을 제공한다. 이러한 응용에서, Vel 과 SXL 은 서로 교환가능하게 사용된다.
Vel 센서는 이러한 세 개의 소스 중 하나, 또는 세 개의 소스의 조합으로부터 파생된다.
1. 한 개의 센서 데이터
1.1. 한 개의 물리적인 센서로부터 파생된 가상 또는 Vel 센서는 임의의 조합의 동적 캘리브레이션, 신호 처리, 수학식, 데이터 압축, 또는 데이터 분석을 사용하여 유입하는 센서 데이터를 변환할 수 있다.
2. 복수개의 물리적 센서 데이터
2.1. 가상 또는 Vel 센서 또는 다수의 이종 물리 센서로부터의 변환(상술한 방법을 사용) 으로서 파생됨.
3. Vel 센서장치의 구현으로 가능한 물리적 센서 데이터 및 가상 센서 데이터의 조합.
Vel 센서는 도메인에 특화되며 특정한 애플리케이션을 염두에 두고 만들어졌다. Vel 프로그래밍 인터페이스의 특별한 구현은 애플리케이션이 변환 (예를 들면, 수학식) 및 집계를 통한 데이터 분석을 정의하게 한다. Vel 은 일반적으로 프로그래밍 언어를 기초로 하는 한 조의 수학 연산자를 포함한다. Vel 센서는 Vel 구성 또는 프로그램을 실행함으로써 런 타임에 데이터 상에서 동작한다.
Vel 센서의 생성 Vel 센서는 소프트웨어 장치로서 디자인되어 데이터를 실시간으로 이용가능하게 한다. 이것은 내장된 계산 하드웨어 상에서 실시간으로 Vel 과 함께 개발된 애플리케이션을 실행하여 애플리케이션에 의해 요구되는 속도로 Vel 센서 데이터를 생성하여야 한다. 이 시스템은 이것을 달성하기 위해 고효율의 실행 엔진을 포함한다.
Vel 센서의 장점은 이하의 것을 포함한다.
1. 프로그램가능성 Vel 은 Vel 센서를 프로그램하도록 하여, 데이터 품질, 빈도, 및 정보와 관련된 특정한 애플리케이션 요구사항에 맞도록 데이터를 합성한다. Vel 센서는 물리적 센서 및 기타 (예를 들면, 기존의) Vel 센서로부터 유래된 데이터로 플러그 인 되도록 무선(over-the-air) 소프트웨어 업그래이드로서 널리 배포될 수 있다. 즉, 애플리케이션 개발자는 물리직인 인프라의 레이아웃과 독립적인 비지니스 로직을 효율적으로 실행할 수 있는 디지털 인프라를 생성할 수 있다.
2. 유지보수성 또는 투명성 Vel 센서는 애플리케이션과 물리적 센서간의 디지털 추상계층을 생성하며, 이것은 물리적인 센서에 대한 업그레이드 및 서비스로 인한 물리적 인프라의 변화로부터 개발자를 보호한다.
3. 효율성 Vel 센서는 물리적 센서로부터의 원시 데이터를 그 안에 포함된 정보의 정확한 표현으로 변환하여 정보 관리의 효율성을 만들어낸다. 이러한 효율성은 애플리케이션에서의 연산, 네트워킹, 및 스토리지 다우스트림과 같은 IT 리소스의 효율적인 활용으로 변화된다.
4. 실시간 데이터: Vel 센서는 실제 세계 또는 물리적 센서 데이터 스트림으로부터 연산된 실시간 센서 데이터를 제공한다. 이것은 데이터가 최소한의 시간 지연으로 애플리케이션을 위해 활용될 수 있게 한다.
구현. 시스템은 Vel 인터페이스 기반의 Vel 센서의 확장가능한 실시간 구현을 설계하여왔다. Vel 은 Java 언어로 지원되는 연산자를 포함하며 물리적 센서와 그 프로토콜과 잘 결합된다.
시스템은 실행된 물리적 센서의 데이터에 대한 연산을 정확하게 표현하기 위한 새로운 방법을 제시한다. 이 선언적인 표현은 물리적 센서상의 구현으로부터 디지털 추상의 정의를 분리시킨다.
다양한 타입의 데이터 스트림 셋트와 이러한 스트림 내에서 데이터의 특별한 패턴에 반응하고 조절하기 위한 기능적 수단의 세트가 주어지면, 본 발명은 이러한 기능을 데이터가 스트림에 도착하면 적절하고 효율적으로 호출되도록 이러한 기능을 기술하고 변환하는 기술이다.
이러한 종류의 문제를 해결할 필요성은 모든 형태의 데이터플로우 프로그래밍에 공통적으로 나타난다. 이것은 내장된 장치내의 이벤트의 흐름과 같은 아주 소규모의 아키텍처뿐만 아니라 기업 데이터 센터들 내부 또는 기업 데이터 센터들 간의 데이터의 흐름과 같은 아주 대규모의 아키텍처에 적용가능하다.
본 발명은 데이터플로우 프로그래밍의 모든 도메인에 적용가능하지만, 일치가 감지될 수 있는 속도와 적용되는 핸들러 함수가 가장 중요하고 실행에 전념할 수 있는 제한된 저장소 및 컴퓨팅 리소스가 존재하는 상황에서 가장 적절하다.
일 예. 주어진 정수 스트림으로부터, 우리는 한 개 이상의 0 이 뒤따르는, 한 개 이상의 0이 아닌 값을 일치시키고자 한다. 이러한 패턴이 일치되면, 우리는 0이 아닌 값들의 합을 연산하고 그 결과를 다른 스트림에 기입하고자 한다.
우리는 정규식 표기법으로 이러한 문제의 패턴 일치부분을 기입한 후, 산술식으로 합의 연산을 별도로 기입할 수 있다. 이러한 일이 발생하면, 에지 컴퓨팅에서 데이터플로우 애플리케이션에서 사용하도록 디자인된 Vel 프로그래밍 언어는 통일된 표현법으로 전체적인 변환을 기입할 수 있게 한다.
stream("output") =
( a:{!= 0} .. {>0}, :0 .. {>0} -> sum(a) )
from stream("input")
이 기술은 상기의 함수 매개변수화를 상태 머신으로 번역한다. 그런다음, 상태 머신을 기반으로 유한 오토마톤으로서의 일치를 구현하고 결과 매치들을 합계 표현식에 공급한다. 이러한 플로우는 도7에 도시된다. 이것은 상태 0 (705), 상태 1 (710), "리스트 a" 로부터 블록(715) 및 "푸시합계(a)" 블록(720) 이다.
이러한 문제는 각 핸들러 함수에 대한 매칭함수를 생성함으로서 해결될 수 있다. 매칭함수는 입력으로서 스트림으로부터의 데이터 윈도우를 입력으로서 받아들이고, 매치에 대한 "참" 및 비매치에 대해 "거짓"을 반환한다. 데이터가 윈도우를 통해 흐름에 따라, 매칭 함수는 매치가 발견될 때까지 반복적으로 적용되어야 한다. 일단 매치가 발견되면, 핸들러 함수가 적용된다.
이러한 해결책은 핸들러 함수가 데이터베이스 쿼리에 대하여 사용된 것과 유사한 방식으로 지정되었기 때문에 생기는 것이다. SQL과 유사한 WHERE 절은 매칭 조건을 기술하는 Boolean 연산식을 제공하며 매칭 함수는이 표현식을 직접 컴파일한다.
새로운 데이터가 스트림 버퍼로 흐를 때, 개별적인 매칭 함수가 개별적으로 평가되어야한다. 매치는 각 함수에 대해 독립적으로 판단된다.
매치를 수행하기 위해 상태 머신을 사용하는 것이 복수개의 임의의 Boolean 연산식을 반복적으로 적용하는 것보다 더 효율적이다.
본 발명은 함수의 매개변수를 선언하는 패턴 기술언어로부터 상태 머신을 도출한다. 도출된 상태 머신은 종래 Boolean 연산식 매칭 함수보다 데이터 스트림에서 더 효율적으로 매치를 검출한다.
도출된 상태 머신은 또한 데이터 스트림에서 검출된 매치를 위한 핸들러 함수 세트를 구현할 수 있다. 복수개의 매칭 및 대응하는 핸들러함수는 임의의 핸들러 함수에 대한 매치를 효율적으로 인식하는 한 개의 상태 머신으로 결합되거나 감소될 수 있다.
도출된 상태 머신은 또한 증가되어 상태 머신에 의해 인식된 시퀀스를 변경시키지 않고 추가적인 노드를 통한 자유 (엡실론) 변환을 포함할 수 있다.
그러한 추가적인 노드를 통한 변환은 데이터에 대한 다양한 액션을 트리거할 수 있다. 예를 들면, 결정성 유한 오토마톤(DFA: Deterministic Finite Automaton) 또는 스택 머신의 시프트 버퍼로의 데이터의 수집을 대기영역으로 트리거할 수 있다. 이들 데이터는 나중에 함수 응용에 대한 인수의 기본을 형성할 수 있다.
이 애플리케이션은 DFA라는 용어를 사용하지만, 이러한 오토마톤 또는 유닛은 스택머신이라고 부를 수도 있다. 엄격하게 말하면, 결정성 유한 오토마톤은 공간에서의 유한한 성능을 암시한다. 하지만, 본 특허에서 오토마톤은 유한할 필요가 없으며, 유한하지 않고 여전히 간단할 수 있다. 그러므로, 본 특허에서 기술된 바와 같은 DFA 는 유한하지 않다.
그러한 추가적인 노드를 통한 변환은 또한 이전 노드에서 함수 애플리케이션 인수로서 캡쳐된 데이터를 사용하여 핸들러 함수의 호출을 트리거할 수 있다.
정규 표현식 및 값 표현식의 태양을 결합하는 스크립트로부터의 번역은 패턴을 효율적으로 매치시키고 값을 연산할 수 있는 확장된 상태 머신 또는 DFA를 야기시킨다.
그 결과로서 결합된 매칭 또는 연산 알고리즘은 패턴 매칭 또는 값 연산의 개별적인 조직보다 더 효율적이다.
어휘 소스 (lexical source) 로부터 DFA 또는 상태 머신을 구성하고, 비결정적 유한 오토마톤(NFA: Nondeterministic Finite Automaton) 로 시작한 다음 그것을 최소 DFA로 줄이는 방법. DFA의 목적은 입력데이터의 시리즈 내에서 패턴을 인식하는 것이다. 본 논의를 위해, 우리는 상태 머신 토큰을 통해 흐르는 데이터 및 토큰의 언어로서 DFA 에 의해 인식된 특정한 패턴을 호출할 것이다.
도8에서 NFA 의 부분을 고려한다. 이 부분은 DFA 일 수도 있지만, 본 예의 목적에 의하면 중요하지는 않다. 토큰 알파 수신 하에 상태A(805)로부터 상태B(810) 으로 변환한다.
도9에 도시된 바와 같이, 엡실론 변환(920)으로 추가적인 노드를 추가함으로서 NFA 를 증가시킬 수 있다. 엡실론 에지는 언제라도, 자유롭게, 그 입력 상태에 관계없이 그 상태대로 뒤따를 수 있다.
한 개 이상의 엡실론 에지의 존재는 상태기계를 비결정성으로 만들지만, 엡실론 에지는 이 수단에 의해 테이블로 구동되는 방법에 의해 효율적으로 구현될 수 있는 동등한 DFA로 감소된 NFA로, 알고리즘에 의해 제거될 수 있다. 그러므로, 우리는 효율적인 구현을 위한 정책을 여전히 남겨둔 채 이러한 추가적인 엡실론 변환을 소개할 수 있다.
도9의 상태 머신은 토큰 알파(925)의 수신시에 상태A(905)로부터 상태X(915)로 변환될 것이며, 임의로 상태X로부터 상태 B(910) 으로 임의로 진행할 수 있다. 알파의 추진동력은 도8의 단순한 기계가 하는 것과 같이, 여전히 상태A로부터 상태B로 변환되며, 이러한 변환을 성취하기 위해 추가적인 입력은 필요하지 않다. 그러므로, 도9의 NFA 는 도8에서의 동일한 언어를 번역하는 것으로 보일 수 있다. 그것은 그렇게 하기 위해, 단순히 상태X를 통해 추가적인 상태변환을 한다.
추가적인 상태는 우리가 부작용의 성능을 연관시킬 수 있다는 점에서 유용하다. 이러한 부작용이 상태 머신의 정의 및 상태 머신을 통해 흐르는 데이터를 변경시키는 한, 추가적인 노드는 언어의 인식에 영향을 미치지 못하지만, 부작용은 추가적인 작업을 할 수 있다.
데이터플로우 반응 구현에 있어서, 추가적인 작업은 데이터에 대한, 또는 데이터를 사용하는 임의의 수의 유용한 동작을 포함할 수 있다. 한 개의 예시적인 구현에 있어서, 작업은 이하의 것을 포함한다.
1. 노드를 통해 흐르고 그것의 사본을 외부 수집기로 보내는 데이터를 검사.
2. 데이터가 노드를 통해 흐르는 경우 데이터로의 변환을 적용하고 변환된 데이터를 임시버퍼에 저장, 또는
3. 수집된 데이터를 임시버퍼로부터 추가적인 변환으로 플러시하고 그 결과를 다른 DFA 또는 스택머신으로 푸시.
일 예로서, 소스 조각을 고려한다.
( a:{!= 0} .. {>0}, :0 .. {>0} -> sum(a) )
이 조각은 두 개의 용어로 이루어지는 패턴을 기술한다. (1) a 라고 불리는, 한 개 이상의 0이 아닌 값의 반복과 일치하는 첫번째 용어 (2) 한 개 이상의 0의 반복과 일치하는, 이름이 주어지지 않은 두번째 용어.
이러한 것을 반응에 대한 기본으로서 사용하기를 바란다고 가정한다. 우리는 호출된 소스로부터 값을 독취하며, 우리가 입력 중에서 단편의 패턴을 인식할 경우, 단면의 오른쪽을 평가하고, 최종 호출로 결과를 푸쉬함으로서 반응할 수 있다.
예를 들면, 값[101, 202, 303, 0, 0]으로 이루어진다면, 우리는 첫번째 세 개의 값을 a와 결합하고 마지막 두 개의 값을 익명의 제2 용어와 결합함으로서 패턴을 일치시킬 수 있다. 그러고 나서, 우리는 a에 결합된 값의 리스트 [101,202, 303] 에 합함수를 적용하고 606으로 돌아감으로서 오른쪽을 평가한다. 그 후, 우리는 606을 바깥쪽으로 푸시한다.
본 발명에 따라 본 실시예에서와 같은 기능적 패턴의 번역은 컴퓨터로 실행되는 번역환 프로그램을 통해 구현될 수 있다. 프로그램은 두 개의 상이한 형태의 번역을 수행할 수 있다. 기능 지향 부분 "sum(a)" 를 연산을 실행할 실행가능 명령문들의 블록으로 번역하고, 패턴 지향 부분 "a:{!= 0} .. {>0}, :0 .. {>0}"을 패턴을 인식하고, 인수를 캡쳐하고, 함수를 호출할 DFA 또는 스택머신으로 번역한다. 이들을 첫번째 작업함수 번역과 두번째 작업패턴 번역이라고 부르기로 한다.
함수 번역은 컴파일러와 해석기의 작성을 전문으로 하는 컴퓨터 프로그래머들은 잘 이해할 수 있다. 패턴번역, 함수번역과 패턴번역의 맞춤, 및 패턴 인식과 함수 발송의 후속적인 자동화가 본 발명의 주제이다.
소스 텍스트의 구문내용을 기술하는 추상구문 트리 (AST: abstract syntax tree)의 잎을 형성하도록, 함수번역은 소스텍스트의 수신, 텍스트를 토큰으로 분해 후, 문법따라 안내하여 토큰을 정렬하는 것으로 이루어진다. 그 후, 추상구문트리는 소스에 의해 기술될 함수를 평가하기 위하여 요구되는 명령어 블록을 최종적으로 생성하는 일련의 알고리즘에 의해 트리버스된다.
패턴번역은 상술한 구문해석에 의해 형성된 추상구문트리로 시작한다. 추상구문트리는 패턴선언의 루트를 형성하는 한 개 이상의 노드를 포함할 수 있다. 예를 들면, 상술한 패턴은 두 개의 자식을 갖는 한 개의 루트노드로 이루어질 수 있으며, 도10의 좌하단에 도시된 바와 같이, 각각의 자식은 패턴의 한 용어를 기술한다. 도10에, 반응루트 노드(1005), 패턴루트노드(1010), sum(a) 노드(1015), 노드(1020), 및 <노네임>노드(10)가 존재한다.
일치하는 예제와 그것과 일치시키기 위한 반복을 지정하는 패턴 용어 노드가 정규 표현식의 항과 동일한 정보를 전달한다는 것을 인식해야 한다. 또한, 함께 및 순서대로 취해지는 자식노드의 시퀀스는 정규 표현식 항의 선형 결합과 동일한 정보를 지정한다. 정규 표현식 또는 정규 표현식 항의 선형결합은 NFA로 번역된 항일 수 있다. 본 발명자들은 동일한 알고리즘이 본 발명에서 사용될 수 있으며, 패턴 항은 정규 표현식 항을 나타낸다는 것을 발견하였다.
일단 기본 NFA 가 그렇게 형성되면, 패턴 용어로 동작이 요구되는 위치에 추가적인 부작용 유발 상태를 주입 할 수 있고, 수용 상태 후에 반응 기능을 호출 할 수있다.
예제를 계속하기 위하여, 용어 a 는 그것과 일치되는 값의 리스트를 수집하고 그것을 인수로서 반응 함수에 전달할 것을 요구한다. 즉, 도9에 도시된 변환을 용어 a 의 결과인 NFA 상태에 적용하고 일치하는 용어를 수집하는 작업을 행하기 위한 새로운 상태를 사용한다. 그 후, 변환을 다시 NFA 가 수용된 상태로 적용하고, 수집된 값들을 사용하여 반응 함수를 호출하고, 반응 소비자에게 결과를 푸시하고, 수집 버퍼를 비운다. 이러한 강화된 NFA 가 DFA 및 축소된 상태로 변환 된 후, 도7에 도시된 기계로 남겨진다.
이러한 단계는 상태 동작 테이블을 사용하여 상태 머신 엔진을 구동하는 알고리즘과 마찬가지로 NFA 를 DFA로 변혼하고 상태를 DFA로 축소시키기 위해 사용되며, DFA 를 상태 동작 테이블로로서 렌더링하는데 사용된다.
본 발명의 기술에 의해 생성된 NFA 는 테이블로 변환 및 렌더링된다. 하지만, 이러한 결과 테이블은 각 상태를 통과할때 싱행될 부작용 람다로 이루어진 추가 컬럼을 포함한다. 그러한 상태 동작 람다 테이블을 사용하는 자동화 엔진은 다른 기술과 달리 전이를 실행할 때마다 추가 람다를 실행한다.
데이터플로우 연산 환경을 사용하기 위한 반응 함수를 기술하고 번역하는 방법은 (i) 반응함수를 식별하는 단계, (ii) 함수에 입력을 제공하는 매개변수의 패턴을 식별하는 단계, (iii) 함수를 거친 인수에 기반하여 평가될 연산식을 식별하는 단계, (iv) 매개변수의 패턴을 패턴과 일치하는 입력의 시퀀스를 인식할 수 있는 상태 머신으로 번역하는 단계, (v) 입력 데이터를 수집하고 변환하는 작업을 행하는 추가적인 상태로 상태 머신을 증강하여 함수에 대한 인수로서 사용하도록 준비하는 단계, 및 (vi) 간단한 소프트웨어 또는 하드웨어로 자동화할 수 있는 상태 동작-효과 테이블로 상태 머신을 감축시키는 단계를 포함한다.
인수로서 함수의 세트 및 값들의 시퀀스가 주어지면, 본 발명은 인수가 일치하는 함수에 실행을 디스패치하거나 인수가 함수 중 어느 것과도 일치하지 않는다고 판단하는 방법이다. 본 방법은 값 표현식, 유형 표현식, 및 정규 표현식을 결합함으로서 유형 시스템에서 표현가능한 임의의 값의 시퀀스를 모호함이 없이 일치시킬 수 있는 신규한 방법이다.
이러한 형태의 문제를 해결하기 위한 필요성이, 번역기, 해석기, 및 컴퍼일러의 개발 단계에서 제기되고 있으며, 이것은 다형성 디스패치의 개념과 밀접한 관련이 있다. 만약 누군가가 한 개의 오브젝트(튜플)을 구성하기 위하여 시퀀스의 임의의 접두사(prefix)를 형성하는 요소들을 고려한다면, 올바른 함수로 디스패치하는 작업이 튜플의 클래스의 방법의 다형성 디스패치와 동등한 것으로 생각될 수 있다.
본 발명은 이러한 종류의 다형성 디스패치가 요구되는 임의의 상황에 적용가능하다. 이것은 프로그램의 외부로부터 발생하는 데이터 스트림에 응답해야 하는 모든 방식의 이벤트로 구동되거나 반응하는 프로그램을 포함한다. 본 발명은 특히, 에지 또는 포그 컴퓨팅 또는 네트워킹 환경에서 종종 발생하는 것과 같은 복수의 데이터 스트림의 실시간 처리와 관련한 애플리케이션에 유용할 것이다.
정규 표현식은 특정한 패턴에 일치되는 문자열을 검출하기 위하여 공통적으로 사용된다. 다수의 정규 표현식 언어와 이것에 기초하여 효율적인 매칭 엔진을 실행하는 가장 밀접하게 관련된 많은 수의 도구가 존재한다. 이것은 일반적으로 문자의 시퀀스를 일치시키는 것으로 한정된다.
문자열 이외의 도메인 상에서 동작하는 다른 패턴 기반의 표기법도 존재한다. 일 예로는 XML 문서에 패턴을 기술하는 XPATH 가 있다. 이러한 표기법은 종종 정규 표현식보다 덜 완전하고 덜 강력하며 특정한 도메인에 맞추어져 있다.
일부 프로그래밍 언어는 형태 기반의 패턴 매칭 시스템을 통해 런타임 다형성 디스패치를 구현한다. 함수의 복수의 과부하가 정의 되며, 각각은 형태와 값이 상이한 패턴을 취한다. 디스패치는 함수 매개변수의 패턴에 대한 인수의 형태와 값을 매칭시킴으로서 실행시간에 해결된다. 하스켈(haskell) 은 그러한 프로그래밍 언어중 한가지이다.
언어-명세언어는 일련의 생산 규칙으로서 문맥자유 문법(context-free grammer)를 기술한다. 이러한 규칙은 언어의 구문을 구성한다. 컴파일러-컴파일러는 이러한 규칙을 언어의 예들을 인식할 수 있는 테이블로 구동되는 결정성 있는 유한 상태 머신으로 번역한다. 비손(bison) 은 그러한 언어-명세 언어의 일 예 및 그와 연관된 컴파일러-컴파일러이다.
정규 표현식과 같은 문법으로 구동되는 패턴 일치 시스템은 결정성 있는 유한 자동화(DFA) 또는 상태 머신과 같은 단순한 머신으로 표현될 수 있기 때문에 효율적인 실행이라는 장점을 가지지만, 완전한 형태의 시스템의 넓은 모델링 능력은 부족하다. 하스켈에서 사용되는 것과 같은 유형으로 구동되는 패턴 매칭 시스템은 모델링 능력이 더 풍부하지만, 합리적으로 효율적인 구현을 위해 표현가능한 것을 희생하지만, DFA에 기초한 고속 매칭 시스템만큼 효율적이지는 않다.
본 발명은 그 유형 중에서 표현가능한 모든 상태에 대해 일치할 수 있지만 여전히 상태 머신만큼 효율적으로 구현될 수 있는 형태 기반 매칭 시스템을 취급한다. . 유형 및 상태의 일반화된 패턴은 패턴의 일 예들을 효율적으로 인식할 테이블로 구동되는 상태 머신으로 번역된다.
이러한 패턴에 기초하여 함수 매개변수를 정의하는 것은 함수가 데이터의 임의의 패턴을 정확하게 매칭시키도록 하며, 매칭시에 매칭 데이터 요소들 중에서 그 인수를 바인딩한다. 함수의 합집합에 대한 매칭 패턴을 기술하는 상태 머신은 멤버 함수의 상태 머신을 통합한 후 그 결과를 최소수의 상태로 축소함으로서 형성된다. 과부하들 간의 명확성 또는 전체적인 불일치의 검출은 시퀀스에서 가능한한 조기에 발생하여 함수 애플리케이션의 해상도를 가속화한다. 매칭은 가능한 한 많은 입력을 받아드릴 수 있는 함수의 "greedy" 버전을 생성하여 시퀀스 내에서 가능한한 늦게까지 지연될 수 있다.
방법은 값 표현식, 유형 표현식, 및 정규 표현식을 결합함으로서 유형 시스템에서 표현가능한 임의의 값의 시퀀스를 모호함이 없이 일치시킨다. 이 방법은 함수 애플리케이션을 해소하고 최소수의 판단으로 올바른 과부하를 디스패치한다. 문법적 하위 구성요소를 재귀적으로 인식하고 변환함수를 적용함으로서 특정 언어를 인식하도록 하여, 이 방법은 과부하 함수 애플리케이션이 문맥 자유 그래머와 동일한 작업을 수행하게 한다.
본 방법은 복수의 상이한 유형을 포함하는 유형시스템과 결합하여 적용가능하다. 예를 들면, (1) 정수, 실수, 및 문자열과 같은 한 세트의 기초적인 단형성 유형. (2) 한 조의 다형형 유형 및 그들의 생성자(constructor), 특히 우리가 간단히 논의하여야 하는 임의의 속성을 갖는 다형성 세트 유형. (3) 합산 유형 (sum type) (4) 기록형태의 곱 유형 (product type). (5) 이 필드의 반복을 포함하는 튜플의 일반화 인, 패턴 형태의 곱 유형. (6) 패턴 유형을 임의의 유형에 매핑하는 람다유형. 및 (7) 람다의 리스트를 구성하는 폴리 람다 유형 (poly-lamda type).
세트는 요소의 한 개 이상의 범위를 구성하는 다형성 유형이다. 예를 들면, 한 세트의 정수가 한 세트의 문자열로부터부터의 구별되는 형식이 되도록, 세트 유형은 포함하는 요소의 유형에 대해 매개변수화된다. 세트 유형은 이 내용에 대한 한계에 의해 특징지어질 수 있다. 특히, 세트 유형은 유한 또는 무한하도록, 또는 좌측 또는 우측으로 폐쇄 또는 개방되도록, 또는 이들의 임의의 조합으로 제한될 수 있다. 정수 세트의 다음 예를 다음과 같이 고려한다.
테이블 A
표기법 길이 폐쇄성 의미
[1] 1 좌측 및 우측에서 폐쇄됨 한 개의 정수 1로 구성된 세트.
[1, 2, 3] 3 좌측 및 우측에서 폐쇄됨 1, 2, 및 3 세 개의 정수로 이루어진 세트.
[5000 .. 6000] 1001 좌측 및 우측에서 폐쇄됨 5000 부터 6000 까지의 정수를 포함
[10 ..] 무한 좌측 폐쇄, 우측 개방 10 이상의 모든 정수
[.. 10] 무한 좌측 개방, 우측 폐쇄 10 이하의 모든 정수
[> 5] 무한 좌측 폐쇄, 우측 개방 5보다 큰 모든 정수. [6..] 과 같음.
[>= 5] 무한 좌측 폐쇄, 우측 개방 5이상의 모든 정수. [5..] 와 같음.
[< 5] 무한 좌측 개방, 우측 폐쇄 5 미만의 모든 정수.[.. 4] 와 같음.
[<= 5] 무한 좌측 개방, 우측 폐쇄 5 이하의 모든 정수.[.. 5] 와 같음.
[!= 5] 무한 좌측 개방, 우측 폐쇄 5 이외의 모든 정수.
[>= 1] and[<= 3] 3 좌측 및 우측에서 폐쇄됨 1, 2, 및 3의 세 개의 정수로 이루어진 세트.
[1, 2, 3] or [1 .. 3] 과 같음.
[<= -10] or
[>= 10]
무한 좌측 개방, 우측 폐쇄 10 이상의 절대값을 갖는 모든 정수
not [1 .. 3] 무한 좌측 개방, 우측 폐쇄 1, 2, 및 3 을 제외한 모든 정수.
요소가 정수형태이고 정수는 명확하게 셀 수 있으므로 [>= 1] 과 [> 0] 사이에는 구분이 없다. 요소가 실수 또는 문자열과 같이 셀수 없는 유형인 경우라면, 명백한 포함 또는 종점의 포함이 필요하게 된다. 예를 들면, 세트 [>= "cat"] 는 문자열 "cat" 및 "cat" 이후에 사전편찬식으로 정렬되는 모든 문자열로 이루어질 수 있다.
유형으로서 세트의 일 예를 사용할 수 있다. 그러한 유형의 일 예는 세트의 구성요소일 수 있다. 예를 들면, 유형으로서 사용되는 세트 [>0] 은 값과 같은 양의 정수만을 허용할 수있다. 사실상, 이런 방식으로 모든 유형을 생각할 수 있다. 예를 들면, 단형성 정수유형이 모든 정수의 세트로 이루어진 세트 유형으로 고려될 수 있다.
합 유형은 다른 유형의 단순한 합집합이다. 예를 들면, 유형 정수(int) 또는 스트링은 두 개의 구성 유형의 합이다. 합 유형의 임의의 구성 유형의 임의의 예는 합 유형의 일 예일 수 있다. 예를 들면, 이것은 정수 또는 문자열일 수 있는, 값들의 리스트인 유형 리스트 (정수 또는 문자열)을 기술하도록 할 수 있다. 합집합의 합집합은 평평해지므로, 유형 표현 (정수 또는 문자열) 또는 (정수 또는 실수) 은 정수, 실수, 또는 문자열과 동일하다. 합집합 내에서 유형의 순서는 중요하지 않지만, 표준화를 위해서, 그 구성요소가 알파벳 순서가 되도록 모든 합집합 유형을 나타낸다.
레코드 유형은 명명된 필드를 사용하고 각 필드를 유형과 연관시킨다. 예를 들면, {생일: 날짜; 이름: 문자열; 성: 문자열}. 레코드 유형은 항상 유한한 수의 필드를 가지며, 각 필드는 유형 내에서 고유의 이름을 갖는다. 필드의 순서는 중요하지 않다. 즉, {x: int; y: int} 는 {y: int; x: int} 와 같다. 하지만, 합집합에 대해 행했던 것처럼, 알파벳 순서로 구성요소를 갖는 레코드 유형을 나타낼 수 있다.
레코드의 이러한 유형은 레코드 자체라는 것에 주목하여야 한다. 값 {x: 3; y: 4} 은 유형 {x: int; y: int} 을 갖는다.
패턴 유형은 유형의 시퀀스로서 정의된 튜플과 유사하지만, 튜플은 암시적으로 각 요소가 정확하게 한번 만 나타나는 것으로 가정하고, 패턴은 각 요소가 반복성을 갖는 것을 허용한다. 반복성은 정수 세트로서 주어진다. 예를 들면, 패턴 <a: int # [1 .. 3]; b: string # [1 .. 3]> 은 한 개 내지 세 개의 문자열이 뒤따르는 한 개 또는 세 개의 정수와 매치된다.
람다의 매개변수로서 사용될 경우, 패턴의 필드는 람다의 평가 내에서 바인딩되는 인수를 발생시킨다. 예를 들면, 이전 단락에서 주어진 패턴에 일치시킨 후, 두 개의 로컬 식별자 a 와 b 를 범위내에서 가질 수 있다. A 의 값은 한 개 내지 세 개의 정수의 리스트일 수 있고, b의 값은 한 개 또는 세 개의 문자열의 리스트일 수 있다.
패턴 내의 한 개 이상의 필드가 이름을 갖지 않는 것도 또한 유효하다. 이름을 갖지 않는 필드도 매칭되지만, 값이 없는 것은 인수로서 바인딩된다. 예를 들면, <a: int # [ 1 .. 3 ]; string # [ 1 .. 3] > 에 매칭이 되면, 이전처럼, 한 개 이상의 문자열이 뒤따르는 한 개 이상의 정수로 매칭하며, 정수들은 a 라고 불리는 리스트로서 바인딩하지만, 문자열은 바인딩하지 않는다.
패턴의 길이는 무한할 수 있다. 예를 들면, 패턴은 <a: int # [ 1 .. ]> 상한이 없는 한 개 이상의 정수와 매칭될 것이다. 이러한 것도 유효하며, 끝이 없는 입력 스트림을 처리하기 위하여 사용된다면, 무한한 패턴이, 값을 수집하는 것을 중단해야 할 때를 나타내는 시간 간격과 같이, 다른 트리거의 일부와 페어링되어야 한다.
일반적으로 패턴은 그것과 매칭되는 데이터를 소모하지만, 해당 데이터의 서브셋만을 소모하거나 전혀 사용하지 않을 수 있다. 패턴은 "peek point" 라고 불리는 마크를 포함할 수 있으며, 이 시점을 넘어서 데이터를 매칭시키고, 인수를 바인딩하지만, 입력 스트림으로부터 소비되는 것은 아니다. 예를 들면, 패턴 <a: int; b: int; peek; c: int> 세 개의 정수와 세 개의 로컬 식별자를 매칭시키지만, 입력으로부터 오직 두 개의 정수만을 소비한다.
필드를 갖지 않는 레코드 또는 필드를 갖지 않는 패턴을 갖는 것은 유효하다. 이들 두 경우는 곱 유형을 나타내기 때문에, 서로 의미있게 구별할 수 없다. 구문적으로, 이러한 컨셉을 키워드 보이드(void) 라고 지정한다. 보이드는 고유의 값이며 그 자체의 유형이다. 합집합에서 사용되면, 보이드는 만약 존재할 경우에는 int 이지만, 존재하지 않을 수도 있는 값을 의미하는 int 또는 void과 같은 선택적인 유형의 개념을 발생시킨다.
우리의 목적을 위해, 유형 매칭은 구조적이지만, 지명되지 않는다. 유형은 이름은 가지지 않고, 단지 기술되기만 한다. 동일하게 기술되는 두 개의 유형은 동일한 유형이다. 기술이 다른 유형의 기술의 서브세트인 유형은 그 유형의 일반화이다. 예를 들면, 유형 {x: int; y: int} 및 {x: int; y: int; z: int} 을 고려해보자. 두 개의 필드 x 와 y를 갖는 유형이 세 개의 필드 x, y, z 를 갖는 유형의 서브세트이면, 전자는 후자의 일반화라고 고려될 수 있다. 이것은 또한 패턴에 대해서는 참이다. 다른 것의 접두사인 패턴 또한 그것의 일반화이다.
람다 유형은 입력 패턴을 다른 유형에 매핑한다. 예를 들면, 세 개의 정수 중 한 개를 취하고 정수를 되돌려 놓는 함수의 유형인 <int # [1 .. 3]> → int 이다. 폴리 람다 유형은 람다 유형의 리스트로 이루어진다. 람다들의 순서는 여기에서는 중요하다. 폴리 람다 애플리케이션은 해결하는 경우, 매칭되는 구성요소인 람다의 처음으로 디스패치 할 것이다.
이런 방식으로 정의된, 폴리 람다를 디스패치하기 위하여 요구되는 패턴 매칭은 DFA 로 축소될 수 있다. 방법을 설명하기 위해, 비교를 위한 기초로서 상태 머신 구성의 방법을 사용하고 필요에 따라 그것을 증강시킬 것이다. 설명은 먼저 비결정적 유한 오토마톤 (NFA) 을 구성하고 나서, 그것은 DFA, 로 축소시키는 것과 관련되지만, 실제로, 이것은 일반적으로 단일의 단계에서 행해질 수 있다.
앞서 논의한 바와 같이, 이 애플리케이션은 DFA라는 용어를 사용하지만, 이러한 오토마톤 또는 단위는 스택머신이라고 부를 수도 있다. 엄격하게 말하면, 결정성 유한 오토마톤은 공간에서의 유한한 성능을 암시한다. 하지만, 본 특허에서 오토마톤은 유한할 필요가 없으며, 비유한하고 간단할 수 있다. 그러므로, 본 특허에서 기술된 바와 같은 DFA 는 유한하지 않다.
우선, 개별적인 람다 패턴인, 폴리 람다의 구성요소는 교대의 요소로서 간주되어야 한다. 정규 표현식을 번역함에 있어서, 구문 a|b (a 또는 B) 는 교대의 표현이다: a 를 1105에 매칭시키거나 b 를 1110 에 매칭시킨다. 이 경우에, a AND b 는 각각 람다 패턴이다. 도11에 교대에 대한 서브그래프를 구성하였다.
개별패턴의 필드를 결합으로 표현하였다. 정규 표현식을 번역함에 있어서, 구문 ab 1210 은 결합을 나타낸다. a 를 1205에 매칭시키고 나서 b를 1215에 매칭시킨다. 이 경우에, a AND b 는 패턴의 각 필드이다. 도12에 결합에 대한 서브그래프를 구성하였다.
필드의 반복 팩터는 종래에 a+ or a* 또는 a{n:m} 로 기재되는, 정규 표현식의 폐쇄(closure) 와 동일하다. 다시 한번, 도 13에 도시된 바와 같은 구조를 갖는 폐쇄를 도시한다. 이 경우에, 반복 세트의 값에 기초하여 서브그래프 내의 일부 변수가 필요할 것이다. 예를 들면, 노드 i (1305) 로부터 노드 j (1310) 순방향 엡실론은 세트가 0을 포함하지 않는 경우에만 포함될 수 있다. 이러한 변형들은 대체로 명백하며, 여기에서 제시되는 동일한 기본적인 아이디어와 함께 계속된다.
중간 NFA 가 완료된 후, 그것은 DFA 로 축소시키고 나서 최소 DFA 에 도달할 때까지 DFA 의 상태를 감소시킨다. 그 후, 자동화 상태 머신에서 채용되는 일반적인 종류의 소프트웨어 또는 하드웨어에 의해, 자동화에 적합한 상태-동작 테이블로서 DFA 를 렌더링한다. 이러한 테이블의 수용 상태는 폴리 람다로의 진입지점을 표시하고 중간상태는 인수를 바인딩하기 위하여 사용된 데이터의 수집을 제공한다.
DFA가 이렇게 자동화되고 입력 스트림을 제공할 경우, 스트림 및 디스패치로부터 입력의 접두사와 올바른 과부하를 매칭시켜서 그것을 조절하고 계산된 결과를 산출한다. 이러한 과정이 반복되는 것이 허용된다면, 결과는 입력 스트림으로부터 매치당 하나씩 산축된 결과의 시퀀스이다. 이것은 데이터 스트림에서 검출된 다양한 유형의 인수의 대응 패턴에 의해 트리거되는 다형성 함수에 의해 입력 데이터 스트림의 효율적인 실시간 처리를 제공한다.
값과 유형 식별자의 혼합을 포함하는 복수의 종류의 함수 인자를 포함하는 데이터 스트림에 대응하는 다형성 함수의 실행을 디스패칭하는 방법은 (i) 실행될 다형성 함수로서, 상기 다형성 함수는 상이한 종류의 인수의 패턴과 각각 관련된 복수의 과부하를 갖는 다형성 함수를 식별하는 단계; (ii) 과부하의 인수 패턴을 매칭시킴으로서 입력 스트림으로부터 바인딩된 인수 값 세트상으로 평가될 출력 표현식을 각각의 고부하에 대해 식별하는 단계; (iii) 각각의 과부하의 인수 패턴을 입력 스트림 내의 패턴에 대한 매치를 효율적으로 인식할 DFA 로 번역하는 단계; (iv) 개개의 과부하의 DFA를 개개의 DFA 에 의해 매칭될 임의의 패턴을 매칭시킬 수 있는 결합된 DFA 로 전체적으로 다형성 함수에 대한 단일한 DFA 로 결합하고 매칭 입력을 처리해야 하는 과부하를 선택하는 단계; (v) 데이터 스트림을 결합된 DFA 에 적용하고, DFA 는 매칭 또는 매칭의 부재를 판단하기 위하여, 필요에 따라 스트림으로부터 데이터를 검사 또는 소비 또는 양자를 행하고, 매칭인 경우에, 입력 인수값을 적절하게 바인딩하며 평가될 적절한 출력표현식을 선택하는 단계; (vi) 출력표현식의 평가를 디스패칭하며 그 결과를 되돌리는 단계를 포함한다.
반응함수에 의해 생성되는 뚜렷한 유형의 데이터 스트림 세트가 주어질 경우, 본 발명은 이러한 스트림이 그 출력이 통합된 유형의 단일 스트림으로 효율적으로 구성되게 하는 기술이다.
이러한 종류의 문제를 해결할 필요성은 모든 형태의 데이터플로우 프로그래밍에 공통적으로 나타난다. 이것은 내장된 장치내의 이벤트의 흐름과 같은 아주 소규모의 아키텍처뿐만 아니라 기업 데이터 센터들 내부 또는 기업 데이터 센터들 간의 데이터의 흐름과 같은 아주 대규모의 아키텍처에 적용가능하다.
본 발명은 데이터플로우 프로그래밍의 모든 도메인에 적용가능하지만, 일치가 감지될 수 있는 속도와 적용되는 핸들러 함수가 가장 중요하고 실행에 전념할 수 있는 제한된 저장소 및 컴퓨팅 리소스가 존재하는 상황에서 가장 적절하다.
일 예. n 개의 개별 입력 스트림 Ai:0<k<n 으로 이루어지는 유입(inflow)을 고려한다. 각 스트림은 유형Ti 의 요소의 큐로 이루어진다. 각 스트림이 소비되며, 유형Ti -> Ui 의 반응함수 fi 에 의해 변형되며, n 개의 스트림 Bi 의 유출(outflow)이 존재하며, 각 스트림은 유형 Ui 의 요소의 큐로 이루어진다. 유형Σ Tk→ ΣUk 의 병합함수 m 을 사용하여, 모든 스트림 Bi 를 단일의 스트림 C 로 병합하고자 한다.
Vel 언어로 기재된 세 개의 스트림 사이에서 발생하는 그러한 병합의 일 예다.
B0 = f0 from A0
B1 = f1 from A1
B2 = f2 from A2
C = B0 or B1 or B2
스트림 C 는 B0, B1, B2로부터의 값으로 이루어지며, 생성될 대 인터리브된다. B 스트림은 C 스트림을 구성하는데만 사용하기 때문에, 그 스트림의 내용을 실현하는 것은 의미가 없다는 점에 주목하여야 한다. 그것은 익명의 임시 서브 표현식으로서 쉽게 표현될 수 있다.
C = (f0 from A0) or (f1 from A1) or (f2 from A2)
본 발명은 각 변환함수 fi 의 결정성 유한 오토마톤(DFA) 로의 번역 및 이러한 DFS 의 합집합으로서 병합함수의 한 개의 최소 DFA 로의 변환을 기술한다. 그 결과는 중간 플로우 Bi 의 내용을 실현할 필요없이, 인플로우 Ai 를 아웃플로우 C로 병합하는 최대로 효율적인 수단이다.
이 기술은 반복적으로 적용될 수 있으며, 중간 플로우의 후속 계층을 단일한 반응함수로 융합시킨다. 이것은 Vel 의 경우와 같이 선언적인 데이터플로우 언어에서의 중위(infix) 또는 연산자로 표기되는 병합의 개념과 일치된다.
병합함수가 중간 플로우의 유일한 소비자인 경우라도, 이러한 문제는 브루트 포스 (brute force), 즉, 중간 플로우를 실현시키고, 그것들을 소비함으로서 해결될 수 있다.
병합함수는 유입 및 유출 모두가 동일한 유형일 것을 필요로 하는 경우가 종종 있으며, 유형이 없는 시스템의 경우는 미분화된 유형이어야 한다. 이것은 유형 시스템의 합집합 유형 (합 유형이라고도 함)이 부족하기 때문이다. 데이터플로우 시스템으로의 참 병합의 존재는 합집합 유형의 사용을 필요로 한다.
일부 데이터 시스템은 다중 입력 단일 출력 반응 변환을 구현하는 대신, 진정한 병합이 부족하다. 이러한 것들은 자신의 권한 내에서 유용한 구조이지만, 진정한 병합함수만큼 단순하고 일반적이지 않으며, 완벽하게 최척화될 수 없다.
매칭함수를 DFA 로서 나타내는 것은 그것은 불린(Boolean) 유형의 임의의 표현식으로 표현하는 것보다 더 효율적이다. 각각 자신의 드라이빙 유입을 갖는 다중 매칭 함수의 DFS 는 단일 아웃플로우를 갖는 병합함수를 나타내는 단일하고 효율적인 DFA 를 형성한다. DFA 의 병합은 그 결과가 가능한 조기에, 또는 가능한 한 늦게 매칭되어, 두 개의 상이하고, 잠재적이며, 바람직한 행동을 가져올 수 있도록 행해질 수 있다. 복수의 반응을 단일한 DFA 로 구성하면 최소의 기계가 생성되며, 즉, 최소한의 판단을 사용하여 모든 매칭을 수행하는 알고리즘으로 귀결된다. 최소의 기계는 작은 플랫폼을 위한 복수의 반응의 가장 적절한 구현이다. 최소의 기계는 매칭함수의 복수개의 개별적인 평가에 대해 알고리즘적인 장점을 가지며, 따라서 다른 모든 것이 동일하면, 더 효율적으로 수행된다.
변환 DFA 의 세트를 단일한 DFA 로 병합하기 위해, 정규 표현식에서의 교대를 고려하여야 한다. 정규 표현식을 번역함에 있어서, 구문 a|b 는 교대의 표현이다: a 를 매칭시키거나 또는 b 를 매칭시킨다. 이 경우에, a AND b 는 각각 변환 함수로부터의 DFA이다. 도11에 교대에 대한 서브그래프를 구성하였다.
중간 NFA 가 완료된 후, 그것은 DFA 로 축소시키고 나서 최소 DFA 에 도달할 때까지 DFA 의 상태를 감소시킨다. 그 후, 자동화 상태 머신에서 채용되는 일반적인 종류의 소프트웨어 또는 하드웨어에 의해, 자동화에 적합한 상태-동작 테이블로서 DFA 를 렌더링한다. 이러한 테이블의 수용한 상태는 병합된 데이터 요소가 출력 스트림으로 방출되는 지점을 나타낸다.
DFA 가 이와 같이 자동화되고 입력 스트림의 세트를 제공할 경우, 그 입력과 관련된 원래의 변환함수에 다라 각 입력을 변환시키고, 단일한 출력상으로 함께 인터리브되는 결과를 얻게 될 것이다.
입력 데이터의 복수개의 독립적인 스트림을 출력 데이터의 단일한 스트림으로 병합하는 방법은 (i) 복수개의 잠재적인 입력 데이터 스트림을 식별하는 단계, (ii) 입력 스트림 당 한 개의 변환함수로서, 각 입력 스트림에서 데이터 상에서 실행되며, 그 결과가 서로 병합되는 복수개의 변환 함수를 식별하는 단계, (iii) 복수개의 스트림으로부터 입력 데이터 요소를 동시에 수신하며, 데이터 요소를 단일한 출력 스트림으로 인터리브하는 병합함수를 식별하는 단계, (iv) 각 변환함수를 그 변환을 효율적으로 수행할 DFA 로 번역하는 단계, (v) 변환 DFA 를 변환을 효율적으로 수행하며 그 결과를 단일한 스트림으로 인터리브할 단일한 결합된 DFA 로 병합하는 단계, (vi) 데이터 스트림을 병합된 DFA 에 적용하며, DFA 는 변환 및 병합 작업을 수행하는 단계, 및 (vii) 병합된 출력을 사용을 위한 수신지로 디스패칭하는 단계를 포함한다.
본 발명은 Vel 프로그래밍 언어에서의 소프트웨어를 개발하기 위한 도구 및 관련 방법이다. Vel 은 데이터플로우 프로그램을 표현하기에 유용한 프로그래밍 언어이다. 올바른 데이터플로우 프로그래밍은 많은 도전을 제시한다. 어떤 것은 컴퓨터 프로그래밍의 모든 형태에 대해 공통되는 도전이지만, 다른 것들은 데이터플로우 파라다임에 특유한 것들이다. 이러한 도구는 Vel 프로그램의 많은 영역을 어드레싱한다. (1) 구문론적 및 의미론적 정확성 검사, (2) 논리적 정확성 검사, (3) 지원의 디버깅, (4) 소스코드의 안전하고 휴대가능한 형태 (즉, 패키지화된 코드) 로의 번역, 소스코드 또는 패키지화된 코드의 다양한 컴퓨팅 플랫폼, 특히, 작은 플랫폼에 적합한 원시 및 최적의 이진 형태로의 번역, (6) 패키지화된 코드의 기술 및 그의 서명의 확인, (7) 패키지화된 코드의 배치모두 해석, Vel 소스의 상호적인 해석, (9) 패키지화되거나 원시코드를 실행하기 위한 데이터플로우 환경의 시뮬레이션, 및 (10) 라이브 데이터플로우 환경에서 이진 코드의 원격 실행, 모니터링, 및 제어를 포함한다.
이것들은 Vel 언어내의 소프트웨어를 개발하는 누군가가 완수해야 하는 과제이다. 본 발명은 모든 이러한 영역들에 대해 충분한 지원을 제공하여, Vel 프로그래밍에 능숙한 사람들이 올바르고 유용한 소프트웨어를 생성할 수 있도록 한다.
구문론적 및 의미론적 정확성을 검사하는 것은 모든 형태의 자동화 소프트웨어 번역에 공통되는 작업이다. 논리적 정확성을 검사하기 위한 도구는 일반적으로 번역도구에 포함되지 않는다. 이러한 종류의 도구는 일반적으로 독립적으로 존재하며, 종종 테스트중인 코드에 대한 불완전한 통찰력을 가지고 존재한다.
디버깅은 소프트웨어 개발에 있어서 공통적인 작업이지만, 대부분의 디버깅 도구는 명령형 프로그래밍이 촛점을 맞춘다. 기능성 및 반응성 프로그래밍의 디버깅은 명령형 디버깅과 매우 다른 도전을 제시하기 때문에 훨씬 덜 공통적으로 어드레싱된다. 특히, 이 값들이 종종 디버거 (및 디버깅 프로그래머) 가 살짝 엿볼 수 있는 주소를 가지고 있지 않기 대문에, 이들 언어내의 "in flight" 연산을 검사하는 것이 어려울 수 있다.
복수개의 원시 플랫폼 아키텍처를 목표로 하는 능력은 C 와 같은 시스템 언어의 컴파일러에게는 드문 일은 아니지만, 스크립트 수준의 언어들 사이에서 흔히 발견될 수 있는 능력은 아니다. 스크립트 언어는 컴파일되지 않거나, 부분적으로 컴파일 되거나, 그들의 호스트에 대해서 적시에 (just-in-time) 컴파일(jitted) 되는 경향이 있지만, 교차 컴파일 (한 개의 아키텍처 상에서 실행되지만, 다른 것에 대해서는 코드를 생성하는 컴파일러) 는 흔하지 않다. 특히, 작은 플랫폼상에서 실행을 위한 스크립트 수준의 언어를 컴파일링하는 것은 극히 드물다.
상호작용하는 쉘은 스크림트 언어의 일반적인 특징이다. 예를 들면, 파이썬(python) 은 셀을 구현한다. 실제 또는 시뮬레이션된 데이터플로우 환경에 연결된 셀은 훨씬 덜 일반적이다.
컴파일된 코드의 원격 실행은 일부 운영 시스템의 특징이며 오픈소스이며 상업적인 몇몇개의 제3자 도구에서도 활용가능하다. 이러한 경향은 특히 작은 플랫폼을 목적으로 하지 않지만, 작은 플랫폼을 위한 원격 실행도구의 일부 예가 존재한다. 그것들은 데이터플로우 프로그래밍에만 국한되지 않으며, 원격으로 실행된 프로그램을 개발하기 위하여 사용되는 도구에 포함되지 않는다.
Vel 코드를 개발하기 위한 단일한 집적화된 도구는 Vel 언어로 작업하는 소프트웨어 개발자들에게는 유용하고 편리하다. 도구는 주로 Vel 언어를 번역하는 컴파일러이지만, 또한 Vel 프로그래밍과 관련된 다른 몇몇의 함수 세트도 제공한다. 이 도구로 구문론적 및 의미론적 정확성 테스트와 함께 논리적 정확성 테스트를 실행하는 것은 개발자가 효율적으로 코드의 정확성을 더 높일 수 있다. 논리 테스트는 코드에 대한 컴파일러의 인사이트라는 장점을 가지고 있으며, 진단 메시지가 더 완벽해 질 수 있다. 상호 쉘은 개발자가 코드를 테스트하고 즉각적인 반응을 얻을 수 있도록 한다. 이것은 디버깅 뿐만 아니라 개발에도 유용하다. 쉘은 또한 데이터플로우 환경에 대한 프로그래머 가시성을 제공한다.
작은 플랫폼에서의 사용에 적합한 독립적인 이진의 실행가능한 코드를 생성하는 것은 종종 다양한 소형장치의 복잡한 연산을 실행하는 것에 의존하는 사물인터넷 (IoT) 의 사용사례를 가능하게 한다. 시뮬레이션된 데이터플로우 환경을 제공하는 것은 개발자가 그 코드에서 버그를 해결하고, 논리적인 정확성에 대한 테스트와 함께 패키지가 올바르게 작동한다는 것을 입증한다. 컴파일된 패키지의 원격 실행은, 특히, 원격 플랫폼이 소형인 경우, 대상 플랫폼이 그가 개발중인 것이 아니라고 하더라도, 프로그래머가 단일한 명령내의 대상 하드웨어에 대한 프로그램을 컴파일링하고 테스트하는 프로그램을 대해 신속하게 반복할 수 있게 한다.
어휘적 표현으로부터 중간의 상징적인 표현으로 언어를 번역하고 (1단계 컴파일) 나서 이 중간 표현을 하드웨어를 연산함으로서 실행될 수 있는 형태로 변환하는 단계 (2단계 컴파일).
Vel 의 제1 단계 번역도구는 컴파일러에 공통인 일반적인 전력을 따른다. 특히, (1) 입력 문자열을 분석하여 토큰의 시퀀스로 분해. (2) 토큰의 시퀀스를 분석하여 구문트리를 형성. (3) 트리 내에서 상징적인 선언을 식별. (4) 트리 내에서 상징적인 기준을 식별 및 해결. (5) 공통 하위 표현식 제거 및 상수 폴딩과 같은 초기 최적화. (6) 유형 체크. (7) 최적화 및 심볼 성숙의 추가 단계. (8) 심볼의 완성 및 중간 표현의 방출.
Vel 제1단계 번역기의 구별되는 특징 중 하나는 결정성 유한 오토마톤 또는 DFA 의 사용으로 함수 애플리케이션에 필요한 패턴 매칭을 실행하고 반응을 트리거하는 것이다. 제1단계 번역도구는 (1) 입력 언어를 구문 트리로 변환하는 구문 분석기, (2) 번역 중인 프로그램이 자기 참고를 할 수 있도록 하여, 분석 중인 언어가 DSL 또는 매크로 분석기 방식으로, 분석기에 의해 변조될 수 있는 어휘적인 바인딩 구성요소, (3) 바인딩된 구문 트리를 데이터플로우, 패턴, 반응, 기능적 표현식, 타이머, 및 입/출력 매개변수화를 나타내는 심볼로 번역하는 구문 해석 알고리즘, (4) 표현식 트리를 마이크로프로세서 ALU 명령으로의 다소의 직접 번역에 적합한 스택으로 변환하는 표현 번역기, (5) 반응의 패턴 및 표현을 잠재적으로 최소가 아닌 DFA 의 중간적인 집합으로 번역하는 DFA 생성기, 및 (6) DFA 의 중간 집합으로부터 통일된 최소의 DFA 를 생성하는 DFA 결합 및 축소 알고리즘을 포함한다.
제1단계 번역도구의 출력은 (1) 각각이 복수개의 스트림 중에서 고유한 참조일 수 있도록 번역에 관계된 스트림 각각의 논리적인 아이덴티티, (2) 내부를 향하거나 (반응을 향해, 즉, 외부소스의 구독), 외부를 향하거나 (반응으로부터 벗어남. 즉, 외부 수신지로의 공개), 내부 및 외부를 향하거나 (공개/구독 쌍), 또는 내적인 (다른 반응의 중간 단계로서만 사용되고 공개 또는 구독과 같이 표면화되지 않음) 각각의 스트림 내의 데이터의 플로우의 기재, (3) 스트림으로 삽입되거나 스트림으로부터 추출되는 데이터가 유형 정확성을 위해 정적으로 확인될 수 있도록 유한한 용어로 기술되는, 각 스트림에서 흐르는 데이터의 유형의 기재, (4) DFA 의 상태 및 전이를 기술하는 테이블 세트, (5) 반응동안 실행될 계산을 기술하는 표현식 스택 세트, (6) 스트림 입력을 DFA 입력으로 매핑하는 테이블, (7) 시간이 정해진 이벤트를 DFA 입력으로 매핑하는 테이블, DFA 출력을 동작쌍으로 매핑하는 테이블로서, 각 쌍은 표현식 스택 및 스트림 출력에 대한 기준으로 구성되며, DFA 의 출력이 주어진 표현식에 의해 변환된 후, 주어진 스트림으로 푸시될 것을 나타낸다.
Vel 해석기 및 데이터플로우 시뮬레이터는 제1단계 번역의 출력을 직접 사용한다. 해석기는 코드의 실행시에 하드웨어 플랫폼을 모방하고, 데이터플로우 시뮬레이터는 스트리밍 데이터 환경을 모방하여, 입력을 Vel 스트림에 제공하고, Vel 스트림으로부터 출력을 수집한다. 이러한 두 작업을 명령 해석 및 데이터플로우 모방이라고 부르기로 한다.
명령어 해석은 컴파일러와 해석기 작성을 전문으로 하는 컴퓨터 프로그래머에게 잘 이해되는 작업의 카테고리이다. 이 작업은 런타임 변수의 상태가 저장될 수 있는 실행 컨텍스트를 구성하는 단계와 프로그램의 명령어를 통해 한번에 한 단계씩 나아가는 단계, 실행 컨텍스트로부터 데이터에 접근하는 단계, 및 필요에 따라 그것을 업데이트 하는 단계를 포함한다.
Vel 의 경우에, 실행 컨텍스트는 또한, 변환 과정에서 데이터의 스트림을 유지하기 위한 큐의 세트 및 DFA 에 의해 기술된 변환을 실행하기 위한 테이블로 구동되는 상태 머신 엔진을 포함해야 한다. 큐는 데이터의 흐르는 채널을 기술하는 Vel 소스에서의 선언으로 인해 야기된다. 이들 중 일부는 Vel 프로그램의 외부 입력 또는 출력이며, 다른 것은 입력 및 출력간의 중간 상태를 기술하는 순수한 내부 채널이다.
데이터플로우 모방은 외부 소스 및 파일 또는 소켓과 같은 데이터용 싱크에의 액세스, 이러한 외부 시스템들 사이에서 데이터를 교환하기 위하여 필요한 프로그래밍, 및 해석중인 Vel 프로그램으로 이루어진다. 이것은 외부 소스로부터 데이터를 읽고, 그것을 프로그램 입력을 나타내는 큐로 푸시하는 주입기 (injector) 기능 및 프로그램 출력을 나타내는 큐로부터 데이터를 출력하여 외부 싱크에 기입하는 추출기 (extractor) 기능을 가질 것이다.
본 발명에 따른 Vel 해석이 표준과 다른 것은 DFA 가 관여하는 방식에 있다. 상태 머신 엔진은 큐로부터 데이터를 읽고 그것을 사용하여 그들의 DFA 의 상태를 진전시킨다. DFA 테이블은 DFA 가 그 상태를 통해 이동할 때 실행되는 부작용의 칼럼을 포함한다. 이러한 부작용은 명령해석을 호출하여 연산을 실행하며, 그 결과가 다른 큐로 푸시되며 이것이 다른 DFA 를 트리거한다.
이러한 방식으로, 본 발명에 따른 해석중인 Vel 프로그램이 우선 빠르고 소형인 상태 머신 세트에 의해 표현되고 필요할 때 일반적인 명령 해석으로만 복귀한다. 모든 것이 명령 해석으로만 모두 처리되는 것보다 더 효율좋게 프로그램이 실행될 수 있도록 한다.
Vel 의 제2단계 번역도구는 대부분이 Vel 언어에만 특유한 것이 아니라, 실행 대상인 플랫폼이다. 제2단계 번역기의 Vel 언어 관련 구성요소는 (1) 제1단계에 의해 생성되는 중간 표현의 초기 섭취량, (2) 반응 시스템을 생성하기 위한 제2단계 코드 생성의 전반적인 조직, (3) 데이터 포맷 또는 실시간 클록의 내부 규칙의 외부 부호화 및 복호화를 실행하는 것과 같은, 런타임 지원 구성요소의 라이브러리의 제공이다.
다중 소스, 다중 목적지 데이터플로우 환경에서 데이터 스트림의 실시간 처리를 위한 프로그램을 만드는 도구는 (1) 복수개의 잠재적인 데이터 스트림을 식별하는 단계, (2) 스트림 내부의 데이터의 패턴에 대응하는 반응 함수 및 매개변수의 세트를 식별하는 단계, (3) 선언된 패턴과 일치하는 데이터를 변환하기 위한 처리함수 및 매개변수 세트를 식별하는 단계, (4) 데이터가 수집되거나 버려지는 시간 간격 또는 데이터가 수집되거나 버려지기 전 또는 후의 특정한 시각과 같이 데이터플로우의 패턴이 비교되는 시간이 정해진 이벤트 세트를 식별하는 단계, (5) 식별된 스트림, 반응, 함수, 및 시간이 정해진 이벤트를 기술하는 데이터플로우 프로그램을 생성하는 단계, 대응하는 DFA 로 Vel 프로그램 선언을 번역하는 DFA 생성기를 포함하는 제1단계의 번역도구 및 플랫폼 상에서의 실행을 위한 번역된 Vel 선언에 대응하는 플랫폼 특유의 하드웨어 명령을 생성하는 제2단계의 번역도구를 포함하는 2단계 번역도구에 입력으로서 프로그램을 제공하는 단계, 및 (7) 번역도구의 각 단계의 출력을 수신하는 단계를 포함한다.
제1단계의 번역도구의 출력은 해석기 구성요소에 의해 사용될 수 있으며, (1) 코드의 실행시에 하드웨어 플랫폼을 모방하는 명령 해석기, (2) Vel 스트림에 입력을 제공하고, Vel 스트림으로부터의 출력을 수집하는 스트리밍 데이터 환경을 모방하는 데이터플로우 시뮬레이터를 포함한다.
제1단계 번역도구의 출력은 제2단계 번역도구에 대한 입력으로서 사용될 수 있으며, (1) 중간 표현으로부터의 명령을 대상 하드웨어 플랫폼에 의한 실행에 적합한 형태로 번역하는 하드웨어 명령생성기, (2) 데이터플로우환경에서의 반응 프로그램으로서 사용하기에 적합한 형태로 출력의 생성을 지시하는 프로그램 구성모듈, (3) 실행에 필요한 실시간 지원 구성요소의 라이브러리를 포함한다. 제2단계의 번역도구의 출력은 대상 하드웨어 플랫폼에서 사용하기에 적합한 실행프로그램이다.
다양한 타입의 데이터 스트림 셋트와 이러한 스트림 내에서 데이터의 특별한 패턴에 반응하고 조절하기 위한 기능적 수단의 세트가 주어지면, 본 발명은 이러한 기능을 데이터가 스트림에 도착하면 적절하고 효율적으로 호출되도록 이러한 기능을 기술하고 변환하는 기술이다.
이러한 종류의 문제를 해결할 필요성은 모든 형태의 데이터플로우 프로그래밍에 공통적으로 나타난다. 이것은 내장된 장치내의 이벤트의 흐름과 같은 아주 소규모의 아키텍처뿐만 아니라 기업 데이터 센터들 내부 또는 기업 데이터 센터들 간의 데이터의 흐름과 같은 아주 대규모의 아키텍처에 적용가능하다.
본 발명은 데이터플로우 프로그래밍의 모든 도메인에 적용가능하지만, 일치가 감지될 수 있는 속도와 적용되는 핸들러 함수가 가장 중요하고 실행에 전념할 수 있는 제한된 저장소 및 컴퓨팅 리소스가 존재하는 상황에서 가장 적절하다.
일 예. 예를 들면, 주어진 정수 스트림으로부터, 우리는 한 개 이상의 0 이 뒤따르는, 한 개 이상의 0이 아닌 값을 일치시키고자 한다고 가정한다. 이러한 패턴이 일치되면, 우리는 0이 아닌 값들의 합을 연산하고 그 결과를 다른 스트림에 기입하고자 한다.
우리는 정규식 같은 표기법으로 이러한 문제의 패턴 일치부분을 기입한 후, 산술식으로 합의 연산을 별도로 기입할 수 있다. 이것이 발생되면, 에지컴퓨팅에서 데이터 애플리케이션에 사용하도록 디자인된 Vel 프로그래밍 언어는 통일된 표기법으로 전체적인 변환을 기입할 수 있도록 할 수 있다.
stream foo is int
p = pn a:{!= 0}.., :0.. -> sum(a)
bar = p(foo)
첫번째 줄에서, foo 가 정수 스트림이라는 것을 선언한다. 두번째 줄에서, p 가 0이 뒤따르는 0이 아닌 값들과 일치하고, 0이 아닌 값들의 합을 연산하는 패턴이라고 정의한다. 세번째 줄에서, p 를 foo 에 적용하여, 새로운 스트림 바를 정의하며, 그 적용의 결과가 푸쉬될 것이다.
이 기술은 상기한 패턴을 상태 머신으로 번역한다. 그런다음, 상태 머신을 기반으로 결정성 푸시다운 오토마톤으로서의 일치를 구현하고 결과 매치들을 합계 표현에 공급한다.
상술한 예에서 기술된 이러한 종류의 문제는 두 개의 함수를 생성함으로서 해결될 수 있다. 매칭을 위한 함수와 매치가 발견된 이후 결과를 연산하는 함수이다. 매칭함수는 입력으로서 스트림으로부터의 데이터 윈도우를 입력으로서 받아들이고, 매치에 대한 "참" 및 비매치에 대해 "거짓"을 반환한다. 매치가 발견되면, 데이터 윈도우는 결과연산 함수로 전달되어 출력을 생성한다.
데이터가 윈도우를 통해 흐름에 따라, 매칭 함수는 매치가 발견될 때까지 반복적으로 적용되어야 한다. 그러므로 효율이 매칭 함수가 실행할 수 있는 속도로 제한된다. 특정한 호출에 있어서 매칭함수에 의해 연산된 임의의 값은 일반적으로 나중의 호출에서는 재사용되지 않으며, 매치가 발견된 경우의 결과 연산합수에 의해 사용가능하지도 않다. 가능한 유용한 중간 연산의 결과가 불충분게 유지되는 것은 잠재적으로 현저한 비효율을 가져온다.
이들 두 함수의 배열은 스트림 처리가 스트리밍 SQL 과 같은 언어로 지정된 경우 손쉽게 발생한다. 스트리밍 SELECT 선언의 WHERE 절은 매칭 조건을 기술하는 Boolean 표현식을 제공하며 매칭 함수는이 표현식을 직접 컴파일한다. SELECT 의 product 절에서 명명된 값들의 튜플은 출력 생성함수를 정의하기 위한 기초를 제공한다.
매치를 수행하기 위해 상태 머신을 사용하는 것이 복수개의 임의의 Boolean 연산식을 반복적으로 적용하는 것보다 더 효율적이다.
본 발명은 함수의 매개변수를 선언하는 패턴 기술언어로부터 상태 머신을 도출한다. 도출된 상태 머신은 종래 Boolean 연산식 매칭 함수보다 데이터 스트림에서 더 효율적으로 매치를 검출한다.
도출된 상태 머신은 또한 데이터 스트림에서 검출된 매치에 기초하여 출력을 생성하기 위한 핸들러 함수 세트를 구현할 수 있다. 복수개의 매칭 및 대응하는 핸들러함수는 동시에 많은 패턴에 대한 매치를 효율적으로 인식하고 동시에 많은 종류의 출력을 생성하는 한 개의 상태 머신으로 결합되거나 감소될 수 있다.
정규 표현식 및 값 표현식의 태양을 결합하는 스크립트는 중요한 중간 계산의 결과를 보유함으로서 패턴을 효율적으로 매치시키고 출력을 연산할 수 있는 결정성 상태 머신으로 자동적으로 번역될 수 있다. 그 결과로서 결합된 매칭/연산 알고리즘은 패턴 매칭 또는 출력생성의 개별적인 조직보다 더 효율적이다.
그러므로, 전반적인 접근은 (1) 정규식과 같은 표기법을 사용하여 매칭을 지정하며 기능적인 표현식과 같은 표기법을 사용하는 이러한 매치에 기초한 출력연산을 지정하는 소스 스크립트로부터 시작하고, (2) 스크립트의 정규 표현식 부분을 문법법칙 세트로 번역하고, 스크립트의 기능적 표현식 부분은은 이러한 문법 규칭의 속성 세트로 번역하며, (3) 문법과 속성으로부터 상태 머신을 생성하고, (4) 매치될 입력을 유입하고 결과를 유출할 푸시다운 오토마톤으로 상태기계를 구현한다.
기술은 시간상 전방최우측(1) 패턴 매칭 또는 TFR(1) 이라 불린다. 이하의 논의는 TFR(1) 패턴 매칭 상태 머신 및 어떻게 그것을 적용하여 단계4를 수행할 것인지에 대한 상세내용을 기술한다. 다음 섹션은 단계3의 목표에 따라 어떻게 문법을 TFR(1) 상태 머신으로 번역하는지 (즉, 문법 및 속성으로부터 상태 머신의 생성) 를 기재한다.
소스 스크립트를 문법 규칙과 속성 세트로 번역하는 특별한 방법은 소스 스크립트 언어 자체에 반드시 의존하게 되며, 이 문서의 범위를 벗어난다. 문법 규칙과 속성의 사용은 컴퓨터 언어 구현에 있어서 일반적인 기술이기 때문에, 제2단계가 구현자에게 너무 큰 장애물을 제시하지 않을 것이라는 것을 가정하는 것이 합리적이다.
TFR(1) 패턴 매칭
본 섹션에서, TFR(1) 패턴 매칭, 문맥자유 문법의 큰 클래스에 기반하여 입력을 스트리밍하는 패턴을 효율적으로 인식하기 위하여 사용될 수 있는 기술을 제시한다. 약자는 본 기술의 시간 인식 본질을 의미하는 "Timed forward right-most (1)"을 나타내며, (시간에 대해) 순방향으로 입력을 스캔하며, 최우측의 구문론적 도출을 생성하지만, 한번에 오직 한 개의 입력 토큰만을 볼 수 있다.
개요. TFR(1) 패턴 매처(matcher) (이하, 간단히 “매처” 라고 한다) 의 목적은 출력의 스트림을 생성함으로서 입력의 스트림에 반응하는 것이다. 예상된 입력의 패턴이 시간적으로 선행하여 기재되며, 매처는 그 패턴을 일치시기기 위해 미리 만들어진다. 입력패턴과 매칭시킨 후, 매처는 매칭된 입력에 기초하여 한 개 이상의 출력을 생성한다.
TFR(1) 매처는 몇가지 주목할 만한 특징으로 갖는다: (1) 매처는 일치될 패턴 및 응용될 변환을 기술하는 문법 규칙세트로부터 알고리즘적으로 구성될 수 있다. (2) 매처는 매칭하는 동안 타임아웃의 개념을 통합할 수 있으며, 시간의 경과에 따라 매치가 진행된다. (3) 매처는 임의의 모호하지 않은 문맥자유 문법으로부터 알고리즘적으로 구성될 수 있다. (4) 매처는 작고 효율적이며, 한정된 저장소 또는 저가의 프로세서, 또는 둘 다를 갖는 컴퓨터 상에서 구현하기에 적합하다. 입력을 매칭시키는데 최소수의 단계가 필요하다. 매처는 역추적없이 동작하며, 입력에서 엄격하게 전방으로 이동하므로, 흐르는 스트림을 처리하기에 적합하다. (6) 매처는 가능한 한 빨리 일치하지 않는 (오류가 있는) 입력을 검출하며 그것들을 빨리 전방으로 감아서, 입력 스트림으로 다시 동기화하고, 매칭을 재개한다. (7) 입력 시퀀스를 매칭시킨 후, 매처는 임의의 함수에 대한 인수로서 매칭 데이터를 사용하며, 그 결과는 출력으로서 생성될 수 있다.
시간을 갖는 무한한 구문 스트림에서 흐르는 데이터는 구문적으로 분석될 수 있다. 이러한 접근은 컴퓨터 소스크도를 파싱하는데 사용되는 구문해석의 종류와 유사하다. 실제로, TFR(1) 은 표준 LR(1) 파싱 알고리즘과 유사하며, 표준 LR(1) 및 일반적으로 구문 분석에 대한 친숙함은 TFR(1)에 관심있는 다른 독자들에게 도움이 될 것이다.
스트림은 두 가지 방식으로 파일과는 다르다. (1) 스트림에 있는 각 데이터 요소는 그것이 스트림으로 들어가는 특정한 시간과 (묵시적 또는 명시적으로) 관련이 있지만, 파일에 있는 데이터 요소는 그것관 관련된 특별한 시간을 가지지 않는다. (2) 스트림은 명시적인 끝을 가질 필요가 없지만, 무한정으로 흘러갈 수 있고, 반면에 파일은 고정된 크기를 가지며, 항상 그 끝이 예상될 수 있다.
대부분의 다른 파싱 알고리즘과 공통적으로, LR(1) 은 파일상에서 동작하는 것을 의미한다. 그것은 시간을 고려하지 않고, 정확한 작동을 위해 파일 끝의 마커에 의존한다. 하지만, TFT(1) 은 입력스트리밍과 함께 사용할 것이 의도된다. 시간을 인식하지만, 파일 끝 마커를 필요로 하지 않는다.
입력
입력큐는 한번에 하나씩 처리될 입력되는 이산 이벤트의 선입선출방식, 비종결 시퀀스이다. 이것은 네트워크 소켓, 직렬 포트, 메모리 내 구조, 또는 무한 큐 또는 스트림의 개념의 다른 물질적 또는 추상적인 구현일 수 있다. 이 매처의 목적은 이 스트림에서 패턴을 인식하는 것이다.
각각은 토큰이 큐로 들어온 시간을 표시하는 스탬프 및 가능하다면 일부 다른 정보를 전달한다. 세 종류의 이벤트가 존재한다. 토큰, 간격, 및 중단
토큰은 해설될 데이터를 전달하는 이벤트이다. 이것은 가장 일반적인 종류의 이벤트이므로, 용어 "이벤트" 와 "토큰" 은 종종 같은 의미로 사용된다. 토큰에 의해 전달되는 데이터 요소는 임의의 강한 데이터 유형의 일 예 일 수 있으며, 특정한 입력큐의 모든 토큰은 동일한 종류의 데이터를 전달한다. 일반적으로 토큰은 (매처가 와이어 포맷을 해독하거나 단어를 인식하는 경우) 단일 바이트 또는 문자, 또는 (매처가 센서로부터 다방향성 데이터를 분석하는 경우) 다중값 데이터 레코드를 전달한다.
어떤 경우에는, 토큰 유형의 가능 한 상태의 수가 매우 크다. 256개의 가능한 상태만을 갖는 8비트 바이트의 경우가 아니라, 32비트 정수 또는 많은 필드로 구성된 레코드와 같은 더 큰 유형의 경우이다. 이 경우에, 토큰 분류자 함수를 제공하는 것이 종종 필요하다. 토큰이 주어질 경우, 분류자 함수는 토큰이 속하는 클래스를 반환시킨다. 예를 들면, 패턴은 0과 0이 아닌 32비트 정수의 두 클래스를 수반한다. 드라이버는 실행할 동작이 무엇인지를 결정할 때 토큰 자체 대신에 토큰의 클래스를 사용한다.
간격 (lapse)은 스탬프 이외에 데이터를 전달하지 않는 이벤트이다. 본질적으로 시간의 흐름만을 나타내는 "nonevent" 이다. 입력큐에 이러한 종류의 이벤트를 포함하는 것은 보고할 데이터가 없는 경우에도 이벤트를 적극적으로 수신하는 입력큐와 아무것도 수신하지 않는 것을 구분하기 때문에 유용하다.
중단 (break) 은 입력큐의 순간적인 중단을 나타내는 이벤트이다. 매처는 작업중인 부분 일치를 끝내고 그 출력을 즉시 보고함으로서 "중단" 에 대응한다. "중단" 은 입력의 끝 마커가 아니며, 추가적인 이벤트가 (일반적으로) 중단을 뒤다를 수 있다. 이것은 단순히 임의대로 입력 스트림으로 주입되어 매처의 동작을 가속화시키는 이벤트일 수 있다.
규칙 일련의 규칙으로서 문법을 기재한다. 각각의 규칙에서, 축약은 왼쪽에 나타나며, 기호의 시퀀스는 오른쪽에 나타난다. 각 기호는 토큰 또는 축약이다. 예를 들면,
(r1) E → E '+' E
(r2) E → num
이러한 두 개의 규칙은 토큰 num 및 "+" 와 축약 E 로 이루어진 언어를 기술한다. r1 에 의하면, 입력에 숫자(num) 이 나타날 때 마다, 그것은 E 라고 간주될 수 있다. r2 에 의하면, 입력에서 E+E 의 시퀀스를 볼때마다, 세 개의 심볼이 새로운 E 를 구성하는 것으로 간주할 수 있다. 그러므로, 시퀀스 num, num+num, 및 num+num+num 은 모두 유효한 언어의 문장이다.
또한, 룰은 공백일 수 있으며, 그것은 오른쪽에 기호가 존재하지 않는다는 것을 의미한다. 이것은 특히, 구문의 특정한 부분이 선택적으로 간주될 수 있는 상황에서 유용하다. 예를 들면,
(r3) L → L 'x'
(r4) L → λ
공백을 나타내기 위해 오른쪽에 소문자 람다를 기재한다. 이 경우에, 축약 L 은 "x" 가 뒤따르는 자기자신으로 구성되며 (r3 참조) 그렇지 않으면 아무것도 없다 (r4 참조). 그러므로, 시퀀스 x,x,x 및 xxx 는 모두 유효한 언어의 문장이다. 빈 문장 또는 L 이 그것과 매칭하기 때문에, 유효한 언어의 문장이다. 공백의 규칙을 타임아웃으로 지정하는 것도 가능하다. 예를 들면,
(r5) C → C 'x'
(r6) C → τ5
이 언어의 C 축약은 상기한 언어의 L 축약과 매우 유사하다. 하지만, L 은 무한정 x 를 수집하는 반면, C 는 한정된 시간 동안만 x 를 수집할 것이다. 여기에서 시간의 양은 5개의 단위로 주어진다. 단위는 임의의 편리한 시간 측정일 수 있다. 실제로, 타임아웃은 밀리초 단위로 주어질 수 있다. 여기에서 차이점을 이해하기 위해서는, 시간 스탬프를 갖는 입력 시퀀스를 고려해 보야야 한다.
1000 'x'
1001 'x'
1002 'x'
1003-1009 no input
1010 'y'
여기서, 세 개의 x가 연속적으로 도착하고, 다음은 소강상태, 그리고 나서 "y" 가 도착한다. y의 출현은 x의 문자열의 끝을 나타낼 것이므로, 이 입력에 배치시키기 위하여 r3 과 r4 를 이용하여, 매처는 시간 1010에서 L을 보고한다. 하지만, 시간의 경과만으로 축약을 호출하기에 충분하기 때문에 r5 과 r6 을 이용하여, 매처는 시간 1005에 C 를 보고한다.
직관적으로, 람다규칙 (타임아웃이 없는 공백의 규칙) 은 무엇을 할지 결정하기 전에 다음 토큰을 볼 수 있을 때까지 대기하며, 그것은 무한정 대기할 것을 의미한다. 타우 규칙 (타임아웃이 있는 공백의 규칙) 도 또한 다음 토큰을 기다리지만, 토큰이 충분이 빨리 나타나지 않으면, 이 규칙은 그것이 없는 상태에서 동작하기로 결정할 것이다.
속성. 속성은 문법 규칙 셋트 상에 정의된 함수이다. 매처가 축약을 실행하기 위해 규칙을 적용함에 따라, 그 규칙의 속성함수를 적용한다. 그 결과는 또 다른 속성을 연산하거나, 매처의 출력이 되거나, 또는 양자 모두를 행하기 위해 사용될 수 있는 값이다. 이 과정은 속성합성이라고 불린다. 상기한 예시 언어 중 한 개를 다시 살펴보기로 한다.
(r1) E → a:E '+' b:E
(r2) E → a:num
여기에서 인식중인 언어는 이전 예로부터 변경되지 않았지만, 그 기호에 명시적인 이름을 붙였다. 이러한 이름을 속성의 정의를 위해 사용할 수 있다.
int val {
r1: a,
r2: val(a) + val(b)
}
여기에서, int 형태의 값을 생성하는 속성 val 을 정의한다. r1 이 적용될 경우, val 값은 단순히 숫자 a 로 정의되며, 이것은 입력 스트림으로부터 취해지는 문자그대로 숫자를 나타낸다. r2 가 적용될 경우, val 값 은 반복적으로 정의되어, a 와 b의 val 을 평가하고, 그 결과를 합산한다. 기호 a 와 b 는 E 의 일 예다.
직관적으로, 속성합성은 개개의 토큰 (또는 토큰 그 자체) 으로부터 유도될 수 있는 값으로 시작한다. 합성은 매처가 규칙을 적용하고 축약을 생성함에 따라, 합성이 더 큰 범위의 연산을 향해 진행된다. 상위레벨 축약의 속성은 직, 간접으로 그것이 걸쳐져있는 토큰의 일부 또는 전부에 의존한다.
강화된 문법 및 재시작 강화된 문법은 정확하게 한 개의 오메가 규칙을 포함하는 문법이다. 오메가 규칙은 오른쪽에는 정확하게 한 개의 기호만을 두고 왼쪽에는 특별한 오메가 기호만을 두는 것을 제외하고 일반적인 문법 규칙과 유사하다. 예를 들면,
오메가 규칙 r0 를 부가하여, 이전 예로부터 문법을 강화하였다.
(r0) Ω → E
(r1) E → E '+' E
(r2) E → num
문법 규칙 중 오메가 규칙은 매처가 어디서 시작하고 어디서 끝나는지를 알려준다. 일단 시작되면, 매처는 오메가 규칙 우측의 심볼을 매칭시키기 위해 시도한다. 이 경우, r0 는 매처가 초기에 축약 E 를 매칭시키려고 시도할 것이라고 말한다.
오메가 규칙 우측의 기호를 매칭시킨 후 (또는 그것을 매칭시키는 것에 대한 실패로부터 회복한 후), 매처는 자동적으로 재시작하며 그 기호를 다시 매칭시키려고 시도한다. 매처는 무한정 오메가 규칙을 매칭시키는 것을 계속한다.
입력큐에서 중단 이벤트는 매처가 현재 진행중이거나 진행할 임의의 람다 또는 타우 규칙을 받아들이게 하여 즉시 오메가 규칙으로 축소시킨다. 그 후, 매처는 중단 이후에 이벤트를 허용하기 위해 재시작한다.
오메가 규칙은 정확하개 한 개의 속성의 정의에 나타나야 한다. 이러한 속성은 다음 섹션에서 기술되는 바와 같이, 매처의 출력을 연산하기 위하여 사용된다.
출력. 출력큐는 출력되는 이산 이벤트의 선입선출방식, 비종결 시퀀스이다. 출력큐는 입력큐의 개념과 유사하지만, 그것을 향해 들어오는 것이 아니라 매처로부터 유출된다. 입력큐와 유사하게, 출력큐는 네트워크 소켓, 직렬 포트, 메모리 내 구조, 또는 무한 큐 또는 스트림의 개념의 다른 물질적 또는 추상적인 구현일 수 있다. 이 매처의 목적은 이 큐에 이벤트를 보내는 것이다. 매처는 결코 출력큐로부터의 독출을 시도하지 않는다.
출력큐의 각 이벤트는 매처가 이벤트를 생성하는 그 순간을 표시하는 스탬프를 포함한다. 각 이벤트는 또한 임의의 강한 데이터 유형의 일 예일 수 있는 데이터 요소를 전달하며, 특정한 출력큐에서, 모든 이벤트는 동일한 유형의 데이터를 전달한다. 이것은 입력큐에서의 이벤트와 동일하거나 다른 유형일 수 있다.
매처가 오메가 룰에 의해 축소될 때, 매처는 오메가 룰의 속성(만을) 평가하며, 그 결과를 이벤트로서 출력큐에 푸쉬한다. 이와같이 생성된 출력이벤트는 가장 최근의 입력 이벤트와 동일한 스탬프를 갖는다.
아키텍처. 도14는 TFR(1) 패턴 매처의 구성요소를도시한다. 각각의 TFR(1) 매처는 입력큐(1405), 출력큐(1412), 드라이버 프로그램(1419), 상태 스택(1426), 및 상태 테이블(1433)으로 이루어진다.
매처는 입력큐의 맨 앞부분에 독출위치를 유지한다. 큐의 전방으로부터 한번에 한가지씩 이벤트가 팝된다. 이 매처는 입력큐에서 앞을 보지 않고, 그 독출위치를 큐의 이전 지점으로 되감으려고 시도하지 않으며, 이벤트를 입력큐로 푸시하려고도 하지 않는다. 입력의 한번에 하나씩, 전방만, 독취만은 처리는 효율적인 처리의 실시간 스트림을 효율적으로 처리하기에 적합한 TFR(1) 의 일부이다.
드라이버 프로그램은 모든 매처에 대해 동일한다. 이것은 별도의 테이블에서 정의된 상태에 의해 구동되는 푸시다운 오토마턴이다. 드라이버 프로그램용 알고리즘이 이하에 제시된다. 드라이버 프로그램의 각 구현은 호스트 하드웨어, 운영 시스템 플랫폼, 및 그 환경의 다른 특성에 특유하지만, 드라이버는 매칭될 패턴에는 특유하지 않다. 드라이버 프로그램은 항상 동일하며, 매칭될 패턴에 특유한 상태 테이블이다.
드라이버는 상태 스택을 사용하여 상태 테이블에 의해 정의된 상태를 통해 진행중인 상황을 추적한다. 스택 상의 첫번째 항목은 항상 테이블 내에서의 첫번째 상태에 대한 참조로 이루어진다. 스택상의 각각의 후속 항목은 테이블의 일부 상태에 대한 참조, 상태가 해결되어야 하는 데드라인, 및 입력큐로부터 취해진 토큰 또는 문법 규칙의 좌측으로부터 취해진 축약으로 이루어진다.
상태 스택상의 축약은 그 규칙으로부터 연산될 수 있는 속성과 연관된다. 새로운 축약이 적용될 준비가 되면, 스택의 최상단의 상태는 새로운 축약과 연관되는 속성 정의함수를 적용하기 위하여 사용되는 호출 프레임을 제공한다. 이런 방식으로, 상태 스택은 또한 함수 호출 스택이다. 이것은 또한 중간연산의 결과가 자동적으로 이후의 사용을 위해 보유되지만, 더이상 잠재적인 관심이 존재하지 않으면 (스택이 팝되는 경우) 또한 버려진다는 것을 의미한다.
상태 테이블을 매칭될 패턴과 생성될 출력을 기술하는 문법 규칙과 속성 세트로부터 알고리즘적으로 생성된다. 테이블을 생성하는 방법이 이하에 기재된다. 일단 생성되면, 상태 테이블은 변하지 않는다. 드라이버 프로그램이 테이블에 의해 안내되지만, 테이블을 변경하지는 않는다. 실제로, 드라이버 프로그램의 몇몇 예는 동일한 상태 테이블을 공유할 수 있다. 만약 누군가가 동일한 패턴을 복수개의 입력 스트림에서 일치시키기고 복수의 출력 스트림을 생성하기를 원한다면, 이것은 유용한 구성일 수 있다.
상태 테이블은 각각이 파싱 상태를 정의하는 유한한 수의 행으로 구성된다. 파싱 상태는 문법으로 구동되는 패턴 매칭의 의사결정 과정에서 명확한 점을 정의하는 추상적인 개념이다. 각 파싱 상태는 세 개의 부분으로 이루어진다: 동작, 전이, 및 타임아웃 값.
파싱 상태의 동작은 각 토큰 값을 드라이버에 의해 취해질 동작에 매핑시키는 것이다. 드라이버는 메인 루프에서 테이블의 이 부분을 사용한다. 테이블의 이 섹션은 문법의 토큰에 의해 또는 토큰이 그룹화되는 클래스에 의해 조율된다. 중단 이벤트는 또한 테이블의 이 섹션에서의 키이다.
파싱 상태의 전이는 각 종류의 기호를 파싱 상태에 매핑한다. 드라이버는 축약 동작을 실행할 경우, 테이블의 일부를 사용한다. 테이블의 이 섹션은 문법의 축약에 의해 조율된다.
파싱 상태의 타임아웃은 드라이버가 그 상태로 남겨지는 것을 허용하는 최대한의 시간의 양을 나타낸다. 이것은 (일반적으로) 명시적으로 무한하며, 드라이버는 이 상태에서 임의의 시간의 양을 보낼 수 있다는 것을 의미한다.
드라이버 알고리즘. 드라이버는 단일한 항목을 포함하는 스택으로 시작한다. 항목은 시작 상태 (항상 s0 로 표기됨)을 나타내며, 시작시간 + s0 의 타임아웃을 합친 것과 동일한 데드라인을 갖는다. 이 첫번째 스택 항목은 관련된 기호를 가지지 않지만, 나중 항목들은 토큰 또는 축약을 전달할 것이다.
그 후, 드라이버는 주된 루프로 들어가서 무한정 반복한다. 각 반복의 시작시에, 드라이버는 스택 최상의 항목 및 입력큐의 전방의 이벤트를 쳐다본다.
드라이버는 현재 이벤트의 스탬프를 현재 스택 항목의 데이라인과 비교한다. 스탬프가 데드라인 보다 크거나 같으면, 상태는 만료되고, 드라이버는 즉시 상태를 떠다도록 해야 한다. 만료된 상태에서, 그 이벤트가 실제 어떠한 유형인지 관계없이, 드라이버는 중단으로서 현재 입력을 취급할 것이다.
현재 이벤트가 간격 (및 현재 상태가 만료되지 않은) 경우, 드라이버는 단순히 그것을 버리고 (이하 참조) 메인 루프의 최상단으로 복귀한다. 간격은 상태가 만료되는 것을 허용하는 것 이외의 어떤 다른 목적으로 사용되지 않는다.
현재 이벤트가 토큰 또는 중단 이라면 (또는 현재 상태가 만료되고 현재 이벤트를 중단으로서 다루고 있다면), 드라이버는 현재 상태의 동작 부분에서 취할 동작을 찾는다. 동작은 입력큐를 다음 토큰으로 진행시키고, 스택을 푸시 또는 팝 하거나, 출력큐로 푸시하거나, 또는 이들의 조합을 행한다. 동작을 행한 후에, 드라이버는 메인 루프의 최상단으로 복귀한다.
드라이버가 행할 수 있는 다섯 종류의 동작이 있다. 이동, 폐기, 감소, 재시작, 또는 패닉. 각 반복에서, 드라이버는 이들 중 정확하게 한가지만 실행한다.
이동동작은 상태에 대한 기준으로 이루어진다. 이 상태는 드라이버가 입력큐로부터 현재 이벤트를 나타날 수 있게 하며, 큐를 다음 이벤트로 진행시킨다. 이 이벤트는 토큰이어야 하며, 드라이버는 간격(lapses) 또는 중단을 이동하지는 않는다. 그 후, 드라이버는 동작이 나타내는 상태, 새로운 데드라인, 및 팝된 토큰으로 이루어지는 새로운 항목을 스택으로 푸시한다. 새로운 데드라인은 현재의 데드라인 또는 이벤트 플러스 상태의 타임아웃의 스탬프 중 작은 것과 동일하다.
폐기 동작은 드라이버가 입력큐로부터 현재 이벤트를 나타날 수 있게 하며, 큐를 다음 이벤트로 진행시킨다. 드라이버는 동일한 상태를 유지한다, 이것이 간격과 실제 중단에 발생하는 것이다.
축소동작은 문법규칙에 대한 기준으로 이루어진다. 축소동작은 세 개의 구문, 즉, 합성, 스택으로부터 팝(pop)됨, 스택으로의 푸시에서 일어난다.
합성. 드라이버는 적용되는 룰의 속성을 평가한다.
스택으로부터 팝하기. 드라이버는 스택으로부터 한 개 이상의 항목을 팝하게 한다. 팝하는 항목의 수는 적용되는 규칙의 우측의 길이에 의해 주어진다. 팝 이후의 스택의 맨위의 상태를 P 라고 부르고, 적용된 규칙의 좌측의 기호를 L 이라고 부른다.
스택으로의 푸시. 드라이버는 새로운 상태 N 이 주어지만, 상태 P의 천이에서 기호 L 을 찾는다. 그 후, 드라이버는 상태 N, 새로운 데드라인, 및 기호 L로 이루어지는 새로운 항목을 스택으로 푸시한다.
재시작 동작은 세 개의 구문, 즉, 합성, 스택 리셋, 및 중단 폐기에서 일어난다.
합성. 드라이버는 오메가 규칙의 속성을 평가하고 그 결과를 출력큐로 푸시한다.
스택 리셋. 드라이버는 스택으로부터 모든 항목을 제거하고 새로운 시작 항목을 푸시한다. 새로운 항목은 s0 에 대한 기준, 입력 이벤트 플러스 s0 의 타임아웃의 스탬프와 동일한 데드라인으로 이루어진다. 항목은 기호를 포함하지 않는다.
중단 폐기. 현재의 입력이 실제 중단인 경우 (및 현재 상태가 만료됨으로써, 단지 하나로서 취급되는 것은 아님), 드라이버는 그것을 바로 폐기한다.
패닉 동작은 그것이 재합성될 때까지 드라이버가 입력을 폐기하도록 하며, 스택을 재시작하게 한다.
파싱
직관적으로, 매처는 패턴을 일치시키는 작업을 각가 패턴의 조각을 일치시키는 일련의 하위작업으로 분해한다. 이러한 작업의 각각은 차례대로 분해되며, 이 과정은 매칭될 조각이 단순히 그들 자신의 입력토큰이 될때까지 반복되며, 이것은 쉽게 매칭될 수 있다.
패턴을 매칭가능한 조각으로 분해하는 작업은 매처 생성기에 의해 행해지면 결과는 상태 태이블의 상태에서 암호화된다. 드라이버는 매칭 하위 작업을 실행하는 이들의 상태를 따른다.
드라이버가 이전 동작(shift action) 을 취할 경우, 입력 토큰이 트라이버의 현재의 매칭 하위작업의 일부이기 때문이다. 드라이버는 토큰을 포함하도록 매치의 현재 조각을 연장한다.
드라이버가 축소 동작(reduce action) 을 취할 경우, 입력 토큰이 트라이버의 현재의 매칭 하위작업의 일부가 아니기 때문이다. 드라이버는 매치의 현재 조각의 끝을 표시하며, 입력 토큰의 첫번째 부분이 될, 다음 조각으로 이동한다.
드라이버가 패닉동작을 취할 경우, 입력 토큰이 임의의 매칭 하위작업의 일부가 아니며, 그 지점까지의 전체 매칭 상태가 오류이기 때문이다. 드라이버는 문제가 되는 토큰뿐만 아니라 누적된 상태를 폐기하며 새롭게 시작한다.
드라이버의 행동은 완전히 결정론적이고, 다이어그램에서 쉽게 모델링될 수 있다. 본 문서에 그러한 다이아 그램 몇 가지가 있으며, 그것은 일관된 표기법을 채용한다.
원. 테이블에서의 상태. 이것은 또한 무한할 수 있는 상태의 타임아웃을 보여준다.
실선 화살표. 이전 동작. 에지상의 라벨은 토큰이 매칭되고 있다는 것을 나타낸다. 화살표는 다음 상태로 안내한다.
뒤로 향하는 화살표. 동작 축소, 구문을 팝함. 에지상의 라벨은 토큰이 매칭되고 있다는 것을 나타낸다. 화살표는 적용되는 문법으로부터 안내한다.
다이아몬드형. 문법규칙. 괄호안의 텍스트는 스택으로부터 팝될 항목의 수와 매칭될 기호를 나타낸다.
점선 화살표. 동작 축소, 구문을 푸시함. 에지상의 라벨은 기호가 매칭되고 있다는 것을 나타낸다.
드라이버의 알고리즘을 실행하기 위해 다이아그램을 사용할 수 있다.
1. 스택을 추적하기 위하여 별개의 종이를 사용한다. 첫번째 데드라인과 함께 스택상으로 상태 s0 를 푸시하면서 시작한다.
2. 스택의 맨위의 상태 및 현재 입력 토큰을 본다. 상태로부터 안내되며 현재 토큰으로 라벨링 된 에지를 따른다.
3. 만약 에지가 다른 상태로 안내하는 실선 화살표라면, 새로운 데드라인과 현재 토큰과 함께 스택상으로 상태를 푸시하며, 입력을 다음 토큰으로 진행시키고, 제2단계로 되돌아간다.
4. 에지가 규칙으로 연결하는 뒤로 향하는 화살표라면, 규칙을 살펴보고 그것을 연결한다. 규칙은 팝될 항목의 수와 축약을 리스트화 할 것이다. 스택으로부터 지정된 수의 항목을 팝하고, 새로운 상부 상태를 살펴본다. 그 상태로부터 안내되며, 축약으로 라벨링된 파선 에지를 찾는다. 새로운 데이드라인 및 축약과 함께, 스택상으로, 파선 에지가 가리키는 상태를 스택으로 푸시한다. 축약이 오메가가 아닌 경우, 제2단계로 되돌아가고, 그렇지 않으면, 제1단계로 되돌아간다.
예. 이 섹션에서는, 동작중인 TFR(1) 의 몇가지 예를 제공한다. 가능한 경우, 스트리밍 SQL 처럼, 표현식 평가를 기초로 하는 스트림 기반 패턴 매칭의 다른 일반적인 형태의 행동과 그것을 비교한다.
예 1: 애완동물
본 예에서, 애완동물의 리스트를 찾는 매처를 고려한다. 각 리스트는 임의의 수의 애완동물 (또는 애완동물이 없을 수 있음)을 포함하며, 각각의 애완동물은 고양이, 개, 또는 카나리아이다. 리스트는 50회 단위의 간격으로 입력 스트림으로부터 수집되었다.
테이블 B 는 문법을 보여준다. 오메가 규칙 (r0) 은 애완동물의 리스트와 매칭시킨다. 각각의 리스트는 애완동물 (r5) 이 뒤따르거나 아무것도 없는 (r4) 애완동물의 리스트로 이루어진다. 리스트를 수집하기 위한 문법적인 구조는 입력의 최우측의 유도를 찾는 파서의 공통적인 특징이다. 규칙(r1, r2, 및 r3) 은 애완동물이 될 수 있는 것을 정의한다.
테이블C는 이 문법으로부터 유되된 상태를 보여준다. "s4" 와 같은 동작은 "이동" 하고 상태4로 간다는 것을 의미하고, "r2" 와 같은 동작은 규칙2에 의한 축소 및 전환을 따른다는 것을 의미한다. 감겨있는 화살표 (
Figure pct00001
) 는 재시작을 의미한다. 비어있는 동작은 패닉을 의미한다.
도15A 및 15B는 테이블 C와 동일한 정보를 도시하지만, 시각적으로 더 잘 이해할 수 있도록 도시되어 있다. 이 도면에서, 예를 들면, "개"와 다른 두 종류의 애완동물 사이의 구분이 매칭의 매우 초기에 발생되지만, "고양이" 와 "카나리아" 사이의 구분은 두 개 이상의 단계를 거친다는 것을 쉽게 알 수 있다.
테이블 B: "애완동물" 의 문법
규칙 구문
r0 Ω → pets
r1 pet → <<c>> <<a>> <<n>> <<a>> <<r>> <<y>>
r2 pet → <<c>> <<a>> <<t>>
r3 pet → <<d>> <<o>> <<g>>
r4 pets → τ50
r5 pets → pets pet
테이블 C: "애완동물" 의 파서 테이블
상태 동작 전이 타임
아웃
a c d g n o r t y pet pets
s0 r4 r4 r4 s1 τ50
s1 s3 s4 s2 τ∞
s2 r5 r5 r5 τ∞
s3 s5 τ∞
s4 s6 τ∞
s5 s7 s8 τ∞
s6 s9 τ∞
s7 s10 τ∞
s8 r2 r2 r2 τ∞
s9 r3 r3 r3 τ∞
s10 s11 τ∞
s11 s12 τ∞
s12 r1 r1 r1 τ∞
도15A 및 15B는 "pet" 의 일 예인 상태 머신도를 도시한다. 도면은 규칙과 상태를 도시한다. 도 15A에, 상태 s0(1510), s1 (1515), s2 (1520), s3 (1525), 및 s4 (1530) 가 존재한다. 규칙 r0 (1533), r0 (1535), 및 r4 (1536) 도 존재한다. 화살표(1540 및 1542)는 도15B에서 대응하는 화살표로 연결된다. 도15B에는 상태 s2 (1550), s3 (1555), s7 (1560), s8 (1565), s8 (1568), s10 (1570), s11 (1575), and s12 (1580) 가 존재한다. 규칙 r2 (1583), r2 (1585), 및 r3 (1588) 도 존재한다.
테이블 D는 입력 "catcanarydog" 을 한 개의 단위에 의해 시간에 따라 구분되는 각각의 이벤트와 매칭시키는 드라이버의 트레이스를 도시한다. 입력은 시간 단위 50까지 경과할 때 종료한다.
주의해야 할 몇가지가 있다. (1) 드라이버는 일치시키는 패턴의 부분을 인식하기에 충분한 길이만큼만 (스택상에서) 입력토큰을 버퍼링한다. 일단 매칭이 되면, 입력이 축소된다. (2) 각 입력은 드라이버에 의해 오직 한번 검사된다. (3) 드라이버는 존재 뿐만아니라 입력의 부재에도 반응한다. 최종적인 축소는 단순히 시간의 경과를 트리거한다. (3) 드라이버는 시작한 상태에서 종료하고, 매칭을 계속할 준비를 한다.
테이블 D: "애완동물" 의 샘플 트레이스
단계 스택 입력 동작
1 [s0-1050] 1000:<<c>> 1001:<<a>> 1002:<<t>> 1003:<<c>> 1004:<<a>> 1005:<<n>> 1006:<<a>> 1007:<<r>> 1008:<<y>> 1009:<<d>> 1010:<<o>> 1011:<<g>> 1050:τ reduce by r4, go to s1
2 [s0-1050] [s1-1050 pets] 1000:<<c>> 1001:<<a>> 1002:<<t>> 1003:<<c>> 1004:<<a>> 1005:<<n>> 1006:<<a>> 1007:<<r>> 1008:<<y>> 1009:<<d>> 1010:<<o>> 1011:<<g>> 1050:τ shift, go to s3
3 [s0-1050] [s1-1050 pets] [s3-1050 <<c>>] 1001:<<a>> 1002:<<t>> 1003:<<c>> 1004:<<a>> 1005:<<n>> 1006:<<a>> 1007:<<r>> 1008:<<y>> 1009:<<d>> 1010:<<o>> 1011:<<g>> 1050:τ shift, go to s5
4 [s0-1050] [s1-1050 pets] [s3-1050 <<c>>] [s5-1050 <<a>>] 1002:<<t>> 1003:<<c>> 1004:<<a>> 1005:<<n>> 1006:<<a>> 1007:<<r>> 1008:<<y>> 1009:<<d>> 1010:<<o>> 1011:<<g>> 1050:τ shift, go to s8
5 [s0-1050] [s1-1050 pets] [s3-1050 <<c>>] [s5-1050 <<a>>] [s8-1050 <<t>>] 1003:<<c>> 1004:<<a>> 1005:<<n>> 1006:<<a>> 1007:<<r>> 1008:<<y>> 1009:<<d>> 1010:<<o>> 1011:<<g>> 1050:τ reduce by r2, go to s2
6 [s0-1050] [s1-1050 pets] [s2-1050 pet] 1003:<<c>> 1004:<<a>> 1005:<<n>> 1006:<<a>> 1007:<<r>> 1008:<<y>> 1009:<<d>> 1010:<<o>> 1011:<<g>> 1050:τ reduce by r5, go to s1
7 [s0-1050] [s1-1050 pets] 1003:<<c>> 1004:<<a>> 1005:<<n>> 1006:<<a>> 1007:<<r>> 1008:<<y>> 1009:<<d>> 1010:<<o>> 1011:<<g>> 1050:τ shift, go to s3
8 [s0-1050] [s1-1050 pets] [s3-1050 <<c>>] 1004:<<a>> 1005:<<n>> 1006:<<a>> 1007:<<r>> 1008:<<y>> 1009:<<d>> 1010:<<o>> 1011:<<g>> 1050:τ shift, go to s5
9 [s0-1050] [s1-1050 pets] [s3-1050 <<c>>] [s5-1050 <<a>>] 1005:<<n>> 1006:<<a>> 1007:<<r>> 1008:<<y>> 1009:<<d>> 1010:<<o>> 1011:<<g>> 1050:τ shift, go to s7
10 [s0-1050] [s1-1050 pets] [s3-1050 <<c>>] [s5-1050 <<a>>] [s7-1050 <<n>>] 1006:<<a>> 1007:<<r>> 1008:<<y>> 1009:<<d>> 1010:<<o>> 1011:<<g>> 1050:τ shift, go to s10
11 [s0-1050] [s1-1050 pets] [s3-1050 <<c>>] [s5-1050 <<a>>] [s7-1050 <<n>>] [s10-1050 <<a>>] 1007:<<r>> 1008:<<y>> 1009:<<d>> 1010:<<o>> 1011:<<g>> 1050:τ shift, go to s11
12 [s0-1050] [s1-1050 pets] [s3-1050 <<c>>] [s5-1050 <<a>>] [s7-1050 <<n>>] [s10-1050 <<a>>] [s11-1050 <<r>>] 1008:<<y>> 1009:<<d>> 1010:<<o>> 1011:<<g>> 1050:τ shift, go to s12
13 [s0-1050] [s1-1050 pets] [s3-1050 <<c>>] [s5-1050 <<a>>] [s7-1050 <<n>>] [s10-1050 <<a>>] [s11-1050 <<r>>] [s12-1050 <<y>>] 1009:<<d>> 1010:<<o>> 1011:<<g>> 1050:τ reduce by r1, go to s2
14 [s0-1050] [s1-1050 pets] [s2-1050 pet] 1009:<<d>> 1010:<<o>> 1011:<<g>> 1050:τ reduce by r5, go to s1
15 [s0-1050] [s1-1050 pets] 1009:<<d>> 1010:<<o>> 1011:<<g>> 1050:τ shift, go to s4
16 [s0-1050] [s1-1050 pets] [s4-1050 <<d>>] 1010:<<o>> 1011:<<g>> 1050:τ shift, go to s6
17 [s0-1050] [s1-1050 pets] [s4-1050 <<d>>] [s6-1050 <<o>>] 1011:<<g>> 1050:τ shift, go to s9
18 [s0-1050] [s1-1050 pets] [s4-1050 <<d>>] [s6-1050 <<o>>] [s9-1050 <<g>>] 1050:τ reduce by r3, go to s2
19 [s0-1050] [s1-1050 pets] [s2-1050 pet] 1050:τ reduce by r5, go to s1
20 [s0-1050] [s1-1050 pets] 1050:τ report and restart
21 [s0-1100] 1050:τ discard
스트림 프로세서는 표현 평가를 사용하여 매치를 찾는다. 예를 들면, 스트리밍 SQL 의 SELECT 구문에서, where-절을 찾는다. 이 절은 평가하기 위한 표현식을 지정하고, 결과가 참일 경우, 선택이 일치한다. 예를 들면, 현재 입력이 식별자 단어에 의해 나타난다면, 애완동물을 찾기 위한 where-절은 단어 ="cat" 또는 단어 ="dog" 또는 단어 ="canary" 일 것이다.
단어의 내용은 선택이 매치를 완수할 때가지 버퍼되어야 한다. 새로운 입력이 들어올 때마다, 단어는 한 개의 문자만큼 확장되어야 하며, 전체적인 표현도 재평가되어야 한다.
이전의 반복으로부터 배운 것은 아무것도 다음으로 전달되지 않는다. 예를 들면, 현재 단어가 "do" 를 포함하고 있다면, 표현은 매치할 수 없는 "cat" 과 "canary" 에 대해 그것을 비교하여야 한다. 단어의 각 문자는 결정이 내려지기 전에 여러번 검사될 수 있다.
이것은 입력을 한 번 이상 검사하지 않는 TFR(1) 보다 훨씬 덜 효율적이다. 각 파싱 상태는 묵시적으로 그것에 선행하는 상태에 대한 정보를 전달한다. 예를 들면, 개와 개가 아닌 것에 대한 판단이 s1에서 행해진다. s3 및 s4 와 같은 후속 상태는 이미 "개" 가 여전히 가능한 매칭인지 아닌지를 알고 있다.
TFR(1) 상태 테이블의 구성. 이 섹션은 문법 규칙의 세트로부터 상태 테이블을 구성하기 위하여 사용되는 알고리즘을 기술한다. 세 개의 전반적인 단계가 존재한다.
1. 모든 기호의 제1 및 다음 세트를 연산한다.
2. 시작 아이템으로부터 시작 상태를 생성하고, 시작상태로부터 직간접으로 도달할 수 있는 모든 상태를 생성한다.
3. 각 생성된 상태에 대한 테이블 항목을 생성한다.
이러한 단계를 설명하기 전에, 우선 관련된 개념 중 일부를 정의할 필요가 있다.
개념. 제1 및 다음. 기호의 제1 세트는 기호로부터 유도된 이벤트의 시퀀스를 시작할 수 있는 토큰의 세트이다. 기호가 공백의 규칙을 갖는 축약이라면, 기호의 제1 세트는 특별한 마커 ε 를 포함한다.
First(X) 를 연산하기 위하여.
1. X가 토큰이라면, First(X) 는 단지 {X} 이다.
2. X가 공백규칙을 갖는 축약이라면, ε 을 First(X) 에 추가한다.
3. 좌측에 X를 갖는 공백이 아닌 규칙 각각에 대해, 우측의 제1 기호 각각의 제1 세트를 First(X) 에 추가한다. 우측 기호자체가 공백규칙을 갖는 축약이라면, 우측의 다음 기호의 제1 세트를 First(X) 에 추가한다. 공백규칙을 갖지 않는 우측 기호를 만나거나 더이상 우측 기호가 없을 때까지 이러한 방식으로 계속한다.
제2세트는 또한 두 개 이상의 기호로 이루어지는 시퀀스α 에 대해 정의된다. First(α) 를 연산하기 위하여.
1. α 에서 제1 기호의 제1세트로 시작한다. 만약 ε 을 포함하지 않았으면, 이 세트는 First(α) 로서 복귀한다.
2. ε 을 포함하고 있으면, 세트로부터 ε 을 제거하고, α 에서 다음 기호의 제1세트를 추가한다. ε 을 포함하지 않는 제1 세트를 갖는 기호를 만나거나 α 의 끝에 도달할 때까지 이런 방식으로 계속한다.
기호의 다음 세트는 인식가능한 시퀀스에서 기호를 따를 수 있는 이벤트 세트이다. Follow(X) 를 연산하기 위하여.
1. X 가 Ω 인 경우, Follow(X) 는 First(Ω) 에서 모든 이벤트뿐만 아니라 중단 이벤트를 포함한다.
2. X 가 우측에 나타나는 각각의 규칙을 검사한다. A 를 이 규칙의 좌측이라고 하고, β 를 이 규칙의 X 의 우측에 나타나는 기호의 시퀀스라고 한다. β 가 공백이 아닌경우, Follow(X) 는 First(β) 를 포함하고, 그렇지 않으면, Follow(X) 는 Follow(A)를 포함한다.
아이템 및 상태. 규칙의 아이템은 매칭동안 도달될 특정한 지점을 나타낸다. 아이템은 문법의 규칙 중 하나에 대한 기준, 규칙 내의 점의 위치, 및 예측 이벤트로 이루어진다. 예를 들면, [pet → <<c>> · <<a>> <<t>>, <<c>>] 은 애완동물 문법의 아이템이다.
아이템에서의 점의 위치는 매칭이 다음에 일어날 정확한 위치를 나타낸다. 점은 규칙의 우측에서 임의의 기호 앞에 나오거나 마지막 기호 다음에 나온다. 후자의 경우, 그 아이템은 완료되었다고 말한다. 아이템이 완료되지 않았으면, 점 바로 다음의 기호는 아이템의 코너라고 불리운다. 완전한 아이템은 코너의 기호를 가지지 않는다. 점 앞의 기호의 시퀀스는 알파 시퀀스라고 불리고, 코너 다음의 기호의 시퀀스는 베타 시퀀스라고 불린다. 알파 또는 베타 또는 양 시퀀스는 공백일 수 있다.
공백 규칙을 의미하는 아이템은 한 개의 가능한 점 위치만을 갖는다. 그러한 아이템은 완료된 것으로 간주된다. 코너 기호를 가지지 않고, 알파 및 베타 시퀀스는 공백상태이다.
아이템의 예측이벤트는 토큰 또는 중단이다. 완벽한 아이템에서, 예측은 파서 생성기가 아이템을 그 상태로 축소할 것인지 다른 이벤트를 이동할 것인지를 판단하도록 돕는다.
규칙의 시작 아이템은 매칭이 시작되는 아이템 중 하나이다. 각각의 시작 아이템은 오메가 규칙을 의미하며 맨 왼쪽에 점을 갖는다. 문법의 개시 아이템의 세트를 생성하기 위하여, Follow(Ω) 를 연산한다. Follow(Ω) 에서, 각 기호 F 에 대해, 예측 F 를 갖는 시작 아이템을 추가한다.
상태는 아이템의 세트이다. 예를 들면, 애완동물 문법에서 {[pets → pets pet ·, <<c>>], [pets → pets pet ·, <<d>>], [pets → pets pet ·, ―]} 는 상태 s2 이다.
각 아이템은 타임아웃을 갖는다. 아이템이 완료되면, 그 타임아웃의 그 규칙의 타임아웃과 같다. 공백이 없는 규칙 또는 람다 규칙은 무한한 타임아웃을 갖는다. 아이템이 완료되지 않으면, 그의 타임아웃은 무한하다.
각 상태도 도한 그 아이템들 중에서 가장 작은 타임아웃과 같은 타임아웃을 갖는다.
클로저. 상태는 아이템의 세트이지만, 아이템의 모든 세트가 상태인 것은 아니다. 상태가 되기 위해, 세트는 완벽한 클로저여야 한다. 클로저 기능은 그것을 완료시키기 위해 필요한 아이템을 추가함으로서 아이템의 최초 세트로부터 완벽한 상태를 생성한다.
J 가 아이템의 세트라면, 이것과 같이 Closure(J) 를 연산한다.
1. J 내의 모든 아이템을 처음부터 포함하는 아이템 todo 및 처음부터 공백인 아이템 done 세트의 리스트로 시작.
2. todo 가 공백인 경우, 문법의 상태로서 done 을 복귀한다.
3. todo 로부터 한 개의 아이템을 팝한다. 아이템이 이미 done 에 있거나 아이템이 완료되었다면 (즉, 맨 오른쪽에 점이 있다면), 그 아이템을 폐기하고 제2단계로 되돌아간다.
4. B 를 아이템의 코너 기호라고 하고, β 를 아이템의 베타 시퀀스라고 하고, X를 아이템의 예측이라고 하고, next는 이벤트 First(βX)의 세트라고 한다.
5. 중단이벤트를 next에 추가한다.
6. B 가 좌측에 나타나는 각 규칙 및 next 에 있는 각 이벤트 Y에 대해, 아이템 [rule, 0, Y] 을 todo 에 추가한다.
7. 제2단계로 되돌아간다.
Goto. 상태는 일부 시퀀스 γ 에 대해 가변하는 아이템 세트를 가지며, 각 시퀀스는 이런 방식으로 그것을 나타내는 상태를 갖는다. 그러므로, γ 와 동일하지만, 한 개의 이벤트만큼 긴 시퀀스 γX는 상태로 표현되어야 한다. γ 의 상태가 J 이면, γX 의 상태는 X를 갖는 J의 goto라고 불린다.
Goto(J, X) 를 연산하기 위하여.
1. J 내의 모든 아이템을 처음부터 포함하는 아이템 todo 및 처음부터 공백인 아이템 next 세트의 리스트로 시작.
2. todo 가 공백이면, goto상태로서 Closure(next) 를 복귀시킨다.
3. todo 로부터 한 개의 아이템을 팝하게 한다. 아이템이 완료되거나 아이템의 코너 기호가 X 가 아니라면, 아이템을 폐기하고 제2단계로 되돌아간다.
4. 아이템의 규칙에 의한 규칙 및 점을 아이템의 점 위치로 하고, Y 를 아이템의 예측이라고 한다. [rule, dot + 1, Y] 을 next에 추가한다.
5. 제2단계로 되돌아 감.
구성 알고리즘. 본 장의 시작에서 언급된 구성 알고리즘의 세 단계를 설명한다. 제1 및 다음 세트를 연산하는 제1 단계는 단순히 모든 심볼을 통한 반복 및 이전 섹션으로부터의 정의를 적용하는 것이다. 이제 제2 및 제3 단계를 설명한다.
상태 생성. 문법의 모든 상태를 생성하기 위하여.
1. 시작 아이템의 클로저를 처음부터 포함하는 상태 todo 및 처음부터 공백인 상태 done 세트의 리스트로 시작.
2. todo 가 공백인 경우, 문법의 상태의 세트로서 done 을 복귀한다.
3. todo 로부터 한 개의 상태 J 를 팝하게 한다. J 가 이미 done 내에 있으면, 그것을 폐기하고 제2단계로 되돌아간다.
4. 문법 (Ω 와 중단을 포함) 에서 각 기호 X 에 대해, K 를 Goto(J,X) 라 한다. K 가 공백이 아니면, K 를 todo 에 추가한다.
5. 제2단계로 되돌아 감.
테이블 E 는 테이블 B 에서 이러한 알고리즘을 문법에 적용한 결과를 보여준다.
테이블 E: "애완동물" 의 상태의 아이템
상태 아이템
s0 [Ω → · pets, <<c>>]
[Ω → · pets, <<d>>]
[Ω → · pets, ―]
[pets → τ50, <<c>>]
[pets → τ50, <<d>>]
[pets → τ50, ―]
[pets → · pets pet, <<c>>]
[pets → · pets pet, <<d>>]
[pets → · pets pet, ―]
s1 [Ω → pets ·, <<c>>][Ω → pets ·, <<d>>]
[Ω → pets ·, ―]
[pet → · <<c>> <<a>> <<n>> <<a>> <<r>> <<y>>, <<c>>]
[pet → · <<c>> <<a>> <<n>> <<a>> <<r>> <<y>>, <<d>>]
[pet → · <<c>> <<a>> <<n>> <<a>> <<r>> <<y>>, ―]
[pet → · <<c>> <<a>> <<t>>, <<c>>]
[pet → · <<c>> <<a>> <<t>>, <<d>>]
[pet → · <<c>> <<a>> <<t>>, ―]
[pet → · <<d>> <<o>> <<g>>, <<c>>]
[pet → · <<d>> <<o>> <<g>>, <<d>>]
[pet → · <<d>> <<o>> <<g>>, ―]
[pets → pets · pet, <<c>>]
[pets → pets · pet, <<d>>]
[pets → pets · pet, ―]
s2 [pets → pets pet ·, <<c>>][pets → pets pet ·, <<d>>]
[pets → pets pet ·, ―]
s3 [pet → <<c>> · <<a>> <<n>> <<a>> <<r>> <<y>>, <<c>>]
[pet → <<c>> · <<a>> <<n>> <<a>> <<r>> <<y>>, <<d>>]
[pet → <<c>> · <<a>> <<n>> <<a>> <<r>> <<y>>, ―]
[pet → <<c>> · <<a>> <<t>>, <<c>>]
[pet → <<c>> · <<a>> <<t>>, <<d>>]
[pet → <<c>> · <<a>> <<t>>, ―]
s4 [pet → <<d>> · <<o>> <<g>>, <<c>>]
[pet → <<d>> · <<o>> <<g>>, <<d>>]
[pet → <<d>> · <<o>> <<g>>, ―]
s5 [pet → <<c>> <<a>> · <<n>> <<a>> <<r>> <<y>>, <<c>>]
[pet → <<c>> <<a>> · <<n>> <<a>> <<r>> <<y>>, <<d>>]
[pet → <<c>> <<a>> · <<n>> <<a>> <<r>> <<y>>, ―]
[pet → <<c>> <<a>> · <<t>>, <<c>>]
[pet → <<c>> <<a>> · <<t>>, <<d>>]
[pet → <<c>> <<a>> · <<t>>, ―]
s6 [pet → <<d>> <<o>> · <<g>>, <<c>>]
[pet → <<d>> <<o>> · <<g>>, <<d>>]
[pet → <<d>> <<o>> · <<g>>, ―]
s7 [pet → <<c>> <<a>> <<n>> · <<a>> <<r>> <<y>>, <<c>>]
[pet → <<c>> <<a>> <<n>> · <<a>> <<r>> <<y>>, <<d>>]
[pet → <<c>> <<a>> <<n>> · <<a>> <<r>> <<y>>, ―]
s8 [pet → <<c>> <<a>> <<t>> ·, <<c>>]
[pet → <<c>> <<a>> <<t>> ·, <<d>>]
[pet → <<c>> <<a>> <<t>> ·, ―]
s9 [pet → <<d>> <<o>> <<g>> ·, <<c>>]
[pet → <<d>> <<o>> <<g>> ·, <<d>>]
[pet → <<d>> <<o>> <<g>> ·, ―]
s10 [pet → <<c>> <<a>> <<n>> <<a>> · <<r>> <<y>>, <<c>>]
[pet → <<c>> <<a>> <<n>> <<a>> · <<r>> <<y>>, <<d>>]
[pet → <<c>> <<a>> <<n>> <<a>> · <<r>> <<y>>, ―]
s11 [pet → <<c>> <<a>> <<n>> <<a>> <<r>> · <<y>>, <<c>>]
[pet → <<c>> <<a>> <<n>> <<a>> <<r>> · <<y>>, <<d>>]
[pet → <<c>> <<a>> <<n>> <<a>> <<r>> · <<y>>, ―]
s12 [pet → <<c>> <<a>> <<n>> <<a>> <<r>> <<y>> ·, <<c>>]
[pet → <<c>> <<a>> <<n>> <<a>> <<r>> <<y>> ·, <<d>>]
[pet → <<c>> <<a>> <<n>> <<a>> <<r>> <<y>> ·, ―]
테이블 생성. 상태가 생성된 후, 각 상태는 파서 테이블 내의 행으로 변환된다. 각 행은 두부분, 동작 및 천이로 이루어진다.
상태 J 의 동작을 연산하기 위해.
J 에서의 각 아이템에 대해, 규칙을 아이템의 규칙이라고 하고, B 를 아이템 (만약 한 개라면) 의 코너 기호라고 하고, X 는 아이템의 예측이라고 한다.
a. 아이템이 완료되고 그 좌측이 Ω 라면, action(J, X) 가 재시작한다.
b. 아이템이 완료되고 그 좌측이 Ω 가 아니라면, action(J, X) 는 reduce(rule) 이다.
c. 아이템이 완료되지 않고, B 가 토큰이고, Goto(J, B) 가 공백이 아니면, action(J, X) 는 shift(Goto(J, B)) 이다.
d. 모든 다른 경우에, action(J, X) 는 패닉이다
상태 J 의 천이를 연산하기 위해.
문법에서 각 축약 A 에 대해, K 를 Goto(J, A) 라 한다.
a. K 가 공백이 아니면, transition(J, A) 는 K 이다.
b. K 가 공백이면, transition(J, A) 는 정의되지 않는다.
이러한 알고리즘을 테이블 E에 적용하여 테이블 B를 생성한다.
추가적인 최적화. 전술한 바와 같이, TFR(1) 파서 테이블의 구성을 위한 알고리즘은 표준 LR(1) 파서 테이블을 구성하기 위한 알고리즘과 유사하거나 그의 확장이다. LR(1) 파서에 적용되는 다양한 일반화, 최적화, 및 상태 축소 전력이 또한 TFR(1) 파서 테이블에 핑료한 부분만 약간 수정한 채로 적용될 수 있다. 그러한 전력은 LR(1) 내지 LALR(1) 의 최적화 및 LR(1) 내지 GLR(1) 의 일반화를 포함하지만, 그에 한정되지는 않는다.
데이터플로우 연산 환경을 사용하기 위한 반응 함수를 기술하고 번역하는 방법은 (1) 반응함수를 식별하는 단계, (2) 입력을 함수에 제공하는 매개변수의 패턴을 식별하는 단계, (3) 함수를 통과한 인수에 기초하여 평가될 표현식을 식별하는 단계, (4) 매개변수 패턴을 패턴을 일치시키는 입력의 시퀀스를 인식할 수 있는 상태 머신으로 번역하는 단계, (5) 입력 데이터를 출력데이터로의 함수변환을 호출하기 위한 능력을 갖는 상태 머신을 증강하는 단계; (6) 간단한 소프트웨어 또는 하드웨어에 의해 자동화할 수 있는 결정성 푸시다운 오토마톤으로서 상태 머신을 구현하는 단계를 포함한다.
일 구현에 있어서, 방법은 물리량을 모니터링하고 모니터링된 물리량을 디지털 형태의 데이터 스트림으로 변환하는 하드웨어 센서로부터 데이터 스트림을 수신하는 단계, 데이터 스트림을 입력큐에 저장하며, 데이터 스트림 내의 각 토큰이 토큰이 수신되는 시간 스탬프와 함께 저장되는 단계, 한 방향으로 입력큐를 통해 토큰을 판독하며 임의의 이전에 독출한 토큰은 독출하지 않음으로서 한 개 이상의 기설정된 패턴을 매칭시키는 데이터 스트림에서 패턴을 식별하는 단계, 및 데이터 스트림에서 기설정된 패턴을 식별하여, 기설정된 패턴이 식별된 출력큐에서 양의 표시를 출력하는 단계를 포함한다.
방법은 또한, 기설정된 패턴이 데이터 스트림에서 식별되지 않은 동안, 기설정된 패턴이 식별된 출력큐에서 음의 표시를 출력하는 것을 추가로 포함하며, 기설정된 패턴은 상태 테이블 및 상태 스택에 저장된다.
또 다른 구현에 있어서, 시스템은 제1 메모리 위치에, 처리될 토큰의 선입선출 시퀀스를 저장하고, 큐에서 각 토큰과 관련된 시간 스탬프는 관련 토큰이 입력큐로 들어가는 시간을 나타내며, 토큰은 네트워크를 통해 입력큐에 의해 수신되는, 컴퓨터 메모리 내의 제1 메모리 위치를 포함하는 입력큐, 입력큐에 접속되며, 역추적 없이 입력큐에서 토큰을 처리하며, 한 개 이상의 기설정된 입력 패턴과 일치하는 토큰의 시퀀스에서의 패턴을 식별하며, 일치되는 입력 패턴을 식별시에, 출력되는 이벤트 출력을 생성하는 드라이버 구성요소, 드라이버 구성요소에 접속되며컴퓨터 메모리내에 제2 메모리 위치를 포함하며, 드라이버 구성요소에 의해 생성된 출력되는 이벤트의 선입선출 시퀀스를 제2 메모리 위치에 저장하는 출력큐, 드라이버 구성요소에 접속되며, 상태 테이블 포맷으로 기설정된 입력 패턴을 저장하는 상태 테이블 구성요소, 드라이버 구성요소에 접속되며, 컴퓨터메모리의 제3 메모리 위치를 포함하며, 제3 메모리 위치에 프레임의 후입선출 시퀀스 스토리지를 저장하는 상태 스택 구성요소를 포함한다. 프레임은 번역상태 번호, 기호, 및 데드라인을 포함한다.
토큰은 물리적인 속성을 디지털 양으로 변환하는 하드웨어 센서에 의해 생성될 수 있는 입력큐에서 수신된다. 드라이버 구성요소의 동작은, 상태 스택의 맨위 프레임이라고 언급되는 상태를 검사하는 단계, 입력큐에서의 다음 입력 토큰을 검사하는 단계, 상태 스택에 기초하여 카테고리를 판단하는 단계, 및 상태 테이블에 의해 지시된 바와 같이 카테고리의 토큰에 대한 상태 테이블에 의해 지시된 동작을 실행하는 단계를 포함한다.
입력큐는 입력큐에 의해 수신된 시간에 기초하여 순서 리스트에 토큰을 저장한다. 큐의 제1 방향은 가장 먼저 수신된 토큰부터 마지막에 수신된 토큰까지의 시간 순서이다. 드라이버 구성요소는 제1 방향에서 입력큐를 검사함으로써 토큰을 처리하고 임의의 이전에 검사된 토큰이나 토큰들은 검사를 하지 않는다.
입력큐는 입력큐에 의해 수신된 것과 같은 시간 순서대로 리스트에 토큰을 저장한다. 큐의 제1 방향은 일찍 수신된 토큰부터 마지막에 수신된 토큰까지의 시간 순서이다. 큐의 제2 방향은 마지막에 수신된 토큰부터 일찍 수신된 토큰까지의 시간 순서이다. 제2방향은 제1방향과 반대이다. 드라이버 구성요소는 제1 및 제2 모든 방향이 아니라, 제1방향 또는 제2방향 중 한 방향에서 입력큐를 검사함으로서 토큰을 처리한다.
드라이버는 입력큐의 각 토큰을 오직 한번만 독취하고, 독취한 토큰은 나중에 다시 읽기 위하여 버퍼에 보유하지 않는다. 매칭될 기설정된 입력패턴은 무한한 길이를 갖는 다수의 토큰을 가질 수 있다. 상태 테이블 구성요소는 상태 머신을 지정하고 다수의 행을 포함한다. 각 행은 상태 머신의 번역상태를 제공한다.
각 행은 입력토큰 카테고리 값 또는 입력 중단 카테고리 값을 그 값의 입력토큰 수신시에 취해질 동작에 매핑하는 동작 세트, 파생된 기호유형을 드라이버가 그 유형의 파생된 기호를 합성할 때 변경해야 하는 상태로 매핑하는 전이 세트, 및 상태 머신이 특정한 상태로 남아있도록 하는 시간 간격을 나타내는 타임아웃을 포함한다.
번역상태번호는 상태 테이블에서 행에 대한 참조이다. 기호는 입력토큰 또는 다른 토큰, 또는 그 조합으로부터 파생된 토큰 또는 중간기호이다. 데드라인은 드라이버가 스택의 프레임을 파핑할 또 다른 순간이다.
일 구현에서, 드라이버 구성요소와 상태 테이블 구성요소는 프로그램가능한 게이트 어레이에서 구현된다. 또 다른 구현에서, 드라이버 구성요소와 상태 테이블 구성요소는 컴퓨터를 사용하여 구현된다. 상태 테이블 구성요소는 상태 머신을 지정하고 드라이버 구성요소는 입력큐에서 스트림 데이터를 갖는 토큰이 수신되지 않는 시간 경과에 기초하여, 상태 머신의 제1상태로부터 상태 머신의 제2상태로 변화된다.
상태 테이블 구성요소는 상태 머신을 지정한다. 드라이버 구성요소는 제1시간 주기동안 입력큐에서 스트림 데이터를 갖는 토큰의 시퀀스가 수신되는 것에 기초하여, 상태 머신의 제1상태로부터 상태 머신의 제2상태로 변화된다. 드라이버 구성요소는 제2시간 주기동안 입력큐에서 스트림 데이터를 갖는 토큰의 시퀀스가 수신되지 않는 것에 기초하여, 상태 머신의 제3상태로부터 상태 머신의 제4상태로 변화된다.
또 다른 구현에 있어서, 방법은 제1 메모리 위치에, 처리될 토큰의 선입선출 시퀀스를 저장하고, 큐에서 각 토큰과 관련된 시간 스탬프는 관련 토큰이 입력큐로 들어가는 시간을 나타내며, 토큰은 네트워크를 통해 입력큐에 의해 수신되는, 컴퓨터 메모리 내의 제1 메모리 위치를 포함하는 입력큐의 제공, 입력큐에 접속되며, 역추적 없이 입력큐에서 토큰을 처리하며, 한 개 이상의 기설정된 입력 패턴과 일치하는 토큰의 시퀀스에서의 패턴을 식별하며, 일치되는 입력 패턴을 식별시에, 출력되는 이벤트 출력을 생성하는 드라이버 구성요소의 제공, 드라이버 구성요소에 접속되며컴퓨터 메모리내에 제2 메모리 위치를 포함하며, 드라이버 구성요소에 의해 생성된 출력되는 이벤트의 선입선출 시퀀스를 제2 메모리 위치에 저장하는 출력큐의 제공, 드라이버 구성요소에 접속되며, 상태 테이블 포맷으로 기설정된 입력 패턴을 저장하는 상태 테이블 구성요소의 제공, 드라이버 구성요소에 접속되며, 컴퓨터메모리의 제3 메모리 위치를 포함하며, 제3 메모리 위치에 프레임의 후입선출 시퀀스 스토리지를 저장하는 상태 스택 구성요소의 제공을 포함하며, 프레임은 번역상태 번호, 기호, 및 데드라인을 포함한다.
상태 테이블 구성요소용 상태 테이블을 생성하는 것은 각각 입력 데이터의 카테고리를 나타내는 종단기호 세트를 식별하는 단계, 각각 종단 또는 비종단 기호 중 적어도 한 개의 패턴을 나타내는 비종단 기호의 세트를 식별하는 단계, 문법 규칙 세트를 식별하는 단계, 최고수준의 규칙을 식별하는 단계, 속성 세트를 식별하는 단계, 식별된 종단 및 비종단 기호에 대한 제1 세트를 연산하는 단계, 식별된 종단 및 비종단 기호에 대한 다음 세트를 연산하는 단계, 및 대응하는 다음 세트의 구성원 각각으로 최상위 규칙의 클로저로부터 시작 상태를 생성하는 단계를 포함한다.
상태 테이블의 생성은, 변화하는 상태 전이가 시작 상태에서부터 존재하는 각 상태의 클로저를 재귀적으로 생성하여 시작 상태로부터 도달가능한 모든 상태를 생성하는 단계, 조합 및 축약에 의해 세트의 상태를 최적화하는 단계, 및 각 상태에 대해 동작, 전이, 및 타임아웃값을 생성하는 단계를 포함한다.
문법 규칙의 세트는 각각의 공백이 없는 규칙은 A -> B0. . .Bn 의 유형을 갖는다. A 는 비종단 기호이고, B0 to Bn 은 종단 또는 비종단 기호일 수 있다. 각 공백의 규칙은 유형 A -> τ 을 취하고, τ 는 유한한 시간 양이고, 일부 유용한 시간의 단위로 특징지어지거나, 또는 무한하게, 무한한 시간 나타낸다.
속성의 세트는, 속성은 유형 α:T = {A0 → λ0, . . . An → λn} 를 가지며, α 는 속성의 이름이며, T 는 속성의 유형이고, A 는 비종단 기호이고, λ 는 기호에 대한 속성의 값을 연산하기 위하여 사용될 함수이다. 최상위 규칙은 유형 Ω → B 을 가질 수 있으며, B 는 종단 또는 비종단 기호 중 하나이다.
본 발명의 기재는 예시 및 설명을 위해 제시되었다. 본 발명을 상술한 정확한 형태로 한정하고자 하는 의도는 아니며 다양한 수정과 변형이 상기 교시에 비추어볼 때 가능하다. 실시예는 본 발명의 원리 및 그 실용적인 응용을 가장 잘 설명하기 위하여 선택되고 기술되었다. 본 기재는 당업자가 특정한 용도에 적합한 다양한 변형과 함께 다양한 실시예로 본 발명을 가장 잘 활용하고 실시할 수 있게 할 것이다. 본 발명의 범위는 다음의 청구범위에 의해 정의된다.

Claims (20)

  1. 컴퓨터 메모리 내의 제1 메모리 위치를 포함하는 입력큐, - 여기서 상기 입력큐는 처리될 토큰의 선입선출 시퀀스와 시간 스탬프를 상기 제1 메모리 위치에 저장하고, 상기 입력큐에서 각 토큰은 데이터를 포함하거나 포함하지 않으며, 상기 시간 스탬프는 상기 토큰이 상기 입력큐로 들어가는 시간을 나타내며, 상기 토큰은 네트워크를 통해 상기 입력큐에 의해 수신됨-;
    상기 입력큐에 접속되며, 역추적 없이 상기 입력큐에서 상기 토큰을 처리하며, 한 개 이상의 기설정된 입력 패턴과 일치하는 토큰의 시퀀스에서의 패턴을 식별하며, 일치되는 입력 패턴을 식별시에, 출력되는 이벤트 출력을 생성하는 드라이버 구성요소;
    상기 드라이버 구성요소에 접속되며 상기 컴퓨터 메모리 내에 제2 메모리 위치를 포함하며, 상기 드라이버 구성요소에 의해 생성된 출력되는 이벤트의 선입선출 시퀀스를 상기 제2 메모리 위치에 저장하는 출력큐;
    상기 드라이버 구성요소에 접속되며, 상기 상태 테이블 포맷으로 기설정된 입력 패턴을 저장하는 상태 테이블 구성요소; 및
    상기 드라이버 구성요소에 접속되며, 상기 컴퓨터 메모리 내의 제3 메모리 위치를 포함하는 상태 스택 구성요소, - 여기서 상기 상태 스택 구성요소는 상기 제3 메모리 위치에 프레임의 후입선출 시퀀스 스토리지를 저장하고, 상기 프레임은 번역상태 번호, 기호, 및 데드라인을 포함함- 를 포함하는 것을 특징으로 하는 시스템.
  2. 제1항에 있어서,
    상기 토큰은 물리적인 속성을 디지털 양으로 변환하는 하드웨어 센서에 의해 생성될 수 있는 입력큐에서 수신되는 것을 특징으로 하는 시스템.
  3. 제1항에 있어서,
    상기 드라이버 구성요소의 동작은,
    상기 상태 스택의 맨위 프레임이라고 언급되는 상태를 검사하는 단계, 상기 입력큐에서의 다음 입력 토큰을 검사하는 단계, 상기 상태 스택에 기초하여 카테고리를 판단하는 단계, 및
    상기 상태 테이블에 의해 지시된 바와 같이 카테고리의 토큰에 대한 상태 테이블에 의해 지시된 동작을 실행하는 단계를 포함하는 것을 특징으로 하는 시스템.
  4. 제1항에 있어서,
    상기 입력큐는 상기 입력큐에 의해 수신된 시간에 기초하여 순서 리스트에 토큰을 저장하며, 큐의 제1 방향은 가장 먼저 수신된 토큰부터 마지막에 수신된 토큰까지의 시간 순서이며, 상기 드라이버 구성요소는 제1 방향에서 상기 입력큐를 검사함으로써 토큰을 처리하고 임의의 이전에 검사된 토큰이나 토큰들은 검사를 하지 않는 것을 특징으로 하는 시스템.
  5. 제1항에 있어서,
    상기 입력큐는 상기 입력큐에 의해 수신된 것과 같은 시간 순서대로 리스트에 토큰을 저장하며, 상기 큐의 제1 방향은 가장 먼저 수신된 토큰부터 마지막에 수신된 토큰까지의 시간 순서이고, 큐의 제2 방향은 마지막에 수신된 토큰부터 일찍 수신된 토큰까지의 시간 순서이며, 상기 제2방향은 상기 제1방향과 반대이며,
    상기 드라이버 구성요소는 상기 제1 및 제2 모든 방향이 아니라, 상기 제1방향 또는 상기 제2방향 중 한 방향에서 입력큐를 검사함으로서 토큰을 처리하는 것을 특징으로 하는 시스템.
  6. 제1항에 있어서,
    상기 드라이버는 상기 입력큐의 각 토큰을 오직 한번만 독취하고, 독취한 토큰은 나중에 다시 읽기 위하여 버퍼에 보유하지 않는 것을 특징으로 하는 시스템.
  7. 제1항에 있어서,
    매칭될 기설정된 입력패턴은 무한한 길이를 갖는 다수의 토큰을 가질 수 있는 것을 특징으로 하는 시스템.
  8. 제1항에 있어서,
    상기 상태 테이블 구성요소는 상태 머신을 지정하고 복수의 행을 포함하며, 각 행은 상기 상태 머신의 번역상태를 제공하며, 상기 각 행은,
    입력토큰 카테고리 값 또는 입력 중단 카테고리 값을 그 값의 입력토큰 수신시에 취해질 동작에 매핑하는 동작 세트;
    파생된 기호유형을 상기 드라이버가 그 유형의 파생된 기호를 합성할 때 변경해야 하는 상태로 매핑하는 전이 세트; 및
    상기 상태 머신이 특정한 상태로 남아있도록 하는 시간 간격을 나타내는 타임아웃을 포함하는 것을 특징으로 하는 시스템.
  9. 제1항에 있어서,
    상기 번역상태번호는 상기 상태 테이블에서 행에 대한 참조이며, 상기 기호는 입력토큰 또는 다른 토큰, 또는 그 조합으로부터 파생된 토큰 또는 중간기호이고, 상기 데드라인은 상기 드라이버가 스택의 프레임을 파핑할 또 다른 순간인 것을 특징으로 하는 시스템.
  10. 제1항에 있어서,
    상기 드라이버 구성요소와 상기 상태 테이블 구성요소는 프로그램가능한 게이트 어레이에서 구현되는 것을 특징으로 하는 시스템.
  11. 제1항에 있어서,
    상기 드라이버 구성요소와 상기 상태 테이블 구성요소는 컴퓨터를 사용하여 구현되는 것을 특징으로 하는 시스템.
  12. 제1항에 있어서,
    상기 상태 테이블 구성요소는 상태 머신을 지정하고 상기 드라이버 구성요소는 상기 입력큐에서 스트림 데이터를 갖는 토큰이 수신되지 않는 시간 경과에 기초하여, 상기 상태 머신의 제1상태로부터 상기 상태 머신의 제2상태로 변화되는 것을 특징으로 하는 시스템.
  13. 제1항에 있어서,
    상기 상태 테이블 구성요소는 상기 상태 머신을 지정하고, 상기 드라이버 구성요소가 제1시간 주기동안 상기 입력큐에서 스트림 데이터를 갖는 토큰의 시퀀스가 수신되는 것에 기초하여, 상기 상태 머신의 제1상태로부터 상기 상태 머신의 제2상태로 변화되며, 상기 드라이버 구성요소는 제2시간 주기동안 상기 입력큐에서 상기 스트림 데이터를 갖는 토큰의 시퀀스가 수신되지 않는 것에 기초하여, 상기 상태 머신의 제3상태로부터 상기 상태 머신의 제4상태로 변화되는 것을 특징으로 하는 시스템.
  14. 컴퓨터 메모리 내의 제1 메모리 위치를 포함하는 입력큐를 제공하는 단계, - 여기서 상기 입력큐는 처리될 토큰의 선입선출 시퀀스와 시간 스탬프를 상기 제1 메모리 위치에 저장하고, 상기 입력큐에서 각 토큰은 데이터를 포함하거나 포함하지 않으며, 상기 시간 스탬프는 상기 토큰이 상기 입력큐로 들어가는 시간을 나타내며, 상기 토큰은 네트워크를 통해 상기 입력큐에 의해 수신됨-;
    상기 입력큐에 접속되며, 역추적 없이 상기 입력큐에서 토큰을 처리하며, 한 개 이상의 기설정된 입력 패턴과 일치하는 토큰의 시퀀스에서의 패턴을 식별하며, 일치되는 입력 패턴을 식별시에, 출력되는 이벤트 출력을 생성하는 드라이버 구성요소를 제공하는 단계;
    상기 드라이버 구성요소에 접속되며 상기 컴퓨터 메모리 내에 제2 메모리 위치를 포함하며, 상기 드라이버 구성요소에 의해 생성된 출력되는 이벤트의 선입선출 시퀀스를 상기 제2 메모리 위치에 저장하는 출력큐를 제공하는 단계;
    상기 드라이버 구성요소에 접속되며, 상태 테이블 포맷으로 기설정된 입력 패턴을 저장하는 상태 테이블 구성요소를 제공하는 단계;
    상기 드라이버 구성요소에 접속되며, 상기 컴퓨터 메모리 내의 제3 메모리 위치를 포함하는 상태 스택 구성요소를 제공하는 단계, - 여기서 상기 상태 스택 구성요소는 상기 제3 메모리 위치에 프레임의 후입선출 시퀀스 스토리지를 저장하고, 상기 프레임은 번역상태 번호, 기호, 및 데드라인을 포함함-; 및
    상기 상태 테이블 구성요소용 상태 테이블을 생성하는 단계를 포함하며, 상기 상태 테이블을 생성하는 단계는,
    각각 입력 데이터의 카테고리를 나타내는 종단기호 세트를 식별하는 단계;
    각각 종단 또는 비종단 기호 중 적어도 한 개의 패턴을 나타내는 비종단 기호의 세트를 식별하는 단계;
    문법 규칙 세트를 식별하는 단계;
    최고수준의 규칙을 식별하는 단계;
    속성 세트를 식별하는 단계;
    식별된 종단 및 비종단 기호에 대한 제1 세트를 연산하는 단계;
    식별된 종단 및 비종단 기호에 대한 다음 세트를 연산하는 단계; 및
    대응하는 다음 세트의 구성원 각각으로 최상위 규칙의 클로저로부터 시작 상태를 생성하는 단계를 포함하는 것을 특징으로 하는 방법.
  15. 제14항에 있어서,
    상기 상태 테이블을 생성하는 단계는,
    변화하는 상태 전이가 시작 상태에서부터 존재하는 각 상태의 클로저를 재귀적으로 생성하여 시작 상태로부터 도달가능한 모든 상태를 생성하는 단계,
    조합 및 축약에 의해 세트의 상태를 최적화하는 단계, 및
    각 상태에 대해 동작, 전이, 및 타임아웃값을 생성하는 단계를 포함하는 것을 특징으로 하는 방법.
  16. 제14항에 있어서,
    상기 문법 규칙의 세트는 A → B0 . . . Bn의 형태를 취하는 공백이 없는 규칙으로서, A 는 비종단 기호이고, B0 내지 Bn 은 종단 또는 비종단 기호이며 각 공백의 규칙은 유형 A -> τ 을 취하고, τ 는 유한한 시간 양이고, 일부 유용한 시간의 단위로 특징지어지거나, 또는 무한하게, 무한한 시간 양을 나타내는 것을 특징으로 하는 방법.
  17. 제14항에 있어서,
    상기 속성의 세트는 유형 α:T = {A0 → λ0, . . . An → λn} 를 가지며, α 는 속성의 이름이며, T 는 속성의 유형이고, A 는 비종단 기호이고, λ 는 기호에 대한 속성의 값을 연산하기 위하여 사용될 함수인 것을 특징으로 하는 방법.
  18. 제14항에 있어서,
    상기 최상위 규칙은 유형 Ω → B 을 가질 수 있으며, B 는 종단 또는 비종단 기호 중 하나인 것을 특징으로 하는 방법.
  19. 물리량을 모니터링하고 모니터링된 물리량을 디지털 형태의 데이터 스트림으로 변환하는 하드웨어 센서로부터 데이터 스트림을 수신하는 단계;
    상기 데이터 스트림을 입력큐에 저장하며, 상기 데이터 스트림 내의 각 토큰이 토큰이 수신되는 시간 스탬프와 함께 저장되는 단계;
    한 방향으로 상기 입력큐를 통해 토큰을 판독하며 임의의 이전에 독출한 토큰은 독출하지 않음으로서 한 개 이상의 기설정된 패턴을 매칭시키는 데이터 스트림에서 패턴을 식별하는 단계; 및
    상기 데이터 스트림에서 상기 기설정된 패턴을 식별하여, 상기 기설정된 패턴이 식별된 출력큐에서 양의 표시를 출력하는 단계를 포함하는 것을 특징으로 하는 방법.
  20. 제19항에 있어서,
    상기 기설정된 패턴이 데이터 스트림에서 식별되지 않은 동안, 상기 기설정된 패턴이 식별된 출력큐에서 음의 표시를 출력하는 것을 추가로 포함하며,
    상기 기설정된 패턴은 상기 상태 테이블 및 상기 상태 스택에 저장되는 것을 특징으로 하는 방법.
KR1020187030471A 2016-03-23 2017-03-23 실시간 데이터플로우 프로그래밍을 위한 효율적인 상태 머신 KR102128571B1 (ko)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201662312223P 2016-03-23 2016-03-23
US201662312187P 2016-03-23 2016-03-23
US201662312106P 2016-03-23 2016-03-23
US201662312255P 2016-03-23 2016-03-23
US62/312,187 2016-03-23
US62/312,223 2016-03-23
US62/312,255 2016-03-23
US62/312,106 2016-03-23
PCT/US2017/023906 WO2017165708A1 (en) 2016-03-23 2017-03-23 Efficient state machines for real-time dataflow programming

Publications (2)

Publication Number Publication Date
KR20180122017A true KR20180122017A (ko) 2018-11-09
KR102128571B1 KR102128571B1 (ko) 2020-06-30

Family

ID=59897282

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020187030472A KR102092721B1 (ko) 2016-03-23 2017-03-23 실시간 데이터플로우 프로그래밍에서 패턴 구동형 반응의 구성
KR1020187030471A KR102128571B1 (ko) 2016-03-23 2017-03-23 실시간 데이터플로우 프로그래밍을 위한 효율적인 상태 머신
KR1020187030473A KR102092722B1 (ko) 2016-03-23 2017-03-23 실시간 데이터플로우 프로그래밍 언어를 위한 도구 및 방법

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020187030472A KR102092721B1 (ko) 2016-03-23 2017-03-23 실시간 데이터플로우 프로그래밍에서 패턴 구동형 반응의 구성

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020187030473A KR102092722B1 (ko) 2016-03-23 2017-03-23 실시간 데이터플로우 프로그래밍 언어를 위한 도구 및 방법

Country Status (8)

Country Link
US (11) US10127022B2 (ko)
EP (3) EP3433711A4 (ko)
JP (5) JP6896759B2 (ko)
KR (3) KR102092721B1 (ko)
CN (5) CN115373977A (ko)
AU (4) AU2017238637B2 (ko)
SA (2) SA518400085B1 (ko)
WO (3) WO2017165712A1 (ko)

Families Citing this family (128)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10140191B2 (en) * 2015-07-24 2018-11-27 Accenture Global Services Limited System for development of IoT system architecture
US10324773B2 (en) * 2015-09-17 2019-06-18 Salesforce.Com, Inc. Processing events generated by internet of things (IoT)
WO2017165712A1 (en) 2016-03-23 2017-09-28 FogHorn Systems, Inc. Composition of pattern-driven reactions in real-time dataflow programming
US10110563B1 (en) * 2016-04-28 2018-10-23 Palo Alto Networks, Inc. Reduction and acceleration of a deterministic finite automaton
US10635420B2 (en) 2016-07-12 2020-04-28 Oracle International Corporation Overriding a migrated method in an updated type
EP3475888A1 (en) 2016-08-22 2019-05-01 Oracle International Corporation System and method for ontology induction through statistical profiling and reference schema matching
US20180068004A1 (en) * 2016-09-08 2018-03-08 BigStream Solutions, Inc. Systems and methods for automatic transferring of at least one stage of big data operations from centralized systems to at least one of event producers and edge devices
US10055339B2 (en) * 2016-09-28 2018-08-21 Wipro Limited Methods and systems for testing mobile applications
US10025566B1 (en) * 2016-10-07 2018-07-17 The Mathworks, Inc. Scheduling technique to transform dataflow graph into efficient schedule
US11323519B2 (en) * 2017-04-19 2022-05-03 Microsoft Technology Licensing, Llc Internet of things pub-sub data publisher
GB201706300D0 (en) * 2017-04-20 2017-06-07 Microsoft Technology Licensing Llc Debugging tool
US11537368B2 (en) * 2017-06-03 2022-12-27 Apple Inc. Integrating machine learning models into an interpreted software development environment
US10387129B2 (en) * 2017-06-29 2019-08-20 General Electric Company Deployment of environment-agnostic services
US10872149B1 (en) 2017-07-25 2020-12-22 Perspecta Labs Inc. Anomaly detection based on side-channel emanations
US10452624B2 (en) * 2017-08-02 2019-10-22 Vmware, Inc. Storage and analysis of data records associated with managed devices in a device management platform
US10545742B2 (en) * 2017-09-06 2020-01-28 Nicira, Inc. Annotation-driven framework for generating state machine updates
WO2019068036A1 (en) * 2017-09-30 2019-04-04 Oracle International Corporation DEPLOYMENT OF CONTAINERS BASED ON ENVIRONMENTAL REQUIREMENTS
US11113608B2 (en) 2017-10-30 2021-09-07 Accenture Global Solutions Limited Hybrid bot framework for enterprises
EP3704587A1 (en) * 2017-11-02 2020-09-09 Silicon Mobility SAS Software environment for control engine debug, test, calibration and tuning
US10310959B2 (en) 2017-11-07 2019-06-04 Bank Of America Corporation Pre-deployment validation system using intelligent databases
RO133453A2 (ro) * 2017-12-28 2019-06-28 Siemens Aktiengesellschaft Motor de procesare a semnalelor şi evenimentelor
US11012416B2 (en) * 2018-01-15 2021-05-18 Akamai Technologies, Inc. Symbolic execution for web application firewall performance
CN108400917B (zh) * 2018-01-22 2021-05-18 深圳市新科聚合网络技术有限公司 一种面向智能制造的边缘计算网关及系统
CN110347396B (zh) * 2018-04-03 2023-05-26 阿里巴巴集团控股有限公司 系统构建方法、控制方法、装置、控制系统及计算设备
CN111954866A (zh) * 2018-04-13 2020-11-17 三菱电机株式会社 数据处理装置、数据处理方法及程序
US10986183B2 (en) * 2018-05-02 2021-04-20 Hewlett Packard Enterprise Development Lp Data management in a network environment
US11388222B2 (en) * 2018-05-04 2022-07-12 Verizon Patent And Licensing Inc. Mobile edge computing
US11226797B2 (en) * 2018-05-24 2022-01-18 Chaldal, Inc. Representation and analysis of workflows using abstract syntax trees
EP3579174A1 (en) 2018-06-08 2019-12-11 Hexagon Technology Center GmbH Mobile vehicles in manufacturing
US11275485B2 (en) * 2018-06-15 2022-03-15 Sap Se Data processing pipeline engine
US10666557B2 (en) * 2018-08-03 2020-05-26 Hitachi, Ltd. Method to manage data flow for edge-core distributed analytics systems
CN109150703B (zh) * 2018-08-23 2019-07-02 北方工业大学 一种工业物联网智能云网关及其通信方法
WO2020043538A1 (en) * 2018-08-28 2020-03-05 Koninklijke Philips N.V. A distributed edge-environment computing platform for context-enabled ambient intelligence, environmental monitoring and control, and large-scale near real-time informatics
WO2020047292A2 (en) 2018-08-29 2020-03-05 Fathym, Inc. Method for communicating and debugging across iot systems
WO2020041872A1 (en) * 2018-08-30 2020-03-05 Streamworx.Ai Inc. Systems, methods and computer program products for scalable, low-latency processing of streaming data
US11252258B2 (en) * 2018-09-27 2022-02-15 Hewlett Packard Enterprise Development Lp Device-aware dynamic protocol adaptation in a software-defined network
EP3629151A1 (de) 2018-09-28 2020-04-01 dspace digital signal processing and control engineering GmbH Verfahren zum ändern von modellen für die erzeugung von quellcode
US20200117576A1 (en) * 2018-10-12 2020-04-16 Ca, Inc. Assessing the container-readiness of software applications
US12007732B2 (en) 2019-07-12 2024-06-11 Johnson Controls Tyco IP Holdings LLP HVAC system with building infection control
US11960261B2 (en) 2019-07-12 2024-04-16 Johnson Controls Tyco IP Holdings LLP HVAC system with sustainability and emissions controls
CN109299380B (zh) * 2018-10-30 2021-07-02 浙江工商大学 在线教育平台中基于多维特征的习题个性化推荐方法
CN109471401B (zh) * 2018-11-08 2021-02-26 金蝶软件(中国)有限公司 数据处理方法以及边缘计算数据盒
US11727021B2 (en) * 2018-12-14 2023-08-15 Tibco Software Inc. Process control tool for processing big and wide data
KR102620904B1 (ko) * 2019-01-10 2024-01-03 브레인 코그니티브스 피티이. 엘티디. 자연 솔루션 언어
US11761660B2 (en) 2019-01-30 2023-09-19 Johnson Controls Tyco IP Holdings LLP Building control system with feedback and feedforward total energy flow compensation
US11150926B2 (en) * 2019-02-22 2021-10-19 International Business Machines Corporation Native code generation for cloud services
US11790263B2 (en) 2019-02-25 2023-10-17 International Business Machines Corporation Program synthesis using annotations based on enumeration patterns
KR102188562B1 (ko) * 2019-02-28 2020-12-09 숙명여자대학교산학협력단 시각 블록 언어 기반 IoT 응용 프로그램 개발 도구 및 그 동작 방법
ES2784865A1 (es) * 2019-03-26 2020-10-01 Ind Internet Of Robots S L U Sistema de monitorizacion de maquinaria industrial y metodo para llevar a cabo dicha monitorizacion
US11616839B2 (en) 2019-04-09 2023-03-28 Johnson Controls Tyco IP Holdings LLP Intelligent edge computing platform with machine learning capability
US10951387B2 (en) 2019-04-22 2021-03-16 Pinnacle Peak Holding Corporation Systems and methods for self-formation and self-management of full-duplex communication networks
CN112181396A (zh) * 2019-07-02 2021-01-05 北京京东尚科信息技术有限公司 Rn代码自动生成系统、方法、设备及介质
US11714393B2 (en) 2019-07-12 2023-08-01 Johnson Controls Tyco IP Holdings LLP Building control system with load curtailment optimization
US11274842B2 (en) 2019-07-12 2022-03-15 Johnson Controls Tyco IP Holdings LLP Systems and methods for optimizing ventilation, filtration, and conditioning schemes for buildings
US20210034031A1 (en) * 2019-08-02 2021-02-04 Hitachi, Ltd. Using ai for ensuring data integrity of industrial controllers
US11074081B2 (en) * 2019-08-02 2021-07-27 GM Global Technology Operations LLC Architecture and method supporting multiple vision stream using shared server on embedded platform
US10691728B1 (en) * 2019-08-13 2020-06-23 Datadog, Inc. Transforming a data stream into structured data
TWI720580B (zh) * 2019-08-14 2021-03-01 樂澄資訊顧問有限公司 視覺模組化程式系統
US11121905B2 (en) 2019-08-15 2021-09-14 Forcepoint Llc Managing data schema differences by path deterministic finite automata
WO2021042065A1 (en) * 2019-08-29 2021-03-04 Unilog Content Solutions, Llc System and method for non-programmatically constructing software solutions on configurable computing platform
WO2021050816A1 (en) * 2019-09-12 2021-03-18 Jabil Inc. Method and system for managing secure iot device applications
CN110647324B (zh) * 2019-09-18 2023-05-16 编缘(杭州)教育科技有限公司 Python与Scratch交互式编程方法及电子设备
US10942710B1 (en) 2019-09-24 2021-03-09 Rockwell Automation Technologies, Inc. Industrial automation domain-specific language programming paradigm
US11048483B2 (en) 2019-09-24 2021-06-29 Rockwell Automation Technologies, Inc. Industrial programming development with an extensible integrated development environment (IDE) platform
US11042362B2 (en) 2019-09-26 2021-06-22 Rockwell Automation Technologies, Inc. Industrial programming development with a trained analytic model
US11392112B2 (en) 2019-09-26 2022-07-19 Rockwell Automation Technologies, Inc. Virtual design environment
US11163536B2 (en) 2019-09-26 2021-11-02 Rockwell Automation Technologies, Inc. Maintenance and commissioning
US11080176B2 (en) 2019-09-26 2021-08-03 Rockwell Automation Technologies, Inc. Testing framework for automation objects
US11733687B2 (en) 2019-09-26 2023-08-22 Rockwell Automation Technologies, Inc. Collaboration tools
WO2021061397A1 (en) * 2019-09-27 2021-04-01 Hypernet Labs, Inc. Containerizing source code for execution in different language using drag-drop operation
US11422547B2 (en) 2019-10-21 2022-08-23 Johnson Controls Tyco IP Holdings LLP Building management system with machine learning for detecting anomalies in vibration data sets
US11150877B2 (en) * 2019-11-06 2021-10-19 Google Llc Automatically generating machine learning models for software tools that operate on source code
US11632333B2 (en) 2019-11-14 2023-04-18 Sayantek, Inc System and method for implementation of a distributed data flow-based framework
CN112817573B (zh) * 2019-11-18 2024-03-01 北京沃东天骏信息技术有限公司 用于构建流式计算应用的方法、装置、计算机系统和介质
US10929181B1 (en) * 2019-11-22 2021-02-23 Iterate Studio, Inc. Developer independent resource based multithreading module
CN110908916B (zh) * 2019-11-27 2022-02-22 威创集团股份有限公司 一种调试工具及调试方法
US11272015B2 (en) * 2019-12-13 2022-03-08 Liveperson, Inc. Function-as-a-service for two-way communication systems
US11763217B2 (en) 2019-12-20 2023-09-19 Iterate Studio, Inc. Dynamic feature loading
CN111459965B (zh) * 2019-12-24 2023-05-05 中国科学院沈阳自动化研究所 一种面向边缘计算的信息监控系统
WO2021137669A1 (ko) * 2019-12-30 2021-07-08 매니코어소프트주식회사 딥러닝을 위한 가속기용 프로그램 생성 방법
WO2021154319A1 (en) * 2020-01-28 2021-08-05 Ab Initio Technology Llc Editor for generating computational graphs
EP3869228B1 (en) 2020-02-21 2022-07-06 Tata Consultancy Services Limited Edge based sensor actuation and control in iot network for event monitoring
US11061652B1 (en) * 2020-03-26 2021-07-13 Cognizant Technology Solutions India Pvt. Ltd. System and a method for moving legacy applications to cloud
US11308447B2 (en) 2020-04-02 2022-04-19 Rockwell Automation Technologies, Inc. Cloud-based collaborative industrial automation design environment
WO2021211911A1 (en) * 2020-04-16 2021-10-21 Blackswan Technologies Inc. Artificial intelligence cloud operating system
CN111782194B (zh) * 2020-06-26 2022-09-13 西北工业大学 一种基于航空嵌入式开放体系架构的可移植单元代码自动生成方法
US20220004369A1 (en) * 2020-07-01 2022-01-06 Johnson Controls Tyco IP Holdings LLP Rule builder and simulator tool for creating complex event processing rules
EP3940586A1 (en) * 2020-07-17 2022-01-19 Sony Group Corporation An electronic device and a related method for detecting and counting an action
US20230327957A1 (en) * 2020-08-27 2023-10-12 Siemens Aktiengesellschaft Centralized management of data flow maps for distributed edge node deployment
SE545771C2 (en) * 2020-08-28 2024-01-09 Stream Analyze Sweden Ab Method and system for data processing
CN112052053B (zh) * 2020-10-10 2023-12-19 国科晋云技术有限公司 一种清理高性能计算集群中挖矿程序的方法及系统
CN112394914B (zh) * 2020-10-28 2022-05-24 浙江大学 一种面向物联网应用的以边缘为中心的编程方法
US11700178B2 (en) 2020-10-30 2023-07-11 Nutanix, Inc. System and method for managing clusters in an edge network
US11290330B1 (en) 2020-10-30 2022-03-29 Nutanix, Inc. Reconciliation of the edge state in a telemetry platform
US11374807B2 (en) 2020-10-30 2022-06-28 Nutanix, Inc. Handling dynamic command execution in hybrid cloud environments
EP4242830A1 (en) * 2020-11-09 2023-09-13 Limited Liability Company "Craft Systems" System and method for creating and executing highly scaled cloud applications
US11550583B2 (en) 2020-11-13 2023-01-10 Google Llc Systems and methods for handling macro compatibility for documents at a storage system
CN112363856A (zh) * 2020-11-19 2021-02-12 北京计算机技术及应用研究所 一种基于dds实现深度学习框架与应用程序互操作的方法
CN112416197B (zh) * 2020-11-23 2021-12-03 山东师范大学 基于Excel和VBA的程序单步演示装置及方法
CN112327815A (zh) * 2020-11-30 2021-02-05 北京一雄信息科技有限公司 一种批量测试汽车诊断仪数据流准确性的方法及装置
CN112506489B (zh) * 2020-11-30 2024-06-18 广州市智能软件产业研究院 一种安全协议建模端与验证端的跨平台方法、计算机及存储介质
US11403090B2 (en) 2020-12-08 2022-08-02 Alibaba Group Holding Limited Method and system for compiler optimization based on artificial intelligence
KR102305845B1 (ko) 2020-12-21 2021-09-29 쿠팡 주식회사 코드의 검증을 위한 전자 장치 및 그 방법
JP7492451B2 (ja) 2020-12-22 2024-05-29 株式会社日立製作所 データ制御システム及びデータ制御方法
US20210117418A1 (en) * 2020-12-23 2021-04-22 Vikram Dadwal Time-aware general-purpose input output for industrial control systems
EP4036752A1 (en) * 2021-01-29 2022-08-03 ABB Schweiz AG Method for analysing process data related to a segment of a production process
US20220300850A1 (en) * 2021-03-16 2022-09-22 Data Gran, Inc. End-to-end machine learning pipelines for data integration and analytics
KR102500395B1 (ko) * 2021-03-30 2023-02-16 서울시립대학교 산학협력단 프로그램 소스코드의 버그를 정정하는 장치 및 방법
JP2024520512A (ja) 2021-05-28 2024-05-24 ジョンソン・コントロールズ・タイコ・アイピー・ホールディングス・エルエルピー カスケード制御システム、カスケード制御方法及び非一時的コンピュータ可読媒体
CN113312652B (zh) * 2021-06-25 2024-05-03 国网辽宁省电力有限公司电力科学研究院 基于改进cat的云边协同电力终端采集数据完整性验证系统
US20230090918A1 (en) * 2021-09-21 2023-03-23 Blackberry Limited Method and system for vehicle data file playback
US11902664B2 (en) 2021-09-22 2024-02-13 Adam A. Locke Cellular telephone with protracting monitor screen and camera
CN113944601A (zh) * 2021-10-15 2022-01-18 上海大学 一种用于风机高频海量数据实时采集传输及处理的方法
CN118202368A (zh) * 2021-10-19 2024-06-14 皇家飞利浦有限公司 使用正则表达式分组和服务水平依赖的高效日志文件传输和处理
WO2023081634A1 (en) * 2021-11-05 2023-05-11 Swarm Engineering, Inc. Method of creating self-assembling, transient analytic and learning agents in a message-driven architecture
CN114385178A (zh) * 2021-12-14 2022-04-22 厦门大学 基于抽象语法树结构信息增强的代码生成方法
KR102455142B1 (ko) * 2022-01-18 2022-10-17 한국과학기술원 컨테이너 환경을 위한 eBPF(extended Berkeley Packet Filter)/XDP(Express Data Path)에 기반한 고속 네트워크 패킷 페이로드 검사 시스템
CN114115834B (zh) * 2022-01-25 2022-04-26 之江实验室 一种软硬件协同编译处理方法及系统
US11907142B2 (en) 2022-02-04 2024-02-20 Red Hat, Inc. Configuring polling times for software applications
WO2023167862A1 (en) 2022-03-01 2023-09-07 Johnson Controls Tyco IP Holdings LLP Building automation system with flexible architecture
US20230280059A1 (en) * 2022-03-01 2023-09-07 Johnson Controls Tyco IP Holdings LLP Building automation system with edge device local configuration
US11765065B1 (en) 2022-03-23 2023-09-19 Nutanix, Inc. System and method for scalable telemetry
TWI823408B (zh) * 2022-05-27 2023-11-21 國立成功大學 機械設備雲端控制系統
US11989537B2 (en) * 2022-06-09 2024-05-21 Xilinx, Inc. Dataflow-based computer program visualization and refactoring
US11972257B2 (en) * 2022-07-12 2024-04-30 Rockwell Automation Technologies, Inc. Industrial automation system topology with point to point business rule integration
WO2024068483A1 (en) 2022-09-30 2024-04-04 Sun Chemical B.V. Led-curable offset inks containing aluminum additives
EP4357915A1 (en) * 2022-10-18 2024-04-24 Nokia Solutions and Networks Oy A computer program generating apparatus and method
KR102651797B1 (ko) * 2023-09-18 2024-03-28 (주) 웨다 Ai 비전문가를 위한 소프트웨어 정의 제조 기반의 머신러닝 플랫폼 시스템

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4975865A (en) * 1989-05-31 1990-12-04 Mitech Corporation Method and apparatus for real-time control
US20030035582A1 (en) * 2001-08-14 2003-02-20 Christian Linhart Dynamic scanner
KR101019228B1 (ko) * 2007-10-22 2011-03-04 한국산업기술평가관리원 분산 컴퓨팅 기반 구조를 통해 센서 및 액튜에이터 애플리케이션을 개발, 배치하기 위한 시스템 및 방법
US20130110745A1 (en) * 2011-10-31 2013-05-02 International Business Machines Incorporated Rule generation for event processing system
US20150161214A1 (en) * 2013-12-05 2015-06-11 Oracle International Corporation Pattern matching across multiple input data streams

Family Cites Families (95)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3979733A (en) * 1975-05-09 1976-09-07 Bell Telephone Laboratories, Incorporated Digital data communications system packet switch
US5181025A (en) * 1991-05-24 1993-01-19 The United States Of America As Represented By The Secretary Of The Air Force Conformal telemetry system
JPH06168222A (ja) * 1992-11-30 1994-06-14 Toshiba Corp プラントのシミュレーション装置
DE69432746T2 (de) * 1994-06-10 2004-03-25 Hewlett-Packard Co. (N.D.Ges.D.Staates Delaware), Palo Alto Ereignisverarbeitungssystem und Verfahren zur Herstellen eines solchen Systems
JP2965058B2 (ja) * 1995-12-18 1999-10-18 日本電気株式会社 Cpu命令エミュレートシステム
US5916305A (en) * 1996-11-05 1999-06-29 Shomiti Systems, Inc. Pattern recognition in data communications using predictive parsers
US5896522A (en) * 1996-12-31 1999-04-20 Unisys Corporation Selective emulation interpretation using transformed instructions
JP3033713B2 (ja) * 1997-06-12 2000-04-17 北海道日本電気ソフトウェア株式会社 仮想計算機エミュレート装置
US7743362B2 (en) * 1998-02-17 2010-06-22 National Instruments Corporation Automatic generation of application domain specific graphical programs
US6826756B1 (en) * 1998-06-30 2004-11-30 Symbol Technologies, Inc. Automatic transfer of data from an input device to a software application
US6522875B1 (en) 1998-11-17 2003-02-18 Eric Morgan Dowling Geographical web browser, methods, apparatus and systems
JP3788111B2 (ja) * 1999-06-30 2006-06-21 株式会社デンソー 情報サービスシステム
US7937665B1 (en) * 2000-06-13 2011-05-03 National Instruments Corporation System and method for automatically generating a graphical program to implement a prototype
US7590644B2 (en) * 1999-12-21 2009-09-15 International Business Machine Corporation Method and apparatus of streaming data transformation using code generator and translator
US6725287B1 (en) 2000-11-09 2004-04-20 Elity Systems, Inc. Method and system for capturing streaming data by an actionable information engine
US9141708B2 (en) * 2001-02-23 2015-09-22 Metaframe Technologies Gmbh Methods for generating selection structures, for making selections according to selection structures and for creating selection descriptions
US7627860B2 (en) * 2001-08-14 2009-12-01 National Instruments Corporation Graphically deployment of a program with automatic conversion of program type
US7203635B2 (en) 2002-06-27 2007-04-10 Microsoft Corporation Layered models for context awareness
US7293112B2 (en) * 2002-11-12 2007-11-06 National Instruments Corporation Graphical program node for displaying acquired images
JP2004303114A (ja) * 2003-04-01 2004-10-28 Hitachi Ltd インタープリタおよびネイティブコード実行方法
US20070011334A1 (en) * 2003-11-03 2007-01-11 Steven Higgins Methods and apparatuses to provide composite applications
US7318075B2 (en) * 2004-02-06 2008-01-08 Microsoft Corporation Enhanced tabular data stream protocol
US7836426B2 (en) * 2004-05-06 2010-11-16 National Instruments Corporation Automatic generation of application domain specific graphical programs
US7650574B2 (en) * 2004-05-11 2010-01-19 National Instruments Corporation Visually indicating problems found during programmatic analysis of a graphical program
US7650594B2 (en) * 2004-05-27 2010-01-19 National Instruments Corporation Graphical program analyzer with framework for adding user-defined tests
JP2006095440A (ja) * 2004-09-29 2006-04-13 Toshiba Corp 下水処理場の運転管理システム
JP2008524965A (ja) 2004-12-21 2008-07-10 ミスルトウ テクノロジーズ, インコーポレイテッド ネットワークインターフェイスおよびファイヤーウォールデバイス
US7627544B2 (en) * 2005-05-20 2009-12-01 Microsoft Corporation Recognizing event patterns from event streams
US7907610B2 (en) * 2005-05-23 2011-03-15 Nxp B.V. Integrated circuit with internal communication network
US20070044072A1 (en) * 2005-08-16 2007-02-22 Hayles Timothy J Automatically Generating a Graphical Data Flow Program Based on a Circuit Diagram
US7864178B2 (en) * 2005-11-09 2011-01-04 National Instruments Corporation Creating machine vision inspections using a state diagram representation
US8543337B2 (en) 2006-04-21 2013-09-24 The Mathworks, Inc. Block diagram explorer in a method and apparatus for integrated modeling, simulation and analysis of chemical and biological systems
US8046739B2 (en) * 2006-08-04 2011-10-25 National Instruments Corporation System and method for enabling a graphical program to propagate attributes of inputs and outputs of blocks
US9038041B2 (en) * 2006-12-04 2015-05-19 Tibco Software, Inc. Stream processor with compiled programs
US8370812B2 (en) 2007-04-02 2013-02-05 International Business Machines Corporation Method and system for automatically assembling processing graphs in information processing systems
US7899904B2 (en) * 2007-04-30 2011-03-01 Lsi Corporation Hardware processing of regular expressions
US8572155B2 (en) 2007-08-23 2013-10-29 Applied Materials, Inc. Virtual sensors
US8364456B2 (en) * 2008-01-10 2013-01-29 The Mathworks, Inc. Conditionally executed states
KR101468546B1 (ko) 2008-02-11 2014-12-03 삼성전자 주식회사 이미지 센서의 구동 방법
US20090228407A1 (en) 2008-03-05 2009-09-10 The Boeing Company Distributed cognitive architecture
US8589436B2 (en) * 2008-08-29 2013-11-19 Oracle International Corporation Techniques for performing regular expression-based pattern matching in data streams
CN101442540B (zh) * 2008-12-30 2012-09-05 合肥昊特信息科技有限公司 基于现场可编程门阵列的高速模式匹配算法
US8250016B2 (en) * 2009-04-17 2012-08-21 Alcatel Lucent Variable-stride stream segmentation and multi-pattern matching
US8286191B2 (en) * 2009-05-14 2012-10-09 International Business Machines Corporation Dynamically composing data stream processing applications
US8880524B2 (en) * 2009-07-17 2014-11-04 Apple Inc. Scalable real time event stream processing
US8584120B2 (en) * 2009-11-23 2013-11-12 Julian Michael Urbach Stream-based software application delivery and launching system
US9864588B2 (en) 2009-12-09 2018-01-09 The Mathworks, Inc. Canonicalized versions of reuse candidates in graphical state diagrams
CN101860978B (zh) 2010-05-14 2012-05-09 南京邮电大学 一种物联网体系结构
US8887121B2 (en) * 2010-07-30 2014-11-11 National Instruments Corporation Developing programs for hardware implementation in a graphical specification and constraint language
WO2012061109A1 (en) * 2010-10-25 2012-05-10 Ab Initio Technology Llc Managing data set objects in a dataflow graph that represents a computer program
EP2668574B1 (en) * 2011-01-25 2021-11-24 Micron Technology, INC. Utilizing special purpose elements to implement a fsm
US9858051B2 (en) * 2011-06-24 2018-01-02 Cavium, Inc. Regex compiler
JP5640910B2 (ja) * 2011-06-27 2014-12-17 富士通株式会社 照合装置および照合プログラム
US8948643B2 (en) * 2011-06-30 2015-02-03 Xerox Corporation Method and system for controlling multiple printers in a TISP or TIPP system for increased stability
CA2848988C (en) 2011-09-19 2018-05-22 Tata Consultancy Services Limited A computing platform for development and deployment of sensor data based applications and services
US20130144814A1 (en) * 2011-12-05 2013-06-06 International Business Machines Corporation Conditional probability operator for event processing systems
US20130191809A1 (en) * 2012-01-25 2013-07-25 Microsoft Corporation Graphical representation of an order of operations
WO2013123373A1 (en) * 2012-02-15 2013-08-22 The Mathworks, Inc. Generating a state diagram
US9141631B2 (en) * 2012-04-16 2015-09-22 International Business Machines Corporation Table boundary detection in data blocks for compression
US9104538B2 (en) 2012-06-08 2015-08-11 Airbiquity Inc. Assessment of electronic sensor data to remotely identify a motor vehicle and monitor driver behavior
US20140013313A1 (en) * 2012-07-03 2014-01-09 Johan Eker Editor/Development Tool for Dataflow Programs
US9253054B2 (en) * 2012-08-09 2016-02-02 Rockwell Automation Technologies, Inc. Remote industrial monitoring and analytics using a cloud infrastructure
US8893080B2 (en) * 2012-08-15 2014-11-18 Telefonaktiebolaget L M Ericsson (Publ) Parallelization of dataflow actors with local state
RU2608464C2 (ru) * 2012-09-28 2017-01-18 Телефонактиеболагет Лм Эрикссон (Пабл) Устройство, способ и сетевой сервер для обнаружения структур данных в потоке данных
US8914875B2 (en) 2012-10-26 2014-12-16 Facebook, Inc. Contextual device locking/unlocking
US9043264B2 (en) * 2012-12-14 2015-05-26 International Business Machines Corporation Scanning data streams in real-time against large pattern collections
CN103024059B (zh) 2012-12-19 2015-08-26 北京时代凌宇科技有限公司 一种物联网中间件系统
EP3200131A1 (en) * 2013-03-15 2017-08-02 Fisher-Rosemount Systems, Inc. Data modeling studio
CN103200249A (zh) 2013-03-26 2013-07-10 大连理工大学 物联网智能数据网关系统的实现方法
US9235395B2 (en) * 2013-05-30 2016-01-12 National Instruments Corporation Graphical development and deployment of parallel floating-point math functionality on a system with heterogeneous hardware components
KR20150049763A (ko) 2013-10-31 2015-05-08 대우조선해양 주식회사 부유식 복합 화력발전 플랜트용 폐수 처리시스템의 용존 고형물 처리 시스템
EP3070606B1 (en) 2013-11-13 2022-03-16 Fujitsu Limited Event management program, event management method, and distributed system
EP3087508A1 (en) * 2013-12-23 2016-11-02 British Telecommunications Public Limited Company Improved pattern matching machine
US9843647B2 (en) 2014-02-25 2017-12-12 Here Global B.V. Method and apparatus for providing selection and prioritization of sensor data
US9806974B2 (en) 2014-04-23 2017-10-31 Cisco Technology, Inc. Efficient acquisition of sensor data in an automated manner
US9712645B2 (en) 2014-06-26 2017-07-18 Oracle International Corporation Embedded event processing
US20160065306A1 (en) 2014-09-02 2016-03-03 Chin Sheng Henry Chong System and method for green communication for intelligent mobile internet of things
CN104361058A (zh) * 2014-10-31 2015-02-18 广东工业大学 一种面向海量数据流的哈希结构复杂事件检测方法
US10054450B2 (en) 2014-11-21 2018-08-21 Here Global B.V. Method and apparatus for determining trajectory paths on a transportation structure
US10599982B2 (en) 2015-02-23 2020-03-24 Machinesense, Llc Internet of things based determination of machine reliability and automated maintainenace, repair and operation (MRO) logs
US9495647B2 (en) 2015-02-24 2016-11-15 Sas Institute Inc. Acceleration of sparse support vector machine training through safe feature screening
US20170052767A1 (en) * 2015-08-20 2017-02-23 CITIUS SOFTWARE CORPORATION dba KBMax Visual rule language systems and methods for enterprise business software
DE112016003949T5 (de) * 2015-08-28 2018-05-17 Roman Glistvain Webbasierte programmierumgebung für eingebettete geräte
US10756991B2 (en) * 2015-09-17 2020-08-25 Salesforce.Com, Inc. Simplified entity engagement automation
US10331495B2 (en) * 2016-02-05 2019-06-25 Sas Institute Inc. Generation of directed acyclic graphs from task routines
WO2017165712A1 (en) * 2016-03-23 2017-09-28 FogHorn Systems, Inc. Composition of pattern-driven reactions in real-time dataflow programming
US11204815B2 (en) 2017-05-09 2021-12-21 Microsoft Technology Licensing, Llc Creation of modular applications with corresponding twins in the cloud
US10310896B1 (en) * 2018-03-15 2019-06-04 Sas Institute Inc. Techniques for job flow processing
US11782410B2 (en) 2020-06-06 2023-10-10 Honeywell International Inc. Building management system with control logic distributed between a virtual controller and a smart edge controller
EP3919992A1 (en) 2020-06-06 2021-12-08 Honeywell International Inc. Method and system for managing virtual controllers in a building management system
EP3919991A3 (en) 2020-06-06 2022-02-16 Honeywell International Inc. Method and system for configuring a building management system
US11940786B2 (en) 2020-06-06 2024-03-26 Honeywell International Inc. Building management system and method with virtual controller and failsafe mode
CN116134388A (zh) 2020-06-15 2023-05-16 霍尼韦尔国际公司 用于设施的边缘控制器
US11526449B2 (en) * 2020-08-31 2022-12-13 Advanced Micro Devices, Inc. Limited propagation of unnecessary memory updates
US11252209B1 (en) * 2021-07-13 2022-02-15 Audacious Inquiry, LLC Network architecture for parallel data stream analysis and modification

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4975865A (en) * 1989-05-31 1990-12-04 Mitech Corporation Method and apparatus for real-time control
US20030035582A1 (en) * 2001-08-14 2003-02-20 Christian Linhart Dynamic scanner
KR101019228B1 (ko) * 2007-10-22 2011-03-04 한국산업기술평가관리원 분산 컴퓨팅 기반 구조를 통해 센서 및 액튜에이터 애플리케이션을 개발, 배치하기 위한 시스템 및 방법
US20130110745A1 (en) * 2011-10-31 2013-05-02 International Business Machines Incorporated Rule generation for event processing system
US20150161214A1 (en) * 2013-12-05 2015-06-11 Oracle International Corporation Pattern matching across multiple input data streams

Also Published As

Publication number Publication date
AU2017238638B2 (en) 2022-02-03
US10127022B2 (en) 2018-11-13
EP3433769A4 (en) 2019-12-18
WO2017165713A1 (en) 2017-09-28
US10628135B2 (en) 2020-04-21
JP7371141B2 (ja) 2023-10-30
AU2017238633B2 (en) 2022-04-21
SA518400086B1 (ar) 2022-05-22
JP2019516167A (ja) 2019-06-13
EP3433711A4 (en) 2019-11-20
WO2017165712A1 (en) 2017-09-28
JP2022064982A (ja) 2022-04-26
CN108885545A (zh) 2018-11-23
EP3433769A1 (en) 2019-01-30
AU2017238638A2 (en) 2019-01-03
CN108885580A (zh) 2018-11-23
EP3433711A1 (en) 2019-01-30
JP2022062060A (ja) 2022-04-19
EP3433768A1 (en) 2019-01-30
US20230147358A1 (en) 2023-05-11
JP2019518264A (ja) 2019-06-27
US11422778B2 (en) 2022-08-23
AU2022202972A1 (en) 2022-05-26
US10977010B2 (en) 2021-04-13
US20200249920A1 (en) 2020-08-06
US20210232369A1 (en) 2021-07-29
KR102128571B1 (ko) 2020-06-30
US20170277800A1 (en) 2017-09-28
CN108885580B (zh) 2022-05-13
EP3433769B1 (en) 2024-05-08
JP7019589B2 (ja) 2022-02-15
US11226795B2 (en) 2022-01-18
US20170277521A1 (en) 2017-09-28
CN108885632B (zh) 2022-10-28
KR102092722B1 (ko) 2020-04-23
AU2017238633A1 (en) 2018-10-04
US20190079740A1 (en) 2019-03-14
EP3433768A4 (en) 2019-12-04
US20200183660A1 (en) 2020-06-11
JP6896759B2 (ja) 2021-06-30
CN115373977A (zh) 2022-11-22
KR20180122018A (ko) 2018-11-09
KR102092721B1 (ko) 2020-04-23
US11561774B2 (en) 2023-01-24
AU2017238638A1 (en) 2018-10-04
CN108885632A (zh) 2018-11-23
CN108885545B (zh) 2022-02-01
US20230367559A1 (en) 2023-11-16
JP2019512973A (ja) 2019-05-16
JP7326510B2 (ja) 2023-08-15
CN115629829A (zh) 2023-01-20
US10572230B2 (en) 2020-02-25
US20200192640A1 (en) 2020-06-18
US20170277560A1 (en) 2017-09-28
AU2017238637B2 (en) 2021-10-14
AU2017238637A1 (en) 2018-10-04
US10564941B2 (en) 2020-02-18
AU2022202972B2 (en) 2024-01-04
WO2017165708A1 (en) 2017-09-28
KR20180122019A (ko) 2018-11-09
SA518400085B1 (ar) 2022-08-25
US20220137936A1 (en) 2022-05-05

Similar Documents

Publication Publication Date Title
JP7326510B2 (ja) リアルタイムデータフロープログラミングのための効率的な状態機械

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant