KR102035984B1 - 데이터 보강 제안 기법 - Google Patents

데이터 보강 제안 기법 Download PDF

Info

Publication number
KR102035984B1
KR102035984B1 KR1020197012452A KR20197012452A KR102035984B1 KR 102035984 B1 KR102035984 B1 KR 102035984B1 KR 1020197012452 A KR1020197012452 A KR 1020197012452A KR 20197012452 A KR20197012452 A KR 20197012452A KR 102035984 B1 KR102035984 B1 KR 102035984B1
Authority
KR
South Korea
Prior art keywords
data
enrichment
identifier
computer
data source
Prior art date
Application number
KR1020197012452A
Other languages
English (en)
Other versions
KR20190049924A (ko
Inventor
안토니 니노 바이스
데이비드 마이클 로빈슨
하리하란 시바라마크리쉬난
Original Assignee
마이크로소프트 테크놀로지 라이센싱, 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 filed Critical 마이크로소프트 테크놀로지 라이센싱, 엘엘씨
Publication of KR20190049924A publication Critical patent/KR20190049924A/ko
Application granted granted Critical
Publication of KR102035984B1 publication Critical patent/KR102035984B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/90335Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 명세서에 기술된 청구대상의 측면들은 데이터 소스의 제안과 관련된다. 측면들에서, 데이터베이스에 대한 데이터 보강 제안을 제공하라는 요청이 제안 엔진에서 수신된다. 제안 엔진은 데이터베이스와 연관된 데이터의 정적 및 동적 분석을 수행할 수 있고 정책에 기초하여 제안을 추가로 개선할 수 있다. 제안 엔진은, 예를 들어 소프트웨어 개발자가 데이터 보강이 사용될지 여부를 나타낼 수 있게 하기 위해, 만약 존재한다면 데이터 보강 제안을 제공할 수 있다.

Description

데이터 보강 제안 기법{RECOMMENDING DATA ENRICHMENTS}
데이터베이스는 오늘날의 비즈니스에 있어서 흔히 쓰이는 유용한 물품이다. 매우 단순한 사업 소프트웨어 애플리케이션조차도 데이터베이스의 이용을 종종 포함할 것이다. 데이터베이스의 이용이 증가하면서, 비즈니스 및 다른 데이터베이스에서 발견되는 데이터를 증강하는 데이터를 제공하는 데이터 소스 또한 증가되었다. 예를 들어, 소프트웨어 개발자는 어드레스를 결정하기 위해 데이터베이스에 액세스하는 소프트웨어 애플리케이션을 생성할 수 있다. 목적지로 가기 위한 방향을 포함하는 맵을 생성하는 인터넷 상의 몇몇 데이터 소스가 입수가능하다. 다른 예시로서, 날씨 정보를 제공하는 인터넷 상의 몇몇 사이트가 존재한다. 실제로, 입수가능한 너무나 많은 데이터 소스가 존재하며, 개발자에게 있어서 이러한 데이터 소스를 발견하고 이용하는 것이 어려운 일이다.
본 명세서에 청구된 청구사항은 전술된 바와 같은 환경에서만 동작하거나 임의의 단점을 해결하는 실시예로 한정되지 않는다. 오히려, 이러한 배경은 단지 본 명세서에 기술된 일부 실시예가 실시될 수 있는 일 예시적인 기술 영역을 설명하기 위해 제공된 것이다.
간략하게, 본 명세서에 기술된 청구사항의 측면은 데이터 소스의 제안(recommendation)과 관련된다. 측면들에서, 데이터베이스에 대한 데이터 보강(data enrichment) 제안을 제공하라는 요청이 제안 엔진(recommendation engine)에서 수신된다. 제안 엔진은 데이터베이스와 연관된 데이터의 정적 및 동적 분석을 수행할 수 있으며, 정책(policy)에 기초하여 제안을 추가로 개선할 수 있다. 제안 엔진은 예를 들어 소프트웨어 개발자가 데이터 보강이 사용될지 여부를 나타낼 수 있게 하도록 만약 존재한다면 데이터 보강 제안을 제공할 수 있다.
도 1은 본 명세서에 기술된 청구대상의 측면들이 포함될 수 있는 예시적인 범용 컴퓨팅 환경을 나타낸 블록도;
도 2는 본 명세서에 기술된 청구대상의 측면들이 구현될 수 있는 예시적인 환경을 나타낸 블록도; 및
도 3-4는 본 명세서에 기술된 청구대상의 측면들에 따라 수행될 수 있는 예시적인 동작들을 일반적으로 나타낸 순서도.
본 명세서에서 사용되는 "포함하는"이라는 표현 및 그 변형 표현은 "포함하지만, 한정적이지 않음"을 나타내는 열린 의미의 표현으로서 해석된다. "또는"이라는 표현은 명확하게 따로 명시되지 않는 한 "및/또는"으로 해석된다. "기초하여"라는 표현은 "적어도 부분적으로 기초하여"로서 해석된다. "일 실시예" 및 "실시예"라는 표현은 "적어도 하나의 실시예"로서 해석된다. "다른 실시예"라는 표현은 "적어도 하나의 다른 실시예"로 해석된다.
본 명세서에서 사용되는 단수의 용어는 하나 이상의 해당 아이템 또는 동작을 포괄한다. 특히, 특허청구범위에서 아이템에 대한 언급은 일반적으로 해당 아이템이 적어도 하나 존재함을 의미하며 동작에 대한 언급은 해당 동작의 적어도 하나의 예시가 수행됨을 의미한다.
본 명세서에서 때때로 "제 1," "제 2," 제 3" 등의 표현이 사용될 수 있다. 추가적인 맥락이 없다면, 특허청구범위에서 이러한 표현은 순서를 의도하는 것이 아닌 식별을 위해 사용되는 것이다. 예를 들어, "제 1 버전" 및 "제 2 버전"이라는 구절이 반드시 제 1 버전이 가장 첫 버전이거나 제 2 버전에 앞서 생성되었음을 의미하는 것이 아니며, 제 1 버전이 제 2 버전에 앞서 요청 또는 동작된다는 것을 의미하는 것도 아니다. 오히려, 이러한 구절은 서로 다른 버전들을 식별하도록 사용된 것이다.
제목은 단지 편의를 위한 것으로, 주어진 주제에 대한 정보가 제목이 해당 주제를 나타내는 섹션 외에서 발견될 수도 있다.
명백하거나 내포된 다른 정의들이 아래에 포함될 수 있다.
예시적인 운영 환경
도 1은 본 명세서에 기술된 청구대상의 측면들이 구현될 수 있는 적절한 컴퓨팅 시스템 환경(100)의 예시를 도시한다. 컴퓨팅 시스템 환경(100)은 단지 적절한 컴퓨팅 환경의 일 예시이며, 본 명세서에 기술된 청구대상의 측면들의 기능 또는 이용의 범주와 관련한 어떠한 한정을 두기 위한 것이 아니다. 컴퓨팅 환경(100)이 예시적인 동작 환경(100)에 도시된 임의의 구성요소 또는 구성요소들의 조합과 관련된 어떠한 종속성 또는 필요조건을 갖는 것으로 해석되어서는 안된다.
본 명세서에 기술된 청구대상의 측면들은 다수의 다른 범용 또는 전용 컴퓨팅 시스템 환경 또는 구성으로 동작된다. 본 명세서에 기술된 청구대상의 측면들이 사용되기에 적합할 수 있는 잘 알려진 컴퓨팅 시스템, 환경, 또는 구성의 예시는 개인 컴퓨터, 서버 컴퓨터, 휴대용 또는 랩탑 디바이스, 멀티프로세서 시스템, 마이크로컨트롤러 기반의 시스템, 셋톱박스, 프로그램 가능한 소비자 전자기기, 네트워크 PC, 미니컴퓨터, 메인프레임 컴퓨터, PDA, 게임 디바이스, 프린터, 셋톱, 미디어 센터를 포함하는 어플라이언스 또는 다른 어플라이언스, 자동차에 내장 또는 부착된 컴퓨팅 디바이스, 다른 모바일 디바이스, 위의 시스템 또는 디바이스 중 임의의 시스템 또는 디바이스를 포함하는 분산 컴퓨팅 환경 등을 포함한다.
본 명세서에 기술된 청구대상의 측면들은 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터 실행가능한 명령의 일반적인 맥락으로 기술될 수 있다. 일반적으로, 프로그램 모듈은 루틴, 프로그램, 객체, 구성요소, 데이터 구조 등을 포함하며, 이는 특정 태스크를 수행하거나 특정 추출 데이터 유형을 구현한다. 본 명세서에 기술된 청구대상의 측면들은 또한 통신 네트워크를 통해 링크되는 원격 프로세싱 디바이스에 의해 태스크가 수행되는 분산 컴퓨팅 환경에서 실시될 수 있다. 분산 컴퓨팅 환경에서, 프로그램 모듈은 메모리 저장 디바이스를 포함하는 로컬 및 원격 컴퓨터 저장 매체 모두에 위치될 수 있다.
도 1을 참조하면, 본 명세서에 기술된 청구대상의 측면들을 구현하는 예시적인 시스템이 컴퓨터(110)의 형태로 범용 컴퓨팅 디바이스를 포함한다. 컴퓨터는 명령을 실행할 수 있는 임의의 전자 디바이스를 포함할 수 있다. 컴퓨터(110)의 구성요소는 처리 장치(120), 시스템 메모리(130) 및 시스템 메모리를 포함하는 다양한 시스템 구성요소를 처리 장치(120)에 연결시키는 시스템 버스(121)를 포함할 수 있다. 시스템 버스(121)는 메모리 버스 또는 메모리 컨트롤러, 주변 버스 및 임의의 다양한 버스 아키텍처를 이용하는 로컬 버스를 포함하는 몇몇 유형의 임의의 버스 구조일 수 있다. 예시로서, 이러한 아키텍처는 ISA(Industry Standard Architecture) 버스, MCA(Micro Channel Architecture) 버스, 개선된 ISA(EISA) 버스, VESA(Video Electronis Standards Association) 로컬 버스, Mezzanine 버스로도 알려져 있는 PCI(Peripheral Component Interconnect) 버스, PCI-X(Peripheral Component Interconnect Extended) 버스, AGP(Advanced Graphics Port) 및 PCI 익스프레스(PCIe)를 포함하지만, 이것으로 한정되는 것은 아니다.
컴퓨터(110)는 전형적으로 다양한 컴퓨터 판독가능한 매체를 포함한다. 컴퓨터 판독가능한 매체는 컴퓨터(110)에 의해 액세스될 수 있는 임의의 이용가능한 매체일 수 있으며, 휘발성 및 비휘발성 매체, 제거가능 및 제거 불가능 매체 모두를 포함한다. 예시로서, 컴퓨터 판독가능한 매체는 컴퓨터 저장 매체 및 통신 매체를 포함할 수 있지만, 이것으로 한정되는 것은 아니다.
컴퓨터 저장 매체는 컴퓨터 판독가능한 명령, 데이터 구조, 프로그램 모듈, 또는 다른 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현되는 휘발성 및 비휘발성, 제거가능 및 제거 불가능한 매체 모두를 포함한다. 컴퓨터 저장 매체는 RAM, ROM, EEPROM, 플래시 메모리 또는 다른 메모리 기술, CD-ROM, DVD 또는 다른 광학 디스크 스토리지, 자기 카세트, 자기 테이프, 자기 디스크 스토리지 또는 다른 자기 스토리지 디바이스, 또는 원하는 정보를 저장하도록 사용될 수 있고 컴퓨터(110)에 의해 액세스될 수 있는 임의의 다른 매체를 포함한다.
통신 매체는 전형적으로 컴퓨터 판독가능한 명령, 데이터 구조, 프로그램 모듈, 또는 반송파와 같은 변조된 데이터 신호 내의 다른 데이터 또는 다른 수송 메커니즘을 내장하며, 임의의 정보 전달 매체를 포함한다. "변조된 데이터 신호"는 신호 내의 정보의 인코딩과 관련된 방식으로 변경되거나 하나 이상의 자신의 특징 세트를 갖는 신호를 의미한다. 예시로서, 통신 매체는 유선 네트워크 또는 다이렉트 유선 접속과 같은 유선 매체 및 음향 RF, 적외선 및 다른 무선 매체와 같은 무선 매체를 포함하지만 이것으로 한정되는 것은 아니다. 전술된 것들의 조합 또한 컴퓨터 판독가능한 매체의 범주 내에 포함된다.
시스템 메모리(130)는 판독 전용 메모리(ROM)(131) 및 랜덤 액세스 메모리(RAM)(132)와 같은 휘발성 및/또는 비휘발성 메모리의 형태인 컴퓨터 저장 매체를 포함한다. 예로서 스타트-업 동안 컴퓨터(110) 내의 소자들 간의 정보 전송을 돕는 기본 루트를 포함하는 기본 입력/출력 시스템(BIOS)(133)은 전형적으로 ROM(131) 내에 저장된다. RAM(132)은 전형적으로 처리 장치(120)에 의해 즉시 액세스가능하고/하거나 현재 동작중인 데이터 및/또는 프로그램 모듈을 포함한다. 예시로서, 도 1은 운영 시스템(134), 애플리케이션 프로그램(135), 다른 프로그램 모듈(136) 및 프로그램 데이터(137)를 도시하지만, 이것으로 한정되는 것은 아니다.
컴퓨터(110)는 또한 다른 제거가능/제거 불가능, 휘발성/비휘발성 컴퓨터 저장 매체를 포함할 수 있다. 예시로서, 도 1은 제거 불가능한 비휘발성 자기 매체로부터 판독하거나 이에 기록하는 하드 디스크 드라이브(141), 제거가능한 비휘발성 자기 디스크(152)로부터 판독하거나 이에 기록하는 자기 디스크 드라이브(151) 및 CD-ROM 또는 다른 광학적 매체와 같은 제거가능한 비휘발성 광학 디스크(156)로부터 판독하는 광학적 디스크 드라이브(155)를 도시한다. 예시적인 운영 환경에서 사용될 수 있는 다른 제거가능/제거 불가능, 휘발성/비휘발성 컴퓨터 저장 매체는 자기 테이프 카세트, 플래시 메모리 카드, DVD, 다른 광학적 디스크, 디지털 비디오 테이프, 고체 상태 RAM, 고체 상태 ROM 등을 포함한다. 하드 디스크 드라이브(141)는 인터페이스(140)를 통해 시스템 버스(121)에 접속될 수 있으며, 자기 디스크 드라이브(151) 및 광학적 디스크 드라이브(155)는 인터페이스(150)와 같은 제거가능한 비휘발성 메모리에 대한 인터페이스에 의해 시스템 버스(121)에 접속될 수 있다.
도 1에 도시되고 위에서 기술된 바와 같은 드라이브 및 그와 연관된 컴퓨터 저장 매체는, 컴퓨터 판독가능한 명령, 데이터 구조, 프로그램 모듈 및 컴퓨터(110)에 대한 다른 데이터의 저장을 제공한다. 도 1에서, 예를 들어 하드 디스크 드라이브(141)는 운영 시스템(144), 애플리케이션 프로그램(145), 다른 프로그램 모듈(146) 및 프로그램 데이터(147)를 저장하는 것으로서 도시되었다. 이러한 구성요소들은 운영 시스템(134), 애플리케이션 프로그램(135), 다른 프로그램 모듈(136) 및 프로그램 데이터(137)와 동일하거나 상이할 수 있다. 운영 시스템(144), 애플리케이션 프로그램(145), 다른 프로그램 모듈(146) 및 프로그램 데이터(147)는 본 명세서에서 이들이 최소한 서로 다른 카피임을 설명하도록 서로 다른 수로 주어진다.
사용자는 흔히 마우스, 트랙볼, 또는 터치 패드를 지칭하는 포인팅 디바이스(161) 및 키보드(162)와 같은 입력 디바이스를 통해 컴퓨터(110)로 커맨드 및 정보를 입력할 수 있다. (도시되지 않은) 다른 입력 디바이스는 마이크로폰, 조이스틱, 게임 패드, 위성 접시, 스캐너, 터치 민감성 스크린, 기록 태블릿 등을 포함할 수 있다. 이러한 입력 디바이스와 다른 입력 디바이스가 종종 시스템 버스에 연결된 사용자 입력 인터페이스(160)를 통해 처리 장치(120)에 접속되지만, 병렬 포트, 게임 포트 또는 USB와 같은 버스 구조 및 다른 인터페이스에 의해 접속될 수 있다.
모니터(191) 또는 다른 유형의 디스플레이 디바이스 또한 비디오 인터페이스(190)와 같은 인터페이스를 통해 시스템 버스(121)에 접속된다. 모니터에 추가로, 컴퓨터는 또한 스피커(197) 및 프린터(196)와 같은 다른 주변 출력 디바이스를 포함할 수 있으며, 이는 출력 주변 인터페이스(195)를 통해 접속될 수 있다.
컴퓨터(110)는 원격 컴퓨터(180)와 같은 하나 이상의 원격 컴퓨터에 대한 논리적 접속을 이용하여 네트워킹된 환경에서 동작할 수 있다. 원격 컴퓨터(180)는 개인 컴퓨터, 서버, 라우터, 네트워크 PC, 피어 디바이스 또는 다른 공동 네트워크 노드일 수 있으며, 오직 메모리 저장 디바이스(181)만이 도 1에 도시되었지만 전형적으로 컴퓨터(110)와 관련하여 전술된 다수의 또는 모든 요소들을 포함한다. 도 1에 도시된 논리적 접속은 로컬 영역 네트워크(LAN)(171) 및 광역 네트워크(WAN)(173)를 포함하지만, 다른 네트워크도 포함할 수 있다. 이러한 네트워킹 환경은 사무실, 전사적 컴퓨터 네트워크, 인트라넷 등에서 일반적이다.
LAN 네트워킹 환경에서 사용되었을 때, 컴퓨터(110)는 네트워크 인터페이스 또는 어댑터(170)를 통해 LAN(171)에 접속된다. WAN 네트워킹 환경에서 사용되었을 때, 컴퓨터(110)는 모뎀(172) 또는 인터넷과 같은 WAN(173) 상에서의 통신을 확립하기 위한 다른 수단을 포함할 수 있다. 내부 또는 외부 모뎀일 수 있는 모뎀(172)이 사용자 입력 인터페이스(160) 또는 다른 적절한 메커니즘을 통해 시스템 버스(121)에 접속될 수 있다. 네트워킹된 환경에서, 컴퓨터(110)와 관련해 도시된 프로그램 모듈 또는 그 일부가 원격 메모리 저장 디바이스 내에 저장될 수 있다. 예시로서, 도 1은 원격 애플리케이션 프로그램(185)이 메모리 디바이스(181) 상에 존재하는 것으로 도시하지만, 이것으로 한정되는 것은 아니다. 도시된 네트워크 접속은 예시적인 것이며 컴퓨터들 간의 통신 링크를 확립하는 다른 수단이 사용될 수 있음이 이해될 것이다.
데이터 보강
전술된 바와 같이, 증강 데이터 소스를 발견하여 사용하는 것은 소프트웨어 개발자에게 있어서 어려운 일이다. 도 2는 본 명세서에 기술된 청구대상의 측면들이 구현될 수 있는 예시적인 환경을 나타낸 블록도이다. 도 2에 도시된 구성요소들은 예시적이며 필요하거나 포함될 수 있는 구성요소들이 모두 포함된 것을 의미하지는 않는다. 다른 실시예에서, 도 2와 관련하여 기술된 구성요소는 본 명세서에 기술된 청구대상의 측면들의 범주 또는 사상으로부터 벗어나지 않고 (도시되거나 도시되지 않은) 다른 구성요소에 포함될 수 있거나 하위구성요소 내에 배치될 수 있다.
본 명세서에서 사용되는 "구성요소"라는 표현은 디바이스의 일부 또는 전부와 같은 하드웨어, 하나 이상의 소프트웨어 모듈 또는 그 일부의 집합, 하나 이상의 소프트웨어 모듈 또는 그 일부의 일부 조합 및 하나 이상의 디바이스 또는 그 일부 등을 포함하는 것으로 해석된다.
도 2를 참조하면, 환경은 애플리케이션(205), 데이터베이스 관리 시스템(DBMS)(206), 보강 데이터 소스(들)(207), 제안 엔진(208), 데이터 스토어(210, 211) 및 다른 구성요소(도시되지 않음)를 포함할 수 있다.
다양한 구성요소들이 서로에 대해 비교적 근접하게 (동일한 장치상에 또는 동일한 네트워크 상의 장치상에) 위치될 수 있거나 또는 전세계에 걸쳐 분산될 수도 있다. 다양한 구성요소들은 사무실 내(intra) 및 사무실 간(inter) 네트워크를 포함하는 다양한 네트워크를 통해 서로 통신할 수 있다.
애플리케이션(205), DBMS(206), 보강 데이터 소스(들)(207) 및 제안 엔진(208)은 하나 이상의 컴퓨팅 디바이스를 포함하거나 또는 하나 이상의 컴퓨팅 디바이스 상에 존재할 수 있다. 이러한 디바이스는 예를 들어 개인 컴퓨터, 서버 컴퓨터, 휴대용 또는 랩탑 디바이스, 멀티프로세서 시스템, 마이크로컨트롤러 기반의 시스템, 셋톱박스, 프로그램가능한 소비자 전자기기, 네트워크 PC, 미니컴퓨터, 메인프레임 컴퓨터, 휴대폰, PDA, 게임 디바이스, 프린터, 셋톱을 포함하는 어플라이언스, 미디어 센터, 또는 다른 어플라이언스, 자동차에 내장되거나 부착된 컴퓨팅 디바이스, 다른 모바일 디바이스, 임의의 전술된 시스템 또는 디바이스를 포함하는 분산된 컴퓨팅 환경 등을 포함할 수 있다. 전술된 것 중 하나로서의 역할을 하도록 구성될 수 있는 예시적인 디바이스는 도 1의 컴퓨터(110)를 포함한다.
애플리케이션(205)은 도 2의 하나 이상의 다른 엔티티와 통신할 수 있는 프로세스를 포함할 수 있다. 본 명세서에서 사용된 "프로세스"라는 용어 및 그의 변형어는 하나 이상의 종래의 프로세스, 스레드, 구성요소, 라이브러리, 태스크를 수행하는 객체 등을 포함할 수 있다. 프로세스는 하드웨어, 소프트웨어, 또는 하드웨어와 소프트웨어의 조합으로 구현될 수 있다. 실시예에서, 프로세스는 동작을 수행할 수 있거나 수행하는데에 사용될 수 있는 임의의 메커니즘이다. 프로세스는 복수의 디바이스 또는 단일 디바이스 상에서 분산될 수 있다. 유사하게, 애플리케이션(205)은 하나 이상의 디바이스 상에서 분산된 구성요소들을 구비할 수 있다.
일 실시예에서, 애플리케이션(205)은 소프트웨어 개발 툴을 포함할 수 있다. 소프트웨어 개발 툴은 소프트웨어 개발자가 코드, 디버그 코드를 입력 및 업데이트하고 데이터베이스를 생성 및 업데이트하고, 코드를 하나 이상의 데이터베이스와 연관시키고, 코드를 컴파일하고, 패키지를 생성하며, 다른 동작들을 수행하게 하는 등을 할 수 있게 하는 통합 개발 환경(integrated development environment; IDE)을 구현할 수 있다.
데이터 스토어(210) 내의 데이터는 DBMS(206)를 통해 액세스될 수 있다. DBMS는 데이터베이스의 데이터의 조직화, 저장, 관리 및 검색을 제어하는 하나 이상의 프로그램을 포함할 수 있다. DBMS는 데이터베이스 내의 데이터에 액세스하라는 요청을 수신할 수 있고 이러한 액세스를 제공하기 위해 필요한 동작을 수행할 수 있다. 본 발명에서 사용되는 액세스는 데이터 판독, 데이터 기록, 데이터 삭제, 데이터 업데이트, 이들 중 둘 이상을 포함하는 조합 등을 포함할 수 있다.
데이터 스토어(210) 상에 저장된 데이터베이스는 관계형 데이터베이스, 객체 지향적 데이터베이스, 계층적 데이터베이스, 네트워크 데이터베이스, 다른 유형의 데이터베이스, 이들의 일부 조합 또는 확장 등을 포함할 수 있다. 데이터베이스에 저장된 데이터는 테이블, 기록, 객체, 다른 데이터 구조 등으로 구조화될 수 있다. 데이터베이스 내에 저장된 데이터는 전용 데이터베이스 파일, 전용 하드 드라이브 파티션, HTML 파일, XML 파일, 스프레드시트, 플랫 파일, 문서 파일, 구성 파일, 그외의 파일 등으로 저장될 수 있다. 데이터베이스는 데이터베이스에 대해 판독 전용인 데이터의 세트를 참조할 수 있거나 데이터의 세트를 판독 및 기록하는 능력을 가질 수 있다.
본 명세서에 기술된 청구대상의 측면들의 설명에서, 단순화를 위해, 관계형 데이터베이스와 연관된 전문용어가 때때로 본 명세서에서 사용되었다. 관계형 데이터베이스 전문용어가 본 명세서에서 때때로 사용되었지만, 본 명세서의 내용은 전술된 바를 포함하는 다른 유형의 데이터베이스에도 적용될 수 있다.
보강 데이터 소스(들)(207)는 데이터를 공급할 수 있는 임의의 엔티티를 포함할 수 있다. 예를 들어, 보강 데이터 소스(들)(207)는 데이터(예컨대, 집코드(zip code))를 수신하고 그에 응답하여 데이터(예컨대, 날씨 정보)를 제공하는 서비스를 포함할 수 있다. 다른 예시로서, 보강 데이터 소스(들)(207)는 실제 주가 또는 지연된 주가를 제공하는 서비스를 포함할 수 있다. 각 보강 데이터 소스는 하나 이상의 컴퓨터에 의해 실행되는 프로세스를 통해 구현될 수 있다.
데이터 스토어(210) 상에 저장되는 데이터베이스는 보강 데이터 소스(들)(207)에 의해 보강될 수 있다. DBMS(206)는 보강 데이터 소스(들)(207)로부터 데이터를 획득할 수 있고 (예로서, 애플리케이션(205)에게) 데이터가 DBMS(206)에 의해 관리되는 데이터베이스로부터 온 것으로 보이도록 만들 수 있다. 보강 데이터 소스(들)(207)로부터 획득가능한 데이터는 종종 본 명세서에서 데이터 보강으로 지칭된다. 예를 들어, DBMS(206)는 보강 데이터 소스로부터 날씨 정보를 획득하기 위해 데이터베이스 내에서 발견되는 집코드 정보를 이용할 수 있다. 날씨 정보는 DBMS(206)에 의해 노출되는 테이블의 하나 이상의 열(column)을 통해 액세스 가능할 수 있다.
DBMS(206)는 데이터 스토어(210)의 데이터베이스에 제공될 데이터 보강을 나타내는 정보를 저장할 수 있다. 데이터베이스로부터 데이터를 제공할 때, DBMS(206)는 데이터 보강을 이용가능하게 할 수도 있다.
일 실시예에서, 제안 엔진(208)은 데이터 보강 제안을 DBMS(206)에 제공할 수 있으며 이는 이러한 제안을 애플리케이션(205)으로 제공할 수 있다. 다른 실시예에서, 제안 엔진(208)은 데이터 보강 제안을 애플리케이션(205)에 직접 제공할 수 있다. 제안은 제안의 명칭 또는 다른 식별자, 제안과 연관된 데이터 보강에 의해 요구되는 입력 데이터 유형 및 데이터 보강에 의해 제공되는 출력 데이터 유형을 포함할 수 있다.
제안 엔진(208)은 다양한 방식으로 이러한 제안을 결정할 수 있다. 이러한 방식들 중 일부는, 예를 들어 다음을 포함한다:
1. 동적 분석. DBMS(206)는 DBMS(206)에 의해 실행되는 쿼리에 대한 통계적 정보를 수집할 수 있다. 이러한 정보는 새로운 보강 및 데이터 소스를 제안하기 위해 정보를 이용할 수 있는 제안 엔진(208)에 제공될 수 있다. 예를 들어, 만약 쿼리가 COMPANYFINANCIAL 보강을 이용한다면, 제안 엔진(208)은 COMPANYNEWS 보강도 제안할 수 있다. 이러한 제안은 두 보강이 모두 입력으로서 기업명을 이용하기 때문에 제공될 수 있다.
동적 분석을 이용하여 보강을 결정하기 위해서, 제안 엔진(208)은 보강 사이에서 맵핑하는 데이터 구조를 이용할 수 있다. 예를 들어, 제안 엔진(208)은 행(row)들을 포함하는 테이블로 제공될 수 있거나 유지할 수 있으며, 각 행은 제 1 보강과 제 2 보강의 필드를 포함한다. 제 2 보강은 제 1 보강에 기초하여 제안되는 데이터 보강이다. 0 이상의 행을 이용함으로써, 이러한 테이블은 제 1 보강에 기초하여 제안될 수 있는 0 이상의 다른 보강에 제 1 보강을 맵핑하도록 사용될 수 있다.
쿼리 시간과 같은 통계는 현재 사용중인 데이터 소스와는 다르게 인덱싱되는 데이터 소스를 제안하도록 사용될 수 있다. 예를 들어, 주식 시세표시 데이터 소스가 기업명 또는 주식 심볼(예로서, MSFT)을 이용하여 최근의 주가를 제공하는 것이 가능할 수 있다. 기업명이 제공되면, 주식 시세표시 데이터 소스는 기업이 주식 시장에 알려지는 주식 심볼을 검색해야 할 수 있다. 그 다음 데이터 소스는 주식시세 데이터를 획득하도록 이러한 주식 심볼을 이용할 수 있다.
주식시세 데이터를 획득하기 위해 전술된 방법을 이용하기보다는, 주식 심볼을 수신하는 데이터 소스는 단지 주식시세 데이터를 직접 획득할 수 있고 따라서 기업명으로부터 주식시세 명칭으로 번역해야 하는 데이터 소스보다 더 빠른 데이터를 획득할 수 있다. 만약 기업 테이블이 주식 심볼 필드를 갖지만 주식시세 데이터를 얻기 위해 기업명 데이터 보강을 이용한다면, 제안 엔진(208)은 주식 심볼 필드를 사용하는 데이터 보강이 대신 사용될 것을 제안할 수 있다. 이와 달리, 제안 엔진(208)은 기업 테이블의 각 기업에 대한 주식 심볼을 포함하는 주식 심볼 엔티티를 제안할 수 있고 주식 심볼 엔티티에 기초하여 보강을 제안할 수 있다.
2. 정적 분석. 데이터베이스 내에 저장된 데이터는 테이블, 열(column), 절차, 확장가능한 마크업 언어(XML) 등을 포함하는 데이터베이스 객체와 관련된 구조적 메타데이터를 갖는다. 이러한 구조적 메타데이터는 데이터베이스에 의해 저장되고 프로세싱되는 데이터의 종류를 결정하도록 검색될 수 있다. 구조적 메타데이터의 일부 예시는 테이블 명칭, 열 명칭, 저장된 절차 명칭, 열 데이터 유형, 다른 객체 명칭 등을 포함한다.
예를 들어, 테이블 지정된 기업은 해당 테이블이 기업 정보를 갖는다는 것을 나타낼 수 있다. 테이블 지정된 기업 내에서, 열 지정된 명칭이 기업명을 나타낼 수 있다. 이러한 메타데이터는 기업 테이블 내의 명칭 열이 기업명임을 결정하도록 사용될 수 있다. 이는 COMPANYFINANCIAL 보강, COMPANYNEWS 보강, COMPANYSOCIALNETWORKS 보강 및 다른 기업 보강과 같은 기업에 대한 보강 제안을 제공하도록 사용될 수 있다.
정적 분석에 대한 데이터 보강의 결정을 용이하게 하도록, 식별자(예로서, 명칭)로부터 명칭과 연관된 하나 이상의 보강으로 맵핑하는 데이터 구조가 사용될 수 있다. 예를 들어, 제안 엔진(208)은 행들을 포함하는 테이블이 제공되거나 유지할 수 있으며, 이때 각 행은 메타데이터 속성(들)에 기초하여 제안될 데이터 보강 및 하나 이상의 메타데이터 속성(들)의 필드(예로서, 테이블 이름, 열, 이름, 데이터 유형)을 포함한다. 0 이상의 행의 사용에 의해, 이러한 테이블은 메타데이터 속성에 기초하여 제안될 수 있는 0 이상의 다른 보강으로 메타데이터 속성(들)을 맵핑하도록 사용될 수 있다.
열 데이터 유형에 기초하여 제안될 수 있는 데이터 보강의 예시로서, 메타데이터는 열이 GEOMETRY 데이터 유형을 사용함을 나타낼 수 있다. 응답으로, 제안 엔진(208)은 LOCATION 엔티티 및 LOCATION 엔티티와 연관된 보강을 제안할 수 있다(예로서, 날씨, 범죄율, 인구밀도, 인구통계, 주택 통계 등).
열 데이터 유형은 또한 데이터베이스 자체 내의 데이터를 검사함으로써 결정될 수 있다. 예를 들어, 테이블 내의 열을 검사함으로써, 제안 엔진(208)은 열이 어드레스를 나타낸다고 결정하는 것이 가능할 수 있다. 이는 예를 들어 열 내의 데이터를 이용하여 어드레스를 검색하도록 시도함으로써 수행될 수 있다. 제안 엔진(208)이 열이 어드레스를 나타낸다고 결정하면, 제안 엔진(208)은 어드레스에 기초하여 데이터 보강(들)을 제안하기 위해 본 명세서에서 언급된 기술의 맵핑을 이용할 수 있다.
유사하게, 데이터베이스 내의 데이터의 정적 분석은 데이터베이스 내에 포함된 데이터와 관련된 추가적인 정보를 산출할 수 있다. 이러한 정보는 데이터 보강을 제안하도록 사용될 수도 있다.
3. 정책. 제안은 정책에 기초하여 이루어질 수 있다. 이러한 정책은 애플리케이션(205) 또는 그 외의 것에 의해 정의될 수 있다. 정책은 조건(들) 평가에 기초하여 제안을 제한하는 하나 이상의 조건을 갖는 규칙으로 생각될 수 있다. 예를 들어, 정책은 거래 비용, 데이터 소스 평가, 서비스 면허 합의(service license agreement; SLA), 데이터가 데이터베이스 내에서 유지되는 것이 허용되는지 여부, 또는 다른 조건에 기초할 수 있다. 예를 들어, 정책은 데이터 보강에 대한 가격이 소정 값보다 낮은 한, 데이터 보강에 대한 제안이 허용됨을 나타낼 수 있다.
4. 디렉토리. 이용가능한 데이터 보강이 검색가능할 수 있다. 예를 들어, 제안 엔진(208)은 소프트웨어 개발자 등이 쿼리할 수 있는 테이블 내의 상응하는 데이터 소스 및 데이터 보강의 리스트를 제공할 수 있다. 테이블은 입력으로서 수용되고 출력으로서 생성되는 데이터의 유형을 나타낼 수 있다. 또한 테이블은 면허 제한, (만약 존재한다면) 비용, 데이터 보강에 대한 다른 데이터 등을 포함할 수도 있다.
데이터 스토어(211)는 제안에 사용되는 데이터를 저장하는 스토어이다. 데이터는 예를 들어 맵핑 데이터, 이용가능한 데이터 보강의 디렉토리, 가격 책정, 성능 및 신뢰가능성 데이터, 데이터 소스와 관련된 면허 합의 등을 포함할 수 있다.
데이터 스토어(210, 211)는 데이터를 저장할 수 있는 임의의 저장 매체를 이용하여 구현될 수 있다. 스토어는 휘발성 메모리(예로서, 캐시) 및 비휘발성 메모리(예로서, 지속적인 스토리지)를 포함할 수 있다. 스토어는 파일 시스템, 데이터베이스, RAM과 같은 휘발성 메모리, 다른 스토리지, 이들의 일부 조합 등을 이용하여 구현될 수 있으며 복수의 디바이스에 걸쳐 분산될 수 있다.
데이터라는 용어는 하나 이상의 컴퓨터 저장 요소에 의해 나타내어질 수 있는 것을 포함하도록 넓게 해석된다. 논리적으로, 데이터는 휘발성 또는 비휘발성 메모리 내에서 일련의 1과 0으로 표현될 수 있다. 이진식이 아닌 저장 매체를 구비하는 컴퓨터에서, 데이터는 저장 매체의 용량에 따라 나타내어질 수 있다. 데이터는 숫자, 문자 등과 같은 간단한 데이터 유형, 계층적 데이터 유형, 링크된 데이터 유형 또는 다른 관련 데이터 유형, 복수의 다른 데이터 구조 또는 단일 데이터 유형을 포함하는 데이터 구조 등을 포함하는 데이터 구조의 서로 다른 유형으로 구조화될 수 있다.
도 3 내지 4는 본 명세서에 기술된 청구대상의 측면들에 따라 발생할 수 있는 예시적인 동작들을 일반적으로 나타낸 순서도이다. 설명의 단순화를 위해서, 도 3 및 4와 관련하여 설명되는 방법은 일련의 동작들로 도시 및 기술된다. 본 명세서에 기술된 청구대상의 측면들이 도시된 동작들 및/또는 동작들의 순서에 의해 제한되지 않는다는 것을 이해해야 한다. 일 실시예에서, 동작은 아래에서 설명되는 것과 같은 순서로 일어난다. 그러나 다른 실시예에서, 동작들은 동시에 일어나거나, 다른 순서로 일어나고/나거나 본 명세서에 설명되거나 언급되지 않은 다른 동작들과 함께 일어날 수 있다. 또한, 도시된 동작들이 본 명세서에 기술된 청구대상의 측면들에 따른 방법을 구현하기 위해 반드시 요구되는 것은 아닐 수 있다. 또한, 당업자는 방법이 이와 달리 상태 다이어그램을 통한 일련의 상호관련된 상태들로서 또는 이벤트로서 표현될 수 있음을 이해할 것이다.
도 3을 참조하면, 블록(305)에서 동작이 시작된다. 블록(310)에서, 데이터베이스에 대한 데이터 보강 제안을 제공하라는 요청이 수신된다. 예를 들어 도 2를 참조하면, 애플리케이션(205), DBMS(206), 또는 일부 다른 구성요소가 제안 엔진(208)이 DBMS에 의해 관리되는 데이터베이스에 대한 데이터 보강 제안을 제공할 것을 요청할 수 있다.
블록(315)에서, 메타데이터의 분석이 수행될 수 있다. 예를 들어, 도 2를 참조하면, 제안 엔진(208)은 제공하기 위한 하나 이상의 제안을 결정하도록 데이터 스토어(211) 상의 맵핑 정보와 함께 DBMS(206)에 의해 공급되는 데이터베이스에 대한 메타데이터를 이용할 수 있다. 또한, 제안 엔진(208)은 정책을 위반하지 않는 것으로 제안을 제한하기 위해서 정책의 조건을 평가할 수 있다.
일 실시예에서, 메타데이터의 분석이 제안을 제공하라는 요청을 수신한 후에 수행될 수 있지만, 다른 실시예에서 분석은 요청을 수신하기 이전에 수행될 수도 있다. 일 실시예에서, 분석은 제안을 데이터베이스 변경과 관련한 메타데이터로서 계속 업데이트하는 진행중인 프로세스이다.
일 구현에서, 메타데이터의 분석은 아래의 예시적인 동작들을 포함할 수 있다:
1. 데이터베이스와 연관된 메타데이터 획득. 이것은 DBMS로부터 데이터 요청, (요청 없이) DBMS로부터 데이터 수신, 또는 일부 다른 메커니즘을 포함할 수 있다.
2. 메타데이터 내의 식별자 검색. 이는 한 이상의 테이블, 열, 저장된 절차, 또는 다른 데이터베이스 객체의 이름(들)을 검색하는 것을 포함할 수 있다.
3. 식별자를 데이터 보강과 연관시키는 데이터 구조를 이용하여 데이터 보강에 식별자를 맵핑. 이것은 하나 이상의 다른 식별자를 식별하기 위한 열쇠로서 하나 이상의 식별자를 포함하는 다른 데이터 구조 또는 테이블을 이용하는 것을 포함할 수 있다. 예를 들어, 테이블 또는 열의 이름 "company"이 데이터 구조 내의 연관된 보강을 검색하는데에 사용될 수 있다. 다른 예시로서, 테이블의 열의 이름 "stock symbol"과 함께 테이블의 이름 "company"가 연관된 주식 시세표시 보강을 검색하도록 함께 사용될 수 있다.
블록(320)에서, 동적 분석이 수행될 수 있다. 예를 들어, 도 2를 참조하면, 제안 엔진(208)이 데이터 보강에 대한 제안을 결정하도록 데이터베이스에 발행된 하나 이상의 쿼리를 분석할 수 있다. 예를 들어, 만약 쿼리가 하나의 데이터 보강을 나타내면, 이러한 데이터 보강은 유사물의 맵핑 데이터 구조를 이용하여 다른 데이터 보강을 식별하도록 사용될 수 있다. 또한, 제안 엔진(208)은 정책을 위반하지 않는 것으로 제안을 한정하게 위해 정책의 조건을 평가할 수 있다.
일 구현에서, 동적 분석은 데이터베이스로 발행된 쿼리를 분석하는 것을 포함할 수 있다. 이러한 구현에서, 제안을 결정하는 것은 아래의 예시적인 동작들에 의해 수행될 수 있다:
1. 적어도 하나의 쿼리에 의해 참조되는 제 1 데이터 보강의 제 1 식별자를 획득. 예를 들어, 만약 쿼리가 데이터 보강("COMPANYFINANCIAL")의 식별자(예로서, 이름)를 포함한다면, 식별자가 획득될 수 있다.
2. 데이터 보강의 식별자를 연관시키는 데이터 구조를 이용하여 제 2 데이터 보강의 제 2 식별자에 제 1 식별자를 맵핑.
다른 예시적인 동적 분석이 아래의 예시적인 동작들을 포함할 수 있다:
1. 두 개의 서로 다른 데이터 소스로부터의 보강 데이터의 동일한 유형(예로서, 주가)을 획득하는 제 1 쿼리 및 제 2 쿼리의 쿼리 시간을 비교;
2. 제 1 쿼리 및 제 2 쿼리 중 어느 것이 출력 데이터 획득시에 가장 작은 대기시간을 갖는지에 따라서 제 1 쿼리와 제 2 쿼리 중 가장 빠른 쿼리를 선택;
3. 가장 빠른 쿼리와 연관된 데이터 보강의 식별자를 결정.
데이터 보강은 예를 들어 성능을 향상시키도록 제안될 수 있다.
일 실시예에서 쿼리의 분석이 제안을 제공하라는 요청을 수신한 후에 수행될 수 있지만, 다른 실시예에서 분석은 요청을 수신하기에 앞서 수행될 수도 있다. 일 실시예에서, 분석은 데이터베이스에 대한 쿼리가 수신될 때 계속해서 제안을 업데이트하는 진행중인 프로세스이다.
블록(325)에서, 메타데이터의 분석에 기초한 제안이 제공된다. 예를 들어, 도 2를 참조하면, 제안 엔진(208)이 DBMS(206), 애플리케이션(205), 또는 일부 다른 구성요소로 데이터 보강 제안을 제공할 수 있다.
블록(330)에서 동적 분석에 기초한 제안이 제공된다. 예를 들어, 도 2를 참조하면, 제안 엔진(208)이 DBMS(206), 애플리케이션(205), 또는 일부 다른 구성요소로 데이터 보강 제안을 제공할 수 있다.
메타데이터에 기초한 제안 및 동적 분석에 기초한 제안은 본 명세서에 기술된 청구대상의 측면들의 사상 또는 범주로부터 벗어나지 않고 함께 또는 개별적으로 제공될 수 있다. 일부 경우에, 동적 분석에 기초한 제안만이 존재할 수도 있다. 다른 경우에는, 정적 분석에 기초한 제안만이 존재할 수도 있다.
블록(335)에서, 만약 존재한다면 다른 동작들이 수행될 수 있다. 다른 동작들은 예를 들어 데이터 소스에 상응하는 데이터 보강 및 데이터 보강을 식별하는 검색가능한 디렉토리를 제공하는 것을 포함할 수 있다.
도 4를 참조하면, 블록(405)에서 동작들이 시작된다. 블록(410)에서, 데이터 보강 제안이 수신된다. 제안은 데이터베이스에 대한 액세스를 제공하는 DBMS로 발행된 쿼리에 대한 분석 및 데이터베이스의 메타데이터에 대한 하나 이상의 분석에 기초한다. 예를 들어, 도 2를 참조하면, DBMS(206)는 제안 엔진(208)으로부터의 COMPANYNEWS 보강 제안을 수신할 수 있다. 후속하여, DBMS(206)는 애플리케이션(205)에 제안을 제공할 수 있다. 다른 실시예에서, 애플리케이션(205)은 제안 엔진(208)으로부터 제안을 직접 수신할 수 있다.
블록(415)에서, 제안의 표시가 그래픽 인터페이스를 통해 제공될 수 있다. 예를 들어, 도 2를 참조하면, 애플리케이션(205)이 소프트웨어 개발자가 데이터 보강을 이용하길 원하는지 여부를 나타낼 수 있게 하는 사용자 인터페이스 요소와 함께 컴퓨터 디스플레이 상에 제안을 디스플레이함으로써 소프트웨어 개발자, 사용자 등에게 제안의 표시를 제공할 수 있다.
블록(420)에서, 소프트웨어 개발자는 소프트웨어 개발자가 데이터 보강을 이용하길 원하는지 여부를 나타내는 것이 허용된다. 예를 들어, 도 2를 참조하면, 소프트웨어 개발자는 디스플레이된 인터페이스 요소를 통해 제안된 데이터 보강이 사용될 것인지 여부를 애플리케이션(205)에 나타낼 수 있다. 응답시에, 애플리케이션(205)은 DBMS(206)에게 제안된 데이터 보강이 사용될지 여부를 알릴 수 있다.
블록(425)에서, 만약 존재한다면 다른 동작들이 수행될 수 있다. 예를 들어, 제안들의 세트를 수신하는 대신, 데이터 보강의 디렉토리, 그와 연관된 데이터 소스 및 다른 정보(예로서, 비용, 속도, 신뢰가능성 등)가 수신될 수 있다. 이러한 디렉토리 또는 적어도 그 일부가 그래픽 인터페이스를 통해 디스플레이될 수 있다. 소프트웨어 개발자는 또한 개발자가 사용에 관심을 갖는 보강을 찾기 위해 이러한 디렉토리에 대한 쿼리를 발행할 수도 있다.
다른 예시로서, 소프트웨어 개발자는 제안의 제공과 관련하여 만족되는 하나 이상의 정책을 (예로서 그래픽 인터페이스를 통해서) 정의할 수 있다. 이러한 정책들은 정책을 위반하지 않는 데이터 보강을 제안하는데에 사용하기 위해 제안 엔진에 제공될 수 있다.
전술된 상세한 설명으로부터 알 수 있는 바와 같이, 데이터 보강 제안과 관련된 측면들이 기술되었다. 본 명세서에 기술된 측면들이 다양한 수정 및 대안적인 구성에 대해 민감하지만, 소정의 실시예들이 도면에 도시되었고 위에서 상세하게 기술되었다. 그러나, 청구된 청구대상의 측면들을 개시된 특정 형식으로 한정하려는 의도가 없으며, 반대로 본 명세서에 기술된 청구대상의 다양한 측면들의 사상 및 범주 내에 있는 모든 수정, 대안적인 구조 및 동등물을 포함한다는 것을 이해해야 한다.

Claims (20)

  1. 컴퓨터 시스템으로서,
    하나 이상의 프로세서와,
    시스템 메모리와,
    상기 하나 이상의 프로세서를 사용하여 데이터 소스를 보충하기 위한 데이터 보강을 추천하도록 구성되는 추천 엔진을 포함하되,
    상기 데이터 보강을 추천하는 것은,
    상기 데이터 보강과 다른 데이터 보강 사이의 유사도에 기초하여 상기 데이터 소스에 대한 데이터 보강을 제안하는 것과,
    상기 제안된 데이터 보강을 제공할 수 있는 추가 데이터 소스를 식별하는 것을 포함하고,
    상기 식별하는 것은,
    상이한 데이터 소스로부터 상기 데이터 보강을 위한 보강 데이터를 획득하도록 제 1 쿼리 및 제 2 쿼리의 특성을 비교하는 것과,
    상기 제 1 쿼리 및 상기 제2 쿼리의 특성의 비교에 기초하여 적합한 쿼리를 선택하는 것과,
    상기 적합한 쿼리와 연관된 상기 추가 데이터 소스에 대한 식별자를 결정하는 것을 포함하는
    컴퓨터 시스템.
  2. 제 1 항에 있어서,
    상기 추천 엔진은 상기 하나 이상의 프로세서를 사용하여, 상기 추가 데이터 소스로부터 상기 데이터 소스로 보강 데이터를 추가(appending)함으로써 상기 데이터 소스를 보강하도록 더 구성되는
    컴퓨터 시스템.
  3. 제 1 항에 있어서,
    상기 추천 엔진은 상기 하나 이상의 프로세서를 사용하여, 상기 식별자를 상기 데이터 보강과 연관시키는 데이터 구조를 이용하여 상기 식별자를 상기 데이터 보강에 맵핑하도록 더 구성되는
    컴퓨터 시스템.
  4. 제 1 항에 있어서,
    상기 추천 엔진은 상기 하나 이상의 프로세서를 사용하여 상기 추가 데이터 소스에 대한 메타데이터를 획득하도록 더 구성되고,
    상기 추천 엔진이 상기 하나 이상의 프로세서를 사용하여 상기 추가 데이터 소스에 대한 식별자를 결정하도록 구성되는 것은, 상기 추천 엔진이 상기 하나 이상의 프로세서를 사용하여 상기 메타데이터 내에서 상기 식별자를 찾도록 구성되는 것을 포함하는
    컴퓨터 시스템.
  5. 제 4 항에 있어서,
    상기 추천 엔진이 상기 하나 이상의 프로세서를 사용하여 상기 메타데이터 내에서 상기 식별자를 찾도록 구성되는 것은, 상기 추천 엔진이 상기 하나 이상의 프로세서를 사용하여 열 명칭, 테이블 명칭 또는 저장된 절차 명칭 중 하나를 상기 메타데이터 내에서 찾도록 구성되는 것을 포함하는
    컴퓨터 시스템.
  6. 제 1 항에 있어서,
    상기 추천 엔진은 상기 하나 이상의 프로세서를 사용하여, 식별자를 데이터 보강과 연관시키는 테이블을 이용하여 상기 식별자를 데이터 보강에 매핑하도록 더 구성되는
    컴퓨터 시스템.
  7. 컴퓨터 시스템에서 사용하는 방법으로서,
    상기 컴퓨터 시스템은 프로세서를 포함하고,
    상기 방법은 데이터 소스를 보충하기 위한 데이터 보강을 추천하기 위한 것이며,
    상기 방법은 상기 프로세서가,
    상기 데이터 보강과 다른 데이터 보강 사이의 유사도에 기초하여 상기 데이터 소스에 대한 데이터 보강을 제안하는 단계와,
    상기 제안된 데이터 보강을 제공할 수 있는 추가 데이터 소스를 식별하는 단계를 포함하고,
    상기 식별하는 단계는,
    상이한 데이터 소스로부터 상기 데이터 보강을 위한 보강 데이터를 획득하도록 제 1 쿼리 및 제 2 쿼리의 특성을 비교하는 단계와,
    상기 제 1 쿼리 및 상기 제2 쿼리의 특성의 비교에 기초하여 적합한 쿼리를 선택하는 단계와,
    상기 적합한 쿼리와 연관된 상기 추가 데이터 소스에 대한 식별자를 결정하는 단계를 포함하는
    방법.
  8. 제 7 항에 있어서,
    상기 추가 데이터 소스로부터 상기 데이터 소스로 보강 데이터를 추가(appending)함으로써 상기 데이터 소스를 보강하는 단계를 더 포함하는
    방법.
  9. 제 7 항에 있어서,
    상기 식별자를 상기 데이터 보강과 연관시키는 데이터 구조를 이용하여 상기 식별자를 상기 데이터 보강에 맵핑하는 단계를 더 포함하는
    방법.
  10. 제 7 항에 있어서,
    상기 추가 데이터 소스에 대한 메타데이터를 획득하는 단계를 더 포함하고,
    상기 추가 데이터 소스에 대한 식별자를 결정하는 단계는 상기 메타데이터 내에서 상기 식별자를 찾는 단계를 포함하는
    방법.
  11. 제 10 항에 있어서,
    상기 메타데이터 내에서 상기 식별자를 찾는 단계는, 상기 메타데이터 내에서 열 명칭을 찾는 단계를 포함하고,
    식별자를 데이터 보강과 연관시키는 테이블을 이용하여 상기 식별자를 데이터 보강에 매핑하는 단계를 더 포함하는
    방법.
  12. 제 10 항에 있어서,
    상기 메타데이터 내에서 상기 식별자를 찾는 단계는, 상기 메타데이터 내에서 테이블 명칭을 찾는 단계를 포함하는
    방법.
  13. 제 10 항에 있어서,
    상기 메타데이터 내에서 상기 식별자를 찾는 단계는, 상기 메타데이터 내에서 저장된 절차 명칭을 찾는 단계를 포함하는
    방법.
  14. 제 10 항에 있어서,
    상기 메타데이터 내에서 상기 식별자를 찾는 단계는, 상기 데이터 소스의 행의 데이터 유형을 찾는 단계를 포함하는
    방법.
  15. 제 7 항에 있어서,
    규칙을 정의하는 정책과 연관된 하나 이상의 조건을 평가함으로써 상기 데이터 보강이 상기 정책을 위반하는지를 판정하는 단계를 더 포함하는
    방법.
  16. 제 7 항에 있어서,
    데이터 소스에 대응하는 데이터 보강을 식별하는 검색가능한 디렉토리를 제공하는 단계를 더 포함하는
    방법.
  17. 컴퓨터 시스템에서 사용하기 위한 컴퓨터 프로그램이 저장된 컴퓨터 판독가능 저장 매체로서,
    상기 컴퓨터 프로그램은 데이터 소스를 보충하기 위한 데이터 보강을 제안하는 방법을 구현하고,
    상기 컴퓨터 프로그램이 저장된 컴퓨터 판독가능 저장 매체는 컴퓨터 실행가능 명령어가 저장된 하나 이상의 컴퓨터 저장 장치를 포함하고, 상기 컴퓨터 실행가능 명령어는 프로세서에서 실행되는 경우 상기 컴퓨터 시스템으로 하여금 상기 방법을 수행하게 하고,
    상기 방법은
    상기 데이터 보강과 다른 데이터 보강 사이의 유사도에 기초하여 상기 데이터 소스에 대한 데이터 보강을 제안하는 단계와,
    상기 제안된 데이터 보강을 제공할 수 있는 추가 데이터 소스를 식별하는 단계를 포함하고,
    상기 식별하는 단계는,
    상이한 데이터 소스로부터 상기 데이터 보강을 위한 보강 데이터를 획득하도록 제 1 쿼리 및 제 2 쿼리의 특성을 비교하는 단계와,
    상기 제 1 쿼리 및 상기 제2 쿼리의 특성의 비교에 기초하여 적합한 쿼리를 선택하는 단계와,
    상기 적합한 쿼리와 연관된 상기 추가 데이터 소스에 대한 식별자를 결정하는 단계를 포함하는
    컴퓨터 판독가능 저장 매체.
  18. 제 17 항에 있어서,
    실행되는 경우에 상기 컴퓨터 시스템으로 하여금, 상기 추가 데이터 소스로부터 상기 데이터 소스로 보강 데이터를 추가함으로써 상기 데이터 소스를 보강하는 단계를 수행하게 하는 컴퓨터 실행가능 명령어를 더 포함하는
    컴퓨터 판독가능 저장 매체.
  19. 제 17 항에 있어서,
    실행되는 경우에 상기 컴퓨터 시스템으로 하여금, 상기 식별자를 상기 데이터 보강과 연관시키는 데이터 구조를 이용하여 상기 식별자를 상기 데이터 보강에 맵핑하는 단계를 수행하게 하는 컴퓨터 실행가능 명령어를 더 포함하는
    컴퓨터 판독가능 저장 매체.
  20. 제 17 항에 있어서,
    실행되는 경우에 상기 컴퓨터 시스템으로 하여금, 상기 추가 데이터 소스에 대한 메타데이터를 획득하는 단계를 수행하게 하는 컴퓨터 실행가능 명령어를 더 포함하고,
    실행되는 경우에 상기 컴퓨터 시스템으로 하여금, 상기 추가 데이터 소스에 대한 식별자를 결정하는 단계를 수행하게 하는 컴퓨터 실행가능 명령어는, 실행되는 경우에 상기 컴퓨터 시스템으로 하여금, 상기 메타데이터 내에서 상기 식별자를 찾는 단계를 수행하게 하는 컴퓨터 실행가능 명령어를 포함하는
    컴퓨터 판독가능 저장 매체.
KR1020197012452A 2011-06-14 2012-06-05 데이터 보강 제안 기법 KR102035984B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/159,654 2011-06-14
US13/159,654 US9244956B2 (en) 2011-06-14 2011-06-14 Recommending data enrichments
PCT/US2012/040950 WO2012173825A2 (en) 2011-06-14 2012-06-05 Recommending data enrichments

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020137033103A Division KR101976220B1 (ko) 2011-06-14 2012-06-05 데이터 보강 제안 기법

Publications (2)

Publication Number Publication Date
KR20190049924A KR20190049924A (ko) 2019-05-09
KR102035984B1 true KR102035984B1 (ko) 2019-10-23

Family

ID=47354526

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020137033103A KR101976220B1 (ko) 2011-06-14 2012-06-05 데이터 보강 제안 기법
KR1020197012452A KR102035984B1 (ko) 2011-06-14 2012-06-05 데이터 보강 제안 기법

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020137033103A KR101976220B1 (ko) 2011-06-14 2012-06-05 데이터 보강 제안 기법

Country Status (11)

Country Link
US (3) US9244956B2 (ko)
EP (1) EP2721531A4 (ko)
JP (1) JP5986195B2 (ko)
KR (2) KR101976220B1 (ko)
CN (1) CN103608809B (ko)
AU (1) AU2012271085B2 (ko)
BR (1) BR112013032101B1 (ko)
CA (1) CA2838502A1 (ko)
MX (1) MX2013014800A (ko)
RU (1) RU2611966C2 (ko)
WO (1) WO2012173825A2 (ko)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9147195B2 (en) 2011-06-14 2015-09-29 Microsoft Technology Licensing, Llc Data custodian and curation system
US10073858B2 (en) 2013-05-16 2018-09-11 Oracle International Corporation Systems and methods for tuning a storage system
US10629086B2 (en) 2015-06-09 2020-04-21 International Business Machines Corporation Providing targeted, evidence-based recommendations to improve content by combining static analysis and usage analysis
US11456885B1 (en) 2015-12-17 2022-09-27 EMC IP Holding Company LLC Data set valuation for service providers
US10528522B1 (en) 2016-03-17 2020-01-07 EMC IP Holding Company LLC Metadata-based data valuation
US10838946B1 (en) 2016-03-18 2020-11-17 EMC IP Holding Company LLC Data quality computation for use in data set valuation
US10789224B1 (en) * 2016-04-22 2020-09-29 EMC IP Holding Company LLC Data value structures
US10838965B1 (en) 2016-04-22 2020-11-17 EMC IP Holding Company LLC Data valuation at content ingest
US10671483B1 (en) 2016-04-22 2020-06-02 EMC IP Holding Company LLC Calculating data value via data protection analytics
US10210551B1 (en) 2016-08-15 2019-02-19 EMC IP Holding Company LLC Calculating data relevance for valuation
CN106372133A (zh) * 2016-08-19 2017-02-01 苏州七彩部落网络科技有限公司 一种基于大数据的用户行为分析处理方法及系统
US11157498B1 (en) 2016-09-26 2021-10-26 Splunk Inc. Query generation using a dataset association record of a metadata catalog
US11093564B1 (en) 2016-09-26 2021-08-17 Splunk Inc. Identifying configuration parameters for a query using a metadata catalog
KR102432104B1 (ko) * 2016-11-09 2022-08-11 아브 이니티오 테크놀로지 엘엘시 데이터 요소 간의 관계를 결정하기 위한 시스템 및 방법
US10719480B1 (en) 2016-11-17 2020-07-21 EMC IP Holding Company LLC Embedded data valuation and metadata binding
US10936599B2 (en) 2017-09-29 2021-03-02 Oracle International Corporation Adaptive recommendations
US11392578B1 (en) 2018-04-30 2022-07-19 Splunk Inc. Automatically generating metadata for a metadata catalog based on detected changes to the metadata catalog
US11573955B1 (en) 2018-04-30 2023-02-07 Splunk Inc. Data-determinant query terms
US11238049B1 (en) 2018-04-30 2022-02-01 Splunk Inc. Revising catalog metadata based on parsing queries
US11715051B1 (en) 2019-04-30 2023-08-01 Splunk Inc. Service provider instance recommendations using machine-learned classifications and reconciliation

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002024262A (ja) 2000-07-07 2002-01-25 Nippon Telegr & Teleph Corp <Ntt> 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体
JP2002149459A (ja) 2000-11-10 2002-05-24 Mitsubishi Electric Corp 冗長化データベース管理・検索システム
US20080059454A1 (en) 2006-08-29 2008-03-06 Switchbook, Inc. Search document generation and use to provide recommendations

Family Cites Families (91)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5649181A (en) * 1993-04-16 1997-07-15 Sybase, Inc. Method and apparatus for indexing database columns with bit vectors
US5623652A (en) 1994-07-25 1997-04-22 Apple Computer, Inc. Method and apparatus for searching for information in a network and for controlling the display of searchable information on display devices in the network
US5608904A (en) 1995-02-13 1997-03-04 Hewlett-Packard Company Method and apparatus for processing and optimizing queries having joins between structured data and text data
US5615264A (en) 1995-06-08 1997-03-25 Wave Systems Corp. Encrypted data package record for use in remote transaction metered data system
US5960194A (en) * 1995-09-11 1999-09-28 International Business Machines Corporation Method for generating a multi-tiered index for partitioned data
CA2254944A1 (en) * 1996-05-23 1997-11-27 Citibank, N.A. Global financial services integration system and process
US5913214A (en) 1996-05-30 1999-06-15 Massachusetts Inst Technology Data extraction from world wide web pages
US6016348A (en) 1996-11-27 2000-01-18 Thomson Consumer Electronics, Inc. Decoding system and data format for processing and storing encrypted broadcast, cable or satellite video data
JP3836928B2 (ja) * 1997-02-26 2006-10-25 株式会社日立製作所 データベース処理方法
US7092914B1 (en) 1997-11-06 2006-08-15 Intertrust Technologies Corporation Methods for matching, selecting, narrowcasting, and/or classifying based on rights management and/or other information
JP3648051B2 (ja) * 1998-02-02 2005-05-18 富士通株式会社 関連情報検索装置及びプログラム記録媒体
US6763496B1 (en) 1999-03-31 2004-07-13 Microsoft Corporation Method for promoting contextual information to display pages containing hyperlinks
JP2000293590A (ja) 1999-04-12 2000-10-20 Sony Corp 情報処理装置および方法、並びに提供媒体
US6343287B1 (en) 1999-05-19 2002-01-29 Sun Microsystems, Inc. External data store link for a profile service
US7472349B1 (en) 1999-06-01 2008-12-30 Oracle International Corporation Dynamic services infrastructure for allowing programmatic access to internet and other resources
US7007275B1 (en) 1999-10-21 2006-02-28 Unisys Corporation Method and apparatus for automatic execution of concatenated methods across multiple heterogeneous data sources
US7124101B1 (en) 1999-11-22 2006-10-17 Accenture Llp Asset tracking in a network-based supply chain environment
US7213005B2 (en) 1999-12-09 2007-05-01 International Business Machines Corporation Digital content distribution using web broadcasting services
US6618822B1 (en) 2000-01-03 2003-09-09 Oracle International Corporation Method and mechanism for relational access of recovery logs in a database system
US6957214B2 (en) 2000-06-23 2005-10-18 The Johns Hopkins University Architecture for distributed database information access
JP4543563B2 (ja) 2001-02-28 2010-09-15 株式会社日立製作所 統合データベースシステムにおける問合せ最適化方法
US20030009424A1 (en) 2001-05-31 2003-01-09 Contentguard Holdings, Inc. Method for managing access and use of resources by verifying conditions and conditions for use therewith
US7546602B2 (en) 2001-07-10 2009-06-09 Microsoft Corporation Application program interface for network software platform
US7133862B2 (en) 2001-08-13 2006-11-07 Xerox Corporation System with user directed enrichment and import/export control
US6928425B2 (en) 2001-08-13 2005-08-09 Xerox Corporation System for propagating enrichment between documents
AU2002360793A1 (en) 2001-12-28 2003-07-24 Chijoke Mgbokwee Method and system for adaptive software system interface and external database synchronization
US20040139089A1 (en) 2002-03-29 2004-07-15 Wells Ronald B. Method and system for managing information on a network
US7233939B1 (en) * 2002-04-30 2007-06-19 Oracle International Corporation Systems and methods of optimizing database queries for efficient delivery of query data subsets
US6993534B2 (en) 2002-05-08 2006-01-31 International Business Machines Corporation Data store for knowledge-based data mining system
WO2003107223A1 (en) 2002-06-17 2003-12-24 Beingmeta, Inc. Systems and methods for processing queries
US7493311B1 (en) * 2002-08-01 2009-02-17 Microsoft Corporation Information server and pluggable data sources
EP1403764A1 (en) 2002-09-26 2004-03-31 Sap Ag Method and computer system for dynamic data type enrichment
ZA200302281B (en) * 2002-09-30 2003-09-29 Microsoft Corp Accessibility system events mechanism and method.
US7849016B2 (en) 2002-12-18 2010-12-07 Vincent So Internet-based data content rental system and method
US7177874B2 (en) 2003-01-16 2007-02-13 Jardin Cary A System and method for generating and processing results data in a distributed system
US20040148278A1 (en) 2003-01-22 2004-07-29 Amir Milo System and method for providing content warehouse
US7146356B2 (en) 2003-03-21 2006-12-05 International Business Machines Corporation Real-time aggregation of unstructured data into structured data for SQL processing by a relational database engine
JP2004304304A (ja) 2003-03-28 2004-10-28 Fujitsu Ltd 電子署名生成方法,電子署名検証方法,電子署名生成依頼プログラム,及び電子署名検証依頼プログラム
JP2004326250A (ja) 2003-04-22 2004-11-18 Nec Corp 代金情報管理サーバ、代金情報管理方法、及び代金情報管理プログラム
US20040215656A1 (en) 2003-04-25 2004-10-28 Marcus Dill Automated data mining runs
EP1482418A1 (en) 2003-05-28 2004-12-01 Sap Ag A data processing method and system
US7739223B2 (en) 2003-08-29 2010-06-15 Microsoft Corporation Mapping architecture for arbitrary data models
US7594109B2 (en) 2003-12-23 2009-09-22 Hewlett-Packard Development Company, L.P. Digital content distribution system
CN100418074C (zh) 2004-03-05 2008-09-10 菲尼萨公司 光学收发机中的分级和字节可配置存储器
US8521687B2 (en) * 2004-08-03 2013-08-27 International Business Machines Corporation Apparatus, system, and method for selecting optimal replica sources in a grid computing environment
US7451357B2 (en) 2004-11-18 2008-11-11 International Business Machines Corporation Apparatus and system for adjusting trace data granularity
US7427349B2 (en) 2004-12-16 2008-09-23 Chevron U.S.A. Inc. Fuels hydrocracking and distillate feed hydrofining in a single process
US20130104251A1 (en) 2005-02-01 2013-04-25 Newsilike Media Group, Inc. Security systems and methods for use with structured and unstructured data
US7882122B2 (en) 2005-03-18 2011-02-01 Capital Source Far East Limited Remote access of heterogeneous data
US7716377B2 (en) 2005-05-25 2010-05-11 Harris Steven T Clustering server providing virtual machine data sharing
JP2009504026A (ja) 2005-07-27 2009-01-29 ダグ カーソン アンド アソシエーツ,インク. デジタルコンテンツに関連付けられた検証用来歴データ
US20070056042A1 (en) 2005-09-08 2007-03-08 Bahman Qawami Mobile memory system for secure storage and delivery of media content
US7668821B1 (en) 2005-11-17 2010-02-23 Amazon Technologies, Inc. Recommendations based on item tagging activities of users
KR100656402B1 (ko) 2005-11-26 2006-12-11 한국전자통신연구원 디지털 콘텐츠를 안전하게 배포하는 방법 및 그 장치
US7716240B2 (en) 2005-12-29 2010-05-11 Nextlabs, Inc. Techniques and system to deploy policies intelligently
US9277295B2 (en) 2006-06-16 2016-03-01 Cisco Technology, Inc. Securing media content using interchangeable encryption key
US20100138652A1 (en) 2006-07-07 2010-06-03 Rotem Sela Content control method using certificate revocation lists
US20080091613A1 (en) 2006-09-28 2008-04-17 Microsoft Corporation Rights management in a cloud
US8312036B2 (en) * 2006-09-29 2012-11-13 Apple Inc. Recommended systems
WO2008047363A2 (en) 2006-10-19 2008-04-24 Taboola.Com Ltd. Method and system for content composition
US20080104542A1 (en) 2006-10-27 2008-05-01 Information Builders, Inc. Apparatus and Method for Conducting Searches with a Search Engine for Unstructured Data to Retrieve Records Enriched with Structured Data and Generate Reports Based Thereon
GB2446199A (en) 2006-12-01 2008-08-06 David Irvine Secure, decentralised and anonymous peer-to-peer network
US7571069B1 (en) 2006-12-22 2009-08-04 Hewlett-Packard Development Company, L.P. Data assurance workflow derivation and execution
US20080222132A1 (en) 2007-03-07 2008-09-11 Jiangyi Pan Personalized shopping recommendation based on search units
JP4539712B2 (ja) * 2007-12-03 2010-09-08 ソニー株式会社 情報処理端末、情報処理方法、およびプログラム
US20080228716A1 (en) 2007-03-13 2008-09-18 Dettinger Richard D System and method for accessing unstructured data using a structured database query environment
US8219523B2 (en) 2007-03-23 2012-07-10 Sap Ag Data quality enrichment integration and evaluation system
US7970943B2 (en) 2007-08-14 2011-06-28 Oracle International Corporation Providing interoperability in software identifier standards
US8972518B2 (en) 2007-09-20 2015-03-03 Flash Networks Ltd. Integrated data-model and flow based policy system
US20110029520A1 (en) 2007-12-18 2011-02-03 Bae Systems Plc Data curation
US7984056B1 (en) * 2007-12-28 2011-07-19 Amazon Technologies, Inc. System for facilitating discovery and management of feeds
GB2456184A (en) 2008-01-07 2009-07-08 Cvon Innovations Ltd System for selecting an information provider or service provider
ITTO20080434A1 (it) 2008-06-05 2009-12-06 Accenture Global Services Gmbh Sistema di raccolta e di analisi di dati relativi agli acquisti di consumatori e acquirenti
JP2010020524A (ja) 2008-07-10 2010-01-28 Id Solution:Kk Dna認証システム
US7991650B2 (en) 2008-08-12 2011-08-02 Amazon Technologies, Inc. System for obtaining recommendations from multiple recommenders
NO330101B1 (no) 2008-12-23 2011-02-21 Microsoft Int Holdings B V Fremgangsmåte for human-sentrisk informasjonsaksess og presentasjon
US8495005B2 (en) * 2009-01-14 2013-07-23 International Business Machines Corporation Methods for matching metadata from disparate data sources
US8452794B2 (en) 2009-02-11 2013-05-28 Microsoft Corporation Visual and textual query suggestion
EP2230612A1 (fr) 2009-03-19 2010-09-22 France Telecom Génération de recommandations pour un serveur de contenus
US8103681B2 (en) 2009-05-29 2012-01-24 Clear Channel Management Services, Inc. Associating works with unique identifiers
US8122031B1 (en) * 2009-06-11 2012-02-21 Google Inc. User label and user category based content classification
US20110010379A1 (en) 2009-07-09 2011-01-13 Xeround Systems Ltd. Database system with query interception and redirection
US8812490B1 (en) * 2009-10-30 2014-08-19 Microstrategy Incorporated Data source joins
KR101672454B1 (ko) * 2009-10-30 2016-11-04 삼성전자 주식회사 컨텐트 이용 이력에 기반한 네트워크 컨텐트 서비스 관리 방법 및 장치
NO331571B1 (no) 2009-10-30 2012-01-30 Uni I Stavanger System for a beskytte en kryptert informasjonsenhet
US9208230B2 (en) * 2010-10-29 2015-12-08 Google Inc. Enriching search results
US9077462B2 (en) * 2010-12-21 2015-07-07 Cox Communications, Inc. Systems and methods for measuring audience participation over a distribution network
US9122720B2 (en) 2011-06-14 2015-09-01 Microsoft Technology Licensing, Llc Enriching database query responses using data from external data sources
US9147195B2 (en) 2011-06-14 2015-09-29 Microsoft Technology Licensing, Llc Data custodian and curation system
EP2954660A1 (en) 2013-02-08 2015-12-16 Thomson Licensing Privacy against interference attack for large data
US10445062B2 (en) * 2016-09-15 2019-10-15 Oracle International Corporation Techniques for dataset similarity discovery

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002024262A (ja) 2000-07-07 2002-01-25 Nippon Telegr & Teleph Corp <Ntt> 情報源所在推定方法及び装置及び情報源所在推定プログラムを格納した記憶媒体
JP2002149459A (ja) 2000-11-10 2002-05-24 Mitsubishi Electric Corp 冗長化データベース管理・検索システム
US20080059454A1 (en) 2006-08-29 2008-03-06 Switchbook, Inc. Search document generation and use to provide recommendations

Also Published As

Publication number Publication date
EP2721531A4 (en) 2014-11-26
AU2012271085B2 (en) 2017-01-05
MX2013014800A (es) 2014-01-24
US20160140170A1 (en) 2016-05-19
CA2838502A1 (en) 2012-12-20
US20200042517A1 (en) 2020-02-06
WO2012173825A2 (en) 2012-12-20
KR20140041546A (ko) 2014-04-04
US9244956B2 (en) 2016-01-26
KR20190049924A (ko) 2019-05-09
WO2012173825A3 (en) 2013-03-21
EP2721531A2 (en) 2014-04-23
JP5986195B2 (ja) 2016-09-06
US11093490B2 (en) 2021-08-17
CN103608809B (zh) 2017-11-24
RU2013155626A (ru) 2015-06-20
CN103608809A (zh) 2014-02-26
BR112013032101A2 (pt) 2016-12-13
US10540349B2 (en) 2020-01-21
US20120323843A1 (en) 2012-12-20
JP2014523013A (ja) 2014-09-08
BR112013032101B1 (pt) 2021-04-20
KR101976220B1 (ko) 2019-05-07
RU2611966C2 (ru) 2017-03-01

Similar Documents

Publication Publication Date Title
KR102035984B1 (ko) 데이터 보강 제안 기법
AU2012271085A1 (en) Recommending data enrichments
US10942926B2 (en) Identification, and query, of semantically-related database tables
US7917503B2 (en) Specifying relevance ranking preferences utilizing search scopes
US9361320B1 (en) Modeling big data
US20120117116A1 (en) Extended Database Search
US20130091138A1 (en) Contextualization, mapping, and other categorization for data semantics
US20120102453A1 (en) Multi-dimensional objects
US10366081B2 (en) Declarative partitioning for data collection queries
US10503743B2 (en) Integrating search with application analysis
US20100318964A1 (en) Software extension analysis
US20130111315A1 (en) Geographic Visualization of Data
US11030177B1 (en) Selectively scanning portions of a multidimensional index for processing queries
US11500837B1 (en) Automating optimizations for items in a hierarchical data store
US20110246447A1 (en) Inline data correlation and hierarchical datasets
US20080278198A1 (en) Buffer for Object Information
CN116737216A (zh) 技术资源的管理方法、装置、设备、存储介质和程序产品
CN117724946A (zh) 一种痕迹记录方法、装置、系统、设备及介质
CN116483954A (zh) 数据处理方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant