KR20020052200A

KR20020052200A - 데이터 시각화

Info

Publication number: KR20020052200A
Application number: KR1020027005772A
Authority: KR
Inventors: 그린스타인죠지스; 호프만패트릭
Original assignee: 유니버시티 오브 매사츄세츠
Priority date: 1999-11-05
Filing date: 2000-11-06
Publication date: 2002-07-02
Also published as: CN1409838A; WO2001037072A8; WO2001037072A1; JP2003515211A; EP1230587A1; WO2001037072A9

Abstract

제1 형태의 데이터 시각화(P5)의 하나 이상의 특징을 제어하는 제1 세트의 하나 이상의 변수(P4)를 위한 제1 세트의 하나 이상의 값들을 수신하는 단계와, 상기 제1 형태의 데이터 시각화(P8)와는 다른 형태의 데이터 시각화인 제2 형태의 데이터 시각화의 하나 이상의 특징을 제어하는 제2 세트의 하나 이상의 변수를 위한 제2 세트의 하나 이상의 값들을 수신하는 단계를 포함하는 데이터 시각화를 제공하는 방법이 기술되었다.

Description

데이터 시각화{DATA VISUALIZATION}

데이터 시각화 및 정보 시각화를 발생시키고 분석하는 것은 어려운 작업이다. 데이터 시각화는 예로서 선 그래프(line graph), 바 차트, 히스토그램, 파이 차트(pie chart), 조사 플롯(survey plot), 분산 플롯(scatter plot), 스타 플롯(star plot), 강제 필드 시각화(forced field visualization) 등을 포함할 수 있다. 이러한 데이터 표시 및 시각화는 각각 강점 및 약점을 갖는다. 데이터의 수가 증가함에 따라서, 이러한 데이터 시각화에서 패턴을 식별하는 것이 지극히 어려워진다.

본 발명은 데이터 시각화에 관한 것이다.

도 1은 일차원적 앵커를 도시하는 그래프이다.

도 2는 경사 좌표를 사용하는 제1 분산 플롯을 도시하는 그래프이다.

도 3은 제2 분산 플롯을 도시하는 그래프이다.

도 4는 제3 분산 플롯을 도시하는 그래프이다.

도 5는 제4 분산 플롯을 도시하는 그래프이다.

도 6은 제5 분산 플롯을 도시하는 그래프이다.

도 7은 제1 분산 다각형을 도시하는 그래프이다.

도 8은 제2 분산 다각형을 도시하는 그래프이다.

도 9는 정다각형을 도시하는 그래프이다.

도 10은 스프링을 가진 평행 좌표를 도시하는 그래프이다.

도 11은 평행 좌표와 원형 평행 좌표 사이의 보간 시각화를 도시하는 그래프이다.

도 12는 중첩된 래디얼 시각화를 도시하는 그래프이다.

도 13은 예시적 데이터 시각화 시스템의 블럭도이다.

한 특징에 따라서, 본 발명은 제1 형태의 데이터 시각화의 하나 이상의 특징을 제어하는 제1 세트의 하나 이상의 변수를 위한 제1 세트의 하나 이상의 값들을 수신하는 단계, 상기 제1 형태의 데이터 시각화와는 다른 형태의 데이터 시각화인 제2 형태의 데이터 시각화의 하나 이상의 특징을 제어하는 제2 세트의 하나 이상의 변수를 위한 제2 세트의 하나 이상의 값들을 수신하는 단계, 및 한 세트의 데이터의 시각화를 생성하는 단계로서, 상기 시각화는 상기 제1 세트의 변수들의 하나 이상의 값들 또는 상기 제2 세트의 변수들의 하나 이상의 값들에 기초한 특징을 갖는, 한 세트의 데이터의 시각화를 생성하는 단계를 포함하는 데이터의 시각화를 제공하는 방법을 제공한다.

다른 특징에 따라서, 본 발명은 차원적 앵커들을 N-차원 정다각형으로서 배열하는 단계, 상기 N-차원 데이터 값들의 각각의 값의 축에 맵핑하는 단계, 및 상기 맵핑된 데이터 값들을 표시하는 단계를 포함하는 데이터 시각화 방법을 제공한다. 본 발명의 실시예들은 다음의 이점들 중의 하나 이상을 가질 수 있다. 새로운 시각화를 생성하는 것을 돕고 정보 시각화를 분석하는 것을 이해할 수 있게 하는 차원적 앵커(DA)라고 지칭되는 그래픽 프리미티브가 기술되었다. DA는 평행 좌표, 분산 플롯 매트릭스, 방사 시각화, 조사 플롯, 원형 세그멘트 등을 포함하여 다양한 시각화를 위한 통일된 프레임워크 또는 모델을 나타낸다. DA는 위의 시각화의 기본(basics)을 부호화하는 여러 가지 형상 그래픽 요소들과 관련된 변수들에 값들을 할당함으로써 구성된다. 모든 상기 시각화들과 많은 새로운 시각화들 및 보간 시각화들을 생성하기 위해서 복수의 DA들이 사용될 수 있다. 본 발명의 하나 이상의 실시예들의 상세사항이 첨부된 도면과 아래의 설명에서 기술된다. 본 발명의 다른 특징, 목적 및 이점은 설명, 도면 및 청구범위로부터 명백하게 될 것이다.

스프링 상수가 점들 사이의 관계값을 나타내기 위해서 사용될 수 있다. 예로서, 방사 시각화(Radviz)는 원의 원주 주위에 균등하게 이격된 점들로서 n-차원 데이터 점들을 취하는 것을 포함한다. 스프링의 한 끝은 각각의 원주 점에 부착된다. 각각의 스프링의 다른 끝은 데이터 점에 부착된다. 스프링 상수(Ki)는 고정된 점의 I-번째 좌표의 값들이다. 각각의 데이터 점은 다음에는 스프링 힘의 합이 0이 되는 곳에 표시된다. 모든 데이터 점들은 통상적으로 0과 1 사이의 값을 갖도록 정규화된다. 예로서, n개의 좌표들이 모두 동일한 값을 가지면, 데이터 점은 정확하게 원의 중심에 놓인다. 점이 단위 벡터 점이면, 그것은 차원에 대한 스프링이 고정된원의 에지 상의 고정된 점에 정확히 놓인다. 많은 점들은 동일한 위치에 맵핑될 수 있다. 이것은 어떤 대칭성을 보존하고 직관적 표시를 발생시키는 데이터의 비선형 변환을 나타낸다. 이 시각화의 어떤 특징들은, 대략 동일한 좌표값들을 가진 점들은 중심에 가까이 놓이고, 차원이 원 상에서 서로 대향인 유사한 값들을 가진 점들은 중심 근처에 놓이며, 다른 좌표값들보다 큰 하나 이상의 좌표값들을 가진 점들은 그 차원에 가까이 놓이고, 점의 위치는 원 주위의 특정한 차원의 배치에 의존하며, 데이터의 배치는 스프링 유사성(spring analogy)으로 인해서 이해될 수 있고, n-차원들 내의 선은 하나의 선에 맵핑되며, 다른 2-차원 형상 대상들은 평면 내의 2-차원 대상들에 맵핑된다는 것을 포함한다.

시각화는 데이터의 어레이를 표시 D에 맵핑하는 V:A→D로서 정의되는 함수 V로서 모델링된다. 이 V는 어레이(MxN) 데이터의 로우와 컬럼, 및 특정한 시각화에 관한 정보를 부호화하는 추가적 변수들 P₁, P₂,..., P_n의 함수이다. 다른 시각화들의 함수들로서의 시각화들은 다음의 식으로 실행된다.

V_new= f(V₁, V₂, V₃,..., V_n), 각각의 V_i는 시각화이다.

시각화는 P₁, P₂,..., P_n에 의해 정의된 변수 공간에 제한된다. 변수들을 변화시킴으로써, 시각화의 클라스가 정의될 수 있다. 우리는 한 위에서 언급되고 아래에서 더욱 상세히 기술되는 모든 시각화들을 포함하는 한 세트의 변수들을 기술한다.

시각화는 또한 특정한 시각화의 고유한 형상의 함수이다. 시각화 형상의 데이터 및 파트(part)들은 부호화되어 차원적 앵커((DA)라고 지칭되는 프리미티브(primitive)로 된다.

차원적 앵커(DA)는 새로운 시각화를 생성하는 것을 돕고 정보 시각화를 분석하는 것을 이해할 수 있게 하는 그래픽 프리미티브이다. DA는 평행 좌표, 분산 플롯 매트릭스, 방사 시각화, 조사 플롯, 원형 세그멘트 등을 포함하여 다양한 시각화를 위한 통일된 프레임워크 또는 모델을 나타낸다. 차원적 앵커는 위의 시각화의 기본(basics)을 부호화하는 여러 가지 형상 그래픽 요소들과 관련된 변수들에 값들을 할당함으로써 구성된다. 모든 상기 시각화들과 많은 새로운 시각화들 및 보간 시각화들을 생성하기 위해서 복수의 DA들이 사용될 수 있다. 데이터의 한 컬럼은 차원적 앵커와 관련되도록 선택된다. 복수의 변수들이 DA와 관련된다. 9가 이 모델의 한 실시예로서 아래에 기술된다. 시각화는 우리의 모델에 대해서는 함수 V=F(DA 변수들, DA들의 형상)로서 정의될 수 있다. 모든 DA들이 동일한 변수값들을 공유하면, V=F(P₁, P₂,..., P, DA 형상)이다. DA들의 형상이 직선 및 일련의 점들로 한정되는 간단한 곡선으로 구성되면, 단순하지만 오늘날 사용되는 많은 표준 다중-차원 다중-변량(variate) 시각화를 생성하기에 충분히 강력한 시각화의 정의 및 규격이 생성될 수 있다. 또한, 많은 신규한 시각화가 또한 생성될 수 있다.

한 실시예에서, 모델은 9개의 변수들을 갖는데, 그 변수들은 다음과 같다.

P1- 분산 플롯의 점의 크기

P2- 분산 플롯 점을 생성하는 앵커점들로부터 연장되는 수직선들의 길이

P3- 분산 플롯 내의 동일한 데이터 점과 관련되는 점들을 연결하는 선들의 길이

P4- 조사 플롯 내의 사각형의 길이

P5- 평행 좌표 선의 길이

P6- 평행 좌표 선을 위한 블럭킹 계수(blocking factor)

P7- Radviz/스프링 플롯 점의 크기

P8- Radviz/스프링 플롯 점을 생성하는 앵커점으로부터 연장되는 "스프링" 선의 길이

P9- "스프링" K 상수를 위한 줌 계수(zoom factor)

기본 레벨에서, 차원적 앵커는 단순히 2차원 분산 플롯 내의 축(axis)들 중의 하나이다. 그것은 통상적으로 차원 또는 데이터세트 또는 데이터베이스로부터의 변량과 관련된다. 관련된 차원을 위한 데이터 값들은 최대 및 최소 값들이 통상적으로 축의 끝점들 근처의 점들에 대응되는 표준 방법으로 축에 맵핑된다. 라벨과 스케일 티크 마크(labels and scale tick marks)는 또한 차원적 앵커와 관련될 수 있다. 통상적으로, 축에 연한 이러한 규칙적 간격은 좌표 값들이라고 지칭된다. 앵커점들이라고 지칭하는 맵핑된 데이터 점들은 차원적 데이터 점들에 대응되는 좌표 값들(차원적 앵커에 연한 점들)이다.

도 1을 참조하면, 앵커점들로부터 연장된 선들을 가진 1차원적 앵커를 가진 예시적 표시가 도시되었다. 수직선들은 갤런 당 마일 속성을 위한 데이터(예로서, 차량의 데이터 세트)의 분포를 도시하기 위해서 색칠될 수 있다. 또한, 선들의 색은 차량의 형태를 도시할 수도 있다(예로서, 미국 차- 적색 또는 어두운 색, 일본 차- 녹색 또는 밝은 색, 및 유럽 차- 자주빛).

DA와 관련된 9개의 변수들은 점, 선, 및 진전된 시각화 등 그래픽 구성을 형성하도록 DA가 다른 DA와 상호작용하는 방법을 제어한다. 예로서, 분산 플롯을 생성하기 위해서, DA의 한 변수는 분산 플롯 점(P_l)의 크기를 제어하는 데에 사용된다. 그 점은 2개의 DA들의 앵커점으로부터의 선의 교차에 의해 형성된다. 이러한 9개의 변수들과 그것들의 실현(implimentations)이 시각화를 형성하는 방법이 이제 기술될 것이다.

분산 플롯들의 구성과 관련된 3개의 DA 변수들이 정의되었다. 분산 플롯의 하나의 가능한 구성은 수직선이 DA 상의 앵커점으로부터 외부로 연장된다는 것이다. 다른 DA(동일한 데이터 세트의 다른 컬럼) 상의 동일한 데이터 점과 관련된 앵커점은 또한 외부로 연장되는(DA의 양쪽에서)수직선을 갖는다. 2개의 수직선들이 만나면, 교차점은 분산 플롯의 점이 된다. 제1 변수(P1)는 분산 플롯 점의 크기를 제어하는데, 0(점이 도시되지 않는다)으로부터 1(큰 점이 표시된다)까지의 범위를 갖는다. 분산 플롯에서 종종, 점의 크기, 모양, 또는 색은 데이터 세트 내의 다른 차원(변량 또는 컬럼)과 관련될 수 있다. 한 실시예에서, 선택된 컬럼은 색을 결정하고, 모양은 원이다. 다른 실시예에서, 한 세트의 변수들은 아이콘, 또는 색 아이콘을 사용하는 시각화의 다른 클라스가 표시될 수 있도록 모양을 제어한다. 그러나, 분산 플롯 점이 표시되었는지 아닌지는 차원적 앵커의 기본적 변수(P1)이다.앵커점들로부터 연장되는 수직선들의 교차는 임의의 배열 또는 임의의 수의 차원적 앵커와 작용한다.

정의에 의해, 차원적 앵커는 임의의 시켄스의 선 세그멘트일 수 있다. 이것은 원호 등 임의의 모양의 곡선이 차원적 앵커가 되게 한다. 이러한 정의에 의해, 분산 플롯을 위한 수직선 연장은 여전히 쉽게 구성될 수 있다. 이러한 추가적 배열들은 다른 시각화를 생성할 수 있고, 아래에서 논의될 것이다. 도 2를 참조하면, 분산 플롯의 대안적 정의는 경사 좌표를 사용할 수 있는데, 즉 좌표축으로부터 반드시 수직은 아니다.

2개의 차원적 변수들(P2, P3)은 앵커점들로부터의 수직선들과 한 데이터 점과 관련된 모든 분산 플롯 점들을 연결하는 선들의 표시를 제어한다. P2는 DA로부터 분산 플롯 점으로 연장되는 수직선의 길이를 제어한다. 예로서, 도 3을 참조하면, P2는 약0.2이고, 도 4를 참조하면, P2 변수는 1.0이다. 변수들은 0(선이 없다)으로부터 1(모든 교차선들이 표시된다)까지 정의된다. N개의 차원적 앵커들이 사용될 때(N개의 변량 또는 차원들을 가진 데이터 세트에서), 통상적으로 N개의 점들을 연결하기 위해 시각화에서 각각의 데이터 점에 대해 생성된 N개의 점까지 있다. P3은 2등변 삼각형 패턴에서 3차원 앵커들을 제어한다.

도 5를 참조하면, 분산 플롯 표시 점들을 생성하는 교차하는 수직선들이 도시되었다(변수 P2=1.0). 도 6에서, 동일한 데이터 점과 관련된 표시점들이 연결되었다(P3=1.0). 알 수 있듯이, 이 시각화에서, 생성된 삼각형들은 매우 유사하다. 일반적으로, DA가 정다각형으로서 구성되면 P2 및 P3은 둘 다 N-변 다각형들을 생성할 것이다.

특정 할당된 데이터 세트 차원(DDD)(변량 도는 컬럼)과 함께 추가적 변수(P4)는 조사 플롯 또는 원형 세그멘트와 유사한 시각화를 구성하기 위한 DA를 위해 사용된다. P4 변수는 앵커점으로부터 연장되는 사각형의 크기를 제어한다. 크기는 또한 앵커점에서의 차원적 값에 의존한다. 하나의 DDD 옵션은 데이터가 로딩되는 순서를 사용하는 종류의 것이 아니다. P4 최대 가능한 값(조사 플롯을 생성하는 데에 필요한)의 마지막 구속 조건. 이 최대 가능한 값은 P4 사각형이 임의의 다른 DA로부터의 P4 사각형들과 접촉하지 못하도록 제어된다. P4 변수를 사용함으로써, P4의 구속조건과 차원적 앵커의 적절한 배열에 의해, 조사 플롯과 수정된 원형 세그멘트는 쉽게 구성될 수 있다. (원형 세그멘트 원호는 직선으로 되고, 원 대신에 정다각형으로 향해 연장되지만, 시각화의 기본은 여전히 동일하다.)

다른 실시예에서, 원형 세그멘트와 유사한 시각화의 구성이 얻어진다. 예로서, 한 실시예에서, CCCViz(색 상관된 컬럼 시각화)는 다음과 같이 생성된다. 특수한 분류 차원을 가진 데이터 세트의 대안적 차원. 분류 차원에 따라 컬럼(즉, 할당된 데이터 세트 차원)을 분류한다. 데이터 세트의 차원에 대해 그레이 스케일 맵핑을 사용하고, 분류 차원에 대해서는 무지개색 맵핑을 사용한다. P4 변수 즉 조사 플롯에서 사각형의 길이를 변경시킴으로써, 색 상관된 컬럼 시각화가 생성된다. 시각화는 차원(그레이 스케일)이 특정 분류 차원(색 스케일)과 상관되는지를 설명한다. CCCViz는 차원의 수가 적을 때, 즉 30 미만일 때 유용하다.

DA의 여러 가지 배열은 데이터의 부분적 순서 설정을 생성할 수 있다. 예로서, 십자형 그리드 패턴에 배열된 시각화는 스프링 변수(P7 및 P9)만 사용하며, 그 결과 간단한 대각선 패턴이 생성되는데, 왜냐하면 매 "스프링"은 대각성을 대칭적으로 가로지르는 대향 스프링을 갖기 때문이다. 십자형 DA 패턴은 데이터의 시각적 분류를 수행하는데, 그것은 데이터의 클라스를 분리하는 판별 기준으로서 사용될 수 있다.

평행 좌표 시각화의 구성은 다음과 같다. 단순히 하나의 DA 앵커점으로부터 다른 DA 앵커점으로 선을 연결한다. 이러한 연결선의 길이는 DA 변수(P5)에 의해 제어된다. 그러나, 모든 DA 상의 모든 앵커점들이 빠짐 없이 연결되면(각각의 앵커점이 N-1개의 다른 앵커점들에 연결되면), 추가적 흥미로운 시각화들이 얻어진다. P5 연결선이 얼마나 많은 DA와 교차될 수 있는지를 나타내는 추가적 변수(P6)를 정의한다. 이 블록킹 변수는 0으로 설정되었을 때에 통상적인 평행 좌표 시각화를 생성한다. DA가 원의 중심으로부터의 반경방향(radial)의 바퀴 살(spoke)로서 배열될 때 P5 와 P6을 사용하여 원 내의 평팽 좌표가 또한 생성될 수 있다.

차원적 앵커에 연한 앵커점들이 가상 스프링이 이동가능 데이터 점에 부착되는 고정 점인 것으로 생각되면, 방사(radial) 시각화와 유사한 시각화가 생성될 수 있다. 하나의 변수(P7)가 스프링 힘의 합이 0인 표시에 위치된 점의 크기를 제어하기 위해 사용된다. 차원적 앵커들이 N-차원 정다각형으로서 배열된 때 polyvis라고 지칭되는 "강화된" 방사 시각화가 생성된다. 방사 시각화의 한계들 중의 하나는 많은 데이터 점들이 서로 다른 좌표값들을 갖더라도 원의 중심에서 중첩될 수 있다는 것이다. 고정된 스프링 점들이 정다각형 내의 DA에 연하여 분산될 때, 점들이 중첩되는 가능성은 원래의 방사 시각화에서보다 훨씬 적다. DA가 원의 원주 주위에 균일하게 분포된 점들로 압축되면, 원래의 방사 시각화 표시가 생성된다. Polyviz는 원(또는 정다각형)의 전체 영역을 더욱 양호하게 사용하는 시각화이다. 추가적 변수(P8)는 고정된 스프링 점으로부터 스프링 힘의 합이 0이 되는 표시된 점으로 연장되는 선들을 그리기 위해 사용된다. 추가적 변수(P9)는 또한 표시에서 줌 계수로서 사용된다.

도 7을 참조하면, 7개의 점들을 가진 polyviz 시각화가 도시되었다. 도 7 및 도 8은 "분산된" 다각형의 예를 도시하고, 도 9는 정다각형을 도시한다. 도 7 및 도 8은 앵커점들로부터의 선 연장으로 도시된 스프링 선(P8=1)을 갖는다.

한 실시예에서, 도 10을 참조하면, DA들을 평행 좌표 배열로 재배열하고 적절한 P 값들 설정하면 스프링 힘을 사용하는 훌륭한 판별수단을 생성한다. 도 10의 평행 좌표 배열에서, 앵커점들과 그 점드로 연장되는 선들은 첫 번째 점(1,1,1,1)을 제외하고는 평행 좌표 배열과 유사하게 보인다는 것을 유의하여야 한다. 정규화(컬럼 내의 모든 값들은 0과 1 사이로 정규화된다)로 인해서, 첫 번째 점 상의 스프링 힘은 완전히 제로(0)이고, 그 점은 표시의 형상의 중심이 정의된 곳마다 표시된다. 통상적으로, 이것은 표시의 중심에 있을 것이지만, 그것은 DA의 배열에 따라서 몇 개의 다른 점에서 정의될 수 있다. 모든 차원들에 대해서 최대값을 갖는 외부 점을 검출하고자 하면, 형상의 중심이 동일한 스프링 힘 중심과는 다르게 정의되어야 한다. 줌 변수(P9)는 그것이 0일 때 모든 점들이 형상의 중심에 놓이고, 그것이 통상적 물리적 스프링(힘=P9x2xKxDX)에 대응될 때 0.5에 놓이며, 그것이 스프링 K 값을 증폭할 때 더 높은 값에 놓인다. 서서히 증가하면, P9은 형상의 중심으로부터 멀리 이동하는 모든 점들을 도시한다(모든 차원에 대하여 최소값을 가진 점들을 제외하고).

DA와 Polyviz는 시각화의 선형 조합을 생성하는 메카니즘을 제공한다.

"시각화의 선형 조합"의 개념을 설명하기 위해서, 여러 가지 예들을 보이겠다. 시각화에 사용되는 차원의 전체 수를 d라고 하자. 통상적으로, 이것은 또한 사용된 차원의 전체 수일 것이지만, 어떤 시각화에 대해서는 DA의 수는 2d이다.

평행 좌표 시각화를 생성하는 변수들은 다음과 같다.

P_pc={P₁,P₂,...P₉}=[0,0,0,0,1,0,0,0,0]

그러면, 평행 좌표 시각화는 다음과 같이 정의될 수 있다.

V_pc=f(P_pc,G_pc(d))

여기에서, G_pc(d)는 DA의 평행 좌표 배열의 형상이다.

방사 시각화를 생성하는 변수는 다음과 같다.

P_rv={P₁,P₂,...P₉}=[0,0,0,0,0,0,...5,0,...5]

그러면, 방사 시각화는 다음과 같이 정의될 수 있다.

V_rv=f(P_rv,G_rv(d))

여기에서, G_rv(d)는 DA의 Radviz 배열의 형상이다.

평행 좌표 및 polyviz의 면에서 정의된 새로운 시각화는 다음과 같다.

V_new=f(V_pc,V_rv)

선형 조합의 한 예는 다음과 같다.

V_new= 0.5V_pc+ 0.5V_rv

변수 벡터에 대해서 스칼라량에 의한 곱셈 및 합산은 쉽게 정의되어 새로운 시각화 변수 벡터를 다음과 같이 준다.

P_new=[0,0,0,0,...5,0,0.25,0,0.25]= 0.5P_pc+ 0.5P_rv

DA의 형상의 선형 조합은 많은 방법으로 정의될 수 있다. 예로서, 도 11에서, DA의 평행 좌표 구성에 대한 가능한 변환을 기술하는 한 실시예가 도시되었다. DA는 유연하게 감아져서 십자 형상으로 된다. DA가 이제 십자의 외부 끝점에서의 점들로 점진적으로 축소되면, 통상적인 방사 시각화가 달성된다. 변환의 형상은 밀접한 관계에 있지 않거나(not affined)(평행선이 평행한 상태로 유지되지 않는다) 투영적이지 않다(not projective). 각각의 개별 DA 변환은 투영적인 것으로 생각될 수 있으나, 통합된 DA는 투영적이 아니다(점과 선의 발생이 불변적이지 않다). DA의 끝점이 실제로 결코 만나지 안는다는 구속조건을 포함시키면, 변환은 위상 기하학적(topological)이라고 생각될 수 있다. 도 11에서 거리 함수를 변환 사이에서 동일한 값을 갖는 것으로 정의하면, 새로운 시각화 형상을 정의할 수 있다.

G_new(d)= 0.5G_pc(d) + 0.5G_rv(d)

기술적인 면에서, G_pc(d) 및 G_rv(d)는 DA의 초기 배열에 대한 변환이다.G_pc(d)=0(초기 배열)이라고 설정하면, 다음의 식을 얻는다.

G_new(d)= 0.5G_rv(d)

이것은 G_pc(d)로부터 G_rv(d)로 향하여 중간 지점에서의 변환이다(도 11에서 맨 밑의 배열).

평행 좌표와 방사 시각화의 선형 조합은 도 12에 도시되었다. DA 배치는 원형 평행 좌표이고, Radviz 스프링 및 평행 좌표를 위한 변수들은 양의 값이다. 스프링 점은 DA에 매우 가깝게 도시되었고, 평행 좌표 선들은 완전히 연결되지 않았다. 우선, 점들의 크기는 표시를 위해서 적절해야만 하고(점들의 수에 따라서), 연결하는 Pc 선들은 갭을 가지지 않아야 한다. 이것은 더욱 유용한 표시는 다음식과 같을 수 있다는 것을 뜻한다.

V_pc+ V_rv

여기에서, 방사 시각화 점의 크기는 통상적이고, 평행 좌표 선은 완전히 연결되었다.

시각화의 두 부분 모두로부터 어떤 유용한 정보가 있다. 즉, 평행 좌표 선으로부터 각각의 차원 내의 상대적 값을 알 수 있고, 방사 시각화/스프링 점으로부터의 더욱 중요한 상대적 차원 효과를 알 수 있는 등의 정보가 있다.

차원적 앵커가 차원적 앵커의 배열에 의해 기술된 임의의 시각화의 선형 조합으로서의 새로운 시각화의 생성을 허용한다는 것이 위에서 보여졌다. 차원적 앵커(변수 및 형상)의 동일한 대수에 의해서, 또한 한 시각화를 다른 시각화로 유연하게 변환할 수 있다. 예로서, 평행 좌표가 원형 평행 좌표로 쉽게 변환될 수 있는 방법을 보이고자 한다. 차원적 앵커를 포함하는 차원적 경계라고 지칭되는 구성을 사용하는 것이 도움이 된다.

평행 좌표(PC)의 차원적 배치를 몇 개의 변수들에 의해 정의된 임의의 형상 및 길이일 수 있는 2개의 선(상부 및 하부 차원적 경계)에 연결된 균등하게 이격된 직선이라고 생각하자. 차원적 경계가 직선으로부터 원호로 이동되고 외부 원 및 내부 원이 될 수 있다는 것을 쉽게 알 수 있다. 내부 원은 단일 점이 될 때까지 점점 작게 될 수 있다. 그러면, 이것은 원형 평행 좌표 또는 스타 상형 문자(star glyph)로 된다. 원추형 섹션 또는 더욱 일반적인 2차 다항식을 사용하여 유사한 시각화의 많은 변화을 제공할 수 있다. 차원의 경계의 변환은 이러한 원추형 섹션을 통과하는 평면의 단순한 경로일 수 있다.

위에서 정의된 9개의 변수들을 사용하면, 이 시각화 공간이 최소한 P⁹(즉 9차원 공간)임을 알 수 있다. 그러나, 그것은 단지 1차원 앵커만을 위한 것이다. 통상적 데이터 세트는 10개의 차원을 가질 수 있으며, 따라서 각각 9개의 변수(공간=P^9*10)를 갖는 10개의 차원적 앵커들을 요구한다. 더욱 중요하게, DA의 서로 다른 배열는 시각화 공간의 차원을 더욱 증가시킬 것이다. 배치를 평행 좌표 및 Radviz와 유사한 배열로 제한하면, 시각화 공간을 크게 감소된다. 또한, 각각의 차원적 앵커에 대해 동일한 9개의 변수를 사용하면, 시각화 공간을 아마도 P¹²로 감소시킬 수 있다. 이 시각화 공간을 통해서 "그랜드 투어(grand tour"를 취하는 것이가능하다. 9개의 변수를 변화시키고 차원적 앵커를 애니메이팅함으로써, 한 시각화로부터 다른 시각화로 서서히(데이터 세트 크기 및 컴퓨터 속도에 따라) 이동할 수 있다. 앞에서 기술된 시각화는 새로운 시각화를 찾는 데에 유용한 것을 판명된 제한된 수동 투어를 보여준다.

도 13을 참조하면, 예시적 데이터 시각화 시스템(10)은 링크(14)를 거쳐 표시 장치(16)에 연결된 컴퓨터 시스템(12)을 포함한다. 컴퓨터 시스템(12)는 적어도 메모리(18), 중앙 처리 장치(CPU)(20), 및 대용량 기억 장치(22)를 포함한다. 대용량 기억 장치는 데이터 시각화 명령(24)을 포함한다. 동작 시에, 데이터 시각화 명령(24)은 CPU(20) 내에서의 처리를 위해 메모리(18)로 로딩된다. CPU(20)에서의 처리로부터의 출력은 표시 장치(16) 상에 시각화를 표시한다.

본 발명의 여러 가지 실시예가 기술되었다. 그러나, 본 발명의 정신 및 범위를 이탈하지 않고 여러 가지 수정이 이루어질 수 있음을 이해할 것이다. 예로서, DA 및 그들의 관련된 변수들은 임의의 크기, 모양 및 위치에 배열될 수 있다. 평행 좌표, 원형 세그멘트, 정다각형, 분산 다각형 및 십자형 패턴에서와 같이 이러한 "정규 배열들" 중의 몇 개만 조사하였다. 렌즈 형상 구성 및 쌍곡선 원형 표시의 형태로 배열된 원호 또는 곡선 등 많은 가능한 추가적 배열이 있다. 이러한 구성들은 특수한 "촛점이 집중된" 시각화를 만들 것이다. 다항식 또는 로그 함수의 형태의 형상을 가진 차원적 앵커들은 또한 유용한 성질을 가질 것이다.

메시 플롯(mesh plot)으로 분류한 삼각형 또는 다각형 등 여러 가지 구성 내의 평행 좌표 형태의 선, 분산 플롯 선 및 스프링 선으로부터 여러 가지 시각화가생성된다. 그 시각화는 선들의 "메시"의 밀도를 변화시킴으로써 특징지어진다.

데이터의 표시를 위한 스프링 패러다임은 상당히 성공적이었다. 고정된 스프링 "앵커점들"을 분산시킴으로써, polyvizdml 효율 및 유용성을 증가시켰다. 이것은 점 중첩 문제를 현저히 감소시켰다.

또한, 차원적 앵커들 상의 앵커점들로부터 연장되는 "스프링" 선들의 일부를 도시함으로써, polyviz의 이해 및 유용성이 증가되었다. 많은 시각화에서 점들이 중심에 군집하기 때문에, 부분적 스프링 선들에 의해 제공된 추가적 정보는 화면상의 실제 면적의 측면에서 매우 많이 차지하지 않는다.

스프링 변수를 사용하는 차원적 앵커들의 여러 가지 구성은 여러 가지 방법으로 예로서 직선을 따라 압축된 십자 패턴 또는 DA를 사용하여 데이터의 순서를 위치시킬 수 있다.

원형 세그멘트(수정된) 시각화의 유용성은 앞에서 조사되었다. 그것의 가장 유용한 특징들 중의 하나는 특정한 분류 차원을 가진 모든 차원들(또는 변량)의 전체적 상관을 주는 능력이다. 색 상관된 컬럼 Viz는 이러한 개념의 수정으로서 그것은 차원들의 수가 작을 때 더욱 유용하며 어떤 경우에는 이해하기 더욱 쉬울 것이다. 따라서, 다른 실시예들은 다음의 청구범위의 범위 내에 있다.

본 발명은 데이터 시각화에 사용될 수 있다. 본 발명의 차원적 앵커(DA)라고 지칭되는 그래픽 프리미티브는 데이터 시각화 및 정보 시각화를 발생시키고 분석하는 것을 쉬운 작업이 되게 한다. 본 발명은 데이터의 수가 증가할 때에도 데이터 시각화에서 패턴을 식별하는 것을 쉽게 한다.

Claims

데이터를 시각화하는 방법에 있어서,

제1 형태의 데이터 시각화의 하나 이상의 특징을 제어하는 제1 세트의 하나 이상의 변수를 위한 제1 세트의 하나 이상의 값들을 수신하는 단계,

상기 제1 형태의 데이터 시각화와는 다른 형태의 데이터 시각화인 제2 형태의 데이터 시각화의 하나 이상의 특징을 제어하는 제2 세트의 하나 이상의 변수를 위한 제2 세트의 하나 이상의 값들을 수신하는 단계, 및

상기 제1 세트의 변수들의 하나 이상의 값들 또는 상기 제2 세트의 변수들의 하나 이상의 값들에 기초한 특징을 갖는 한 세트의 데이터의 시각화를 생성하는 단계

를 포함하는 방법.
제1항에 있어서,

상기 데이터 시각화 형태들 중의 하나는 분산 플롯(scatter plot)을 포함하는 방법.
제2항에 있어서,

상기 변수들 중의 하나는 분산 플롯점의 크기, 차원 앵커(dimension anchor)로부터 분산 플롯점으로 연장되는 선의 길이 및 분산 플롯 내의 동일한 데이터점과관련된 점들을 연결하는 선들의 길이 중의 적어도 하나를 포함하는 방법.
제1항에 있어서,

상기 데이터 시각화 형태들 중의 하나는 조사 플롯을 포함하는 방법.
제4항에 있어서,

상기 변수들 중의 하나는 조사 플롯 내의 사각형의 길이를 포함하는 방법.
제1항에 있어서,

상기 데이터 시각화의 형태들 중의 하나는 방사 시각화 플롯(radial visualization plot)을 포함하는 방법.
제6항에 있어서,

상기 변수들 중의 하나는 방사 시각화 스프링 플롯점(radial visualization spring plot)의 크기, 차원 앵커로부터 방사 시각화 스프링 플롯점으로 연장되는 선들의 길이 및 스프링 상수 중의 적어도 하나를 포함하는 방법.
제1항에 있어서,

상기 데이터 시각화의 형태들 중의 하나는 평행 좌표 시각화를 포함하는 방법.
제8항에 있어서,

상기 변수들 중의 하나는 평행 좌표 선들의 길이와 평행 좌표 선들에 대한 블록킹 계수 중의 적어도 하나를 포함하는 방법.
제1항에 있어서,

상기 제1 세트 및 제2 세트가 하나 이상의 그래픽 사용자 인터페이스 콘트롤들로부터 수신하는 단계를 포함하는 방법.
제1항에 있어서,

상기 제1 세트 및 제2 세트는 컴퓨터 메모리 위치에 액세스하는 단계를 포함하는 방법.
제1항에 있어서,

시각화하는 단계는 시각화를 기술하는 파일의 표시, 프린트 및 생성 단계들 중의 적어도 하나를 포함하는 방법.
데이터의 시각화를 제공하기 위해 컴퓨터 판독가능한 매체 상에 배치된 컴퓨터 프로그램 제품에 있어서,

상기 프로그램은 프로세서로 하여금

제1 형태의 데이터 시각화의 하나 이상의 특징을 제어하는 제1 세트의 하나 이상의 변수를 위한 제1 세트의 하나 이상의 값들을 수신하는 단계,

상기 제1 형태의 데이터 시각화와는 다른 형태의 데이터 시각화인 제2 형태의 데이터 시각화의 하나 이상의 특징을 제어하는 제2 세트의 하나 이상의 변수를 위한 제2 세트의 하나 이상의 값들을 수신하는 단계, 및

상기 제1 세트의 변수들의 하나 이상의 값들 및 상기 제2 세트의 변수들의 하나 이상의 값들에 기초한 특징을 갖는 한 세트의 데이터를 시각화하는 단계

를 수행하게 하는 명령들을 포함하는 컴퓨터 프로그램.
데이터 시각화 방법에 있어서,

차원 앵커들을 N차원 정다각형으로서 배열하는 단계,

상기 N차원 데이터 값들 각각의 축에 맵핑하는 단계, 및

상기 맵핑된 데이터 값들을 표시하는 단계

를 포함하는 방법.
제14항에 있어서,

상기 맵핑하는 단계는 상기 N차원 각각의 최소 및 최대 데이터 값들을 상기 N차원을 나타내는 각 축들의 끝점들 부근의 점들에 할당하는 단계를 포함하는 방법.
데이터를 표시하는 데이터 시각화 방법에 있어서,

상기 데이터에 대한 차원들의 기초 세트를 특수한 분류 차원으로 교대하는 단계,

상기 특수한 분류 차원에 따라 상기 기초 세트의 차원들 중의 하나를 분류(sorting)하는 단계,

상기 분류된 차원들을 그레이 스케일 표현들(representations)에 맵핑하는 단계,

상기 특수한 분류 차원을 색 스케일 표현들에 맵핑하는 단계, 및

상기 그레이 스케일 표시와 색 스케일 표현을 표시하는(displaying) 단계

를 포함하는 방법.
혼합(hybrid) 시각화 방법에 있어서,

데이터를 제1 시각화하는 단계,

데이터를 제2 시각화하는 단계,

상기 제1 시각화와 제2 시각화 사이에서 보간하여 상기 데이터를 혼합 시각화하는 단계, 및

상기 데이터의 혼합 시각화를 표시하는 단계

를 포함하는 방법.
제17항에 있어서,

상기 데이터의 제1 시각화는 평행 좌표 시각화인 방법.
제17항에 있어서,

상기 데이터의 제2 시각화는 RAdviz 시각화인 방법.
제17항에 있어서,

상기 데이터의 복수의 시각화를 생성하는 단계,

상기 데이터의 제1 및 제2 시각화를 상기 데이터의 복수의 시각화로 보간하여 상기 데이터를 혼합 시각화하는 단계, 및

상기 데이터의 혼합 시각화를 유연하게 애니메이팅(animating)하는 단계

를 포함하는 방법.