Azure

[DP-900] 4. Microsoft Azure 데이터 기본 사항: Azure의 데이터 분석 탐색 - 데이터 시각화의 기본 사항 살펴보기

야채곱창의축복 2024. 10. 15. 11:07

출처 : 

https://learn.microsoft.com/ko-kr/training/paths/azure-data-fundamentals-explore-data-warehouse-analytics/

 

Microsoft Azure 데이터 기본 사항: Azure의 데이터 분석 탐색 - Training

Microsoft Azure 데이터 기본 사항: Azure의 데이터 분석 탐색

learn.microsoft.com

 

목차

1. 대규모 분석의 기본 사항 살펴보기

2. 실시간 분석의 기본 사항 살펴보기

3. 데이터 시각화의 기본 사항 살펴보기

 

 


 

데이터 시각화의 기본 사항 살펴보기

학습목표

  • Microsoft Power BI를 사용하여 보고 솔루션을 만들기 위한 개략적인 프로세스를 설명합니다.
  • 분석 데이터 모델링의 핵심 원칙을 설명합니다.
  • 일반적인 유형의 데이터 시각화 및 해당 용도를 식별합니다.
  • Power BI Desktop을 사용하여 대화형 보고서를 만듭니다.

 

[소개]

 - 데이터 모델링 및 시각화는 대규모 데이터 분석 솔루션에서 지원하는 "BI" 워크로드의 핵심.

 - 데이터 시각화는 조직의 성공에 도움이 되는 보고 및 의사 결정 지원

 

 

[Power BI 도구 및 워크플로 설명]

- 데이터 분석가가 데이터를 탐색하고 인사이트를 시각적으로 요약하는데 사용할 수 있는 많은 데이터 시각화 도구가 있음. 여기에는 Microsoft Excel과 같은 생산성 도구의 차트 지원, Azure Synapse Analytics 및 Azure Databricks와 같은 서비스에서 데이터를 탐색하는데 사용되는 Notebook의 기본 제공 데이터 시각화 위젯이 포함됨.

- 그러나 엔터프라이즈 규모 비즈니스 분석의 경우 복잡한 데이터 모델링, 대화형 보고 및 안전한 공유를 지원할 수 있는 통합 솔루션이 필요

 

1. Microsoft Power BI

 - 데이터 분석가가 비즈니스 사용자가 사용할 수 있는 대화형 데이터 시각화를 빌드하는데 사용할 수 있는 Microsoft Fabric 내의 도구와 서비스 모음

 - 데이터 시각화 솔루션을 만드는 일반적인 워크플로는 다양한 데이터 원본에서 데이터를 가져오고 분석 데이터 모델에서 이러한 원본의 데이터를 결합 및 구성하고 대화형 데이터 시각화를 포함하는 보고서를 만들 수 있는 Microsoft Windows application Power BI Desktop을 시작함.

 - 데이터 모델 및 보고서를 만든 후에는 비즈니스 사용자가 보고서를 게시하고 상호작용할 수 있는 클라우드 서비스인 Power BI 서비스에 게시할 수 있음.

 - 웹 브라우저를 사용하여 서비스에서 직접 몇 가지 기본 데이터 모델링 및 보고서를 편집할 수도 있지만 Power BI Desktop 도구에 비해 제한적임. 이 서비스를 사용하여 보고서의 기반이 되는 데이터 원본의 새로고침을 예약하고 다른 사용자와 보고서를 공유할 수 있음. 관련 보고서를 사용하기 쉽게 단일 위치로 결합하는 대시보드 및 앱을 정의할 수 있음.

 

2. 데이터 모델링의 핵심 개념 설명

 - 분석 모델을 사용하면 분석을 지원하도록 데이터를 구조화할 수 있다. 모델은 관련 데이터 테이블을 기반으로 하며 분석하거나 보고하려는 숫자 값(측정 값) 및 집계할 엔터티(차원)을 정의한다.

 - 예) 모델에는 매출(수익, 수량 등)에 대한 숫자 측정값과 제품,고객 및 시간에 대한 차원이 포함된 테이블

 - 하나 이상의 차원에 걸쳐 판매 측정값을 집계할 수 있다. (고객별 총 수익 또는 월별 제품별로 판매된 총 항목 수)

 - 개념적으로 모델은 일반적으로 큐브라고 하는 다차원 구조를 형성하며, 여기서 차원이 교차하는 지점은 집계된 해당 차원의 측정값을 나타낸다.

 

3. 테이블 및 스키마

 - 차원 테이블은 숫자 측정값을 집계하려는 엔터티를 나타냄.

 - 각 엔터티는 고유한 키 값이 있는 행으로 표시됨. 나머지 열은 엔터티의 특성을 나타냄.

 - 대부분의 분석 모델에서는 시간에 따른 이벤트와 관련된 숫자 측정값을 집계할 수 있도록 시간 차원을 포함하는 것이 일반적

 - 모델의 다양한 차원으로 집계되는 숫자 측정값은 팩트 테이블에 저장됨.

 - 팩트 테이블의 각 행은 숫자 측정값이 연결된 기록된 이벤트 나타냄.

 - 팩트 테이블이 하나 이상의 차원 테이블과 관련된 스키마 유형을 별모양 스키마(Star Schema)라고 함. (단일 팩트 테이블과 관련된 5개의 차원이 있다고 가정. 스키마는 5개의 뾰족한 별을 형성)

 - 차원 테이블이 추가 세부 정보를 포함하는 추가 테이블과 관련된 더 복잡한 스키마를 정의할 수도 있음. 눈송이 스키마(Snowflake Schema)라고 함. 팩트 테이블과 차원 테이블의 스키마는 모든 차원의 측정값 집계가 미리 계산되는 분석 모델을 만드는데 사용됨. 매번 집계를 계산하는 것보다 분석 및 보고 작업의 성능이 훨씬 빨라짐.

 

4. 특성 계층

 - 분석 모델에 대해 고려해야 할 마지막 한가지 사항은 계층적 차원에서 여러 수준으로 집계된 값을 찾기 위해 신속하게 드릴업 또는 드릴다운할 수 있는 특성 계층 구조를 만드는 것

 - 계층 구조의 각 수준에 대해 미리 집계된 값을 사용하여 모델을 빌드할 수 있으므로 분석 범위를 빠르게 변경할 수 있음.

 

5. Microsoft Power BI의 분석 모델링

 - Power BI를 사용하여 하나 이상의 데이터 원본에서 가져올 수 있는 데이터 테이블에서 분석 모델을 정의할 수 있음.

 - 그런다음, Power BI Desktop의 모델 탭에서 데이터 모델링 인터페이스를 사용하여 팩트 테이블과 차원 테이블 간의 관계를 만들고 계층 구조를 정의하고 테이블 필드에 대한 데이터 형식 및 표시 형식을 설정하고 분석을 위한 풍부한 모델을 정의하는데 도움이 되는 데이터의 다른 속성을 관리하여 분석 모델을 정의할 수 있음.

 

 

[데이터 시각화 관련 고려 사항 설명]

 - 모델을 만든 후에는 이 모델을 사용하여 보고서에 포함될 수 있는 데이터 시각화를 생성할 수 있다.

 

1. 표 및 텍스트

 - 수많은 관련 값을 표시해야 하는 경우 유용

 - 카다의 개별 텍스트 값은 중요한 그림이나 메트릭을 표시하는 유용한 방법

 

2. 가로 막대형 및 세로 막대형 차트

 - 불연속 범주의 숫자 값을 시각적으로 비교할 때 효과적인 방법

 

3. 꺽은선형 차트

 - 분류된 값을 비교, 시간 경과에 따른 추세

 

4. 원형 차트

  - 분류된 값이 총합 대비 몇 퍼센트를 차지하는지에 사용

 

5. 산점도

 - 두 숫자 측정값을 비교하고 둘 사이의 상관 관계를 식별할때 사용

 

6. Maps

 - 다양한 지리적 영역 또는 위치에 대한 값을 시각적으로 비교할때 사용

 

7. Power BI의 대화형 보고서

 - 관련 데이터에 대한 시각적 요소들이 자동으로 서로 연결되어 대화형 작업을 제공

 

 

댓글수0