[Coursera Google] GCC 데이터 애널리틱스 : 시각화를 통한 데이터 공유 | Tableau를 사용하여 데이터 시각화 자료 만들기

2024. 9. 24. 13:05GCC/데이터 애널리틱스

728x90
반응형

 

반응형

 

 

 

 

 

 

 

 

 

 

 

Tableau 시작하기

Tableau Public 및 기타 온라인 도구

 

Tableau의 정의와 역할

먼저 Tableau는 데이터를 보고 이해하며 의사결정을 내리는 데 도움을 주는 비즈니스 인텔리전스(BI) 및 애널리틱스 플랫폼입니다. 이는 비즈니스뿐만 아니라 비영리 단체, 교육, 정부 기관 등 다양한 분야에서 데이터를 활용하는 데 광범위하게 사용됩니다. 예를 들어, 한 지역 시장의 부동산 가격 변화를 분석하거나, 비영리 단체가 운영 효율성을 개선하는 데 도움을 줄 수 있습니다. 또 다른 흥미로운 예시는 스티브 토마스라는 Tableau 사용자에 의해 만들어진 데이터 시각화 자료로, 미국 전역의 빅풋 목격 기록을 Tableau를 사용해 시각화한 것입니다. 이 자료는 Tableau의 팬 커뮤니티와 Tableau Public에서 공유되었으며, 다양한 데이터를 창의적으로 시각화하는 사례로 소개되었습니다.

 

Tableau의 주요 특징은 사용자가 대화형 대시보드, 지도, 그래프를 생성할 수 있다는 점입니다. 이 대시보드와 시각 자료들은 코딩 지식 없이도 다양한 데이터 소스에 연결될 수 있으며, 이는 Excel, CSV 파일, Google Sheets와 같은 일반적인 데이터 형식뿐만 아니라 더 복잡한 데이터베이스에도 적용됩니다. 이러한 기능 덕분에 데이터를 쉽게 시각적으로 표현하고 이를 바탕으로 의사결정을 내리는 데 큰 도움을 줍니다. 또 Tableau에서 만든 자료는 쉽게 공유할 수 있어 팀 내 협업이나 보고에 매우 유용합니다.

 

Tableau와 다른 시각화 도구의 차이점

강의에서는 Tableau 외에도 LookerGoogle 데이터 스튜디오라는 다른 시각화 도구를 언급했습니다. 이들 도구는 원시 데이터를 시각 자료로 변환하는 면에서 Tableau와 유사하지만, 중요한 차이점도 존재합니다.

  • Tableau브라우저데스크톱 애플리케이션 두 가지 형식으로 제공됩니다. 즉, 사용자가 자신의 컴퓨터에 소프트웨어를 설치해서도 사용할 수 있으며, 웹 브라우저를 통해 접근할 수도 있습니다.
  • 반면, LookerGoogle 데이터 스튜디오는 완전히 브라우저 기반으로만 작동합니다. 이는 사용자가 브라우저만 있으면 언제 어디서나 시각 자료를 만들고 분석할 수 있다는 장점이 있지만, 데스크톱 애플리케이션을 통한 강력한 기능을 활용할 수는 없습니다.

하지만 Tableau를 통해 시각화 기초를 학습하면 이러한 다른 도구들을 사용하는 데도 큰 어려움 없이 적응할 수 있다는 점을 강조했습니다. Tableau의 시각화 논리와 데이터 처리 방식을 이해한다면 Looker나 Google 데이터 스튜디오에서도 비슷한 기능을 사용할 수 있습니다.

 

Tableau의 확장성과 활용성

Tableau는 단순히 데이터를 시각화하는 것에 그치지 않고, 실시간 데이터 분석을 가능하게 하며, 이를 통해 데이터를 더 깊이 탐구할 수 있도록 도와줍니다. 특히 비즈니스 보고서대시보드 작성 시, 데이터를 시각적으로 표현하고 중요한 트렌드나 패턴을 즉각적으로 파악할 수 있게 합니다. 이러한 특징 덕분에 Tableau는 다양한 산업에서 매우 중요한 도구로 자리잡고 있습니다.

 

다양한 예시를 통해 Tableau가 비즈니스 의사결정에서 얼마나 중요한 역할을 할 수 있는지도 설명했습니다. 예를 들어, 어떤 회사가 지난 수십 년간의 비디오 게임 판매량 데이터를 분석하고 이를 바탕으로 시장 트렌드를 예측하고자 할 때, Tableau를 통해 간단하고 명확하게 데이터를 시각화할 수 있습니다. 이를 통해 복잡한 숫자나 표를 분석하는 대신 시각적으로 한눈에 데이터를 파악할 수 있고, 이는 빠르고 효율적인 의사결정으로 이어집니다.

 

또한, Tableau Public은 사용자가 자신의 데이터를 기반으로 만든 시각화 자료를 공유할 수 있는 플랫폼입니다. 다른 사람들과 데이터를 교류하고 다양한 시각 자료를 통해 지식 공유가 가능하며, 이는 Tableau의 커뮤니티 발전에 크게 기여하고 있습니다.

 

이번 강의에서는 Tableau라는 도구가 무엇인지, 그리고 이를 통해 데이터를 시각화하고 분석하는 방법에 대해 다루었습니다. Tableau는 단순히 데이터 분석 도구에 그치지 않고, 다양한 분야에서 데이터 기반 의사결정을 돕는 매우 강력한 플랫폼입니다.

 

 


Tableau와의 만남

 

1. Tableau의 소개

Tableau는 데이터를 시각적으로 표현하는 데 탁월한 도구로, 데이터를 단순한 숫자가 아닌 사람들이 이해할 수 있는 의미 있는 스토리로 변화시켜 줍니다. Tableau에서 제공하는 시각화는 **정적(static)**이지 않고, **동적(dynamic)**이며 **대화형(interactive)**입니다. 이러한 특성 덕분에 사용자들은 데이터를 자유롭게 탐색하고 상호작용할 수 있으며, 여러분도 매우 유연하게 시각화를 제작할 수 있습니다.

2. Tableau Public 사용

이번 강의에서는 무료로 제공되는 Tableau Public을 사용합니다. 이는 웹 기반의 시각화 도구로, 사용자가 자신의 데이터와 분석 결과를 쉽게 공유하고 공개 갤러리에서 다양한 예시를 볼 수 있다는 장점이 있습니다.

Tableau Public의 첫 번째 단계는 Tableau Public 계정에 로그인하고, 강의에서 제공된 **통합문서(workbook)**를 프로필에 복사하는 것입니다. 통합문서를 활용해 데이터를 시각화하며, 이번 강의에서는 "World Happiness" 데이터를 사용합니다.

3. 시각화 작업 단계

  • 데이터 시각화 시작: 통합문서를 복사한 후, 새로운 워크시트를 만들어 국가 데이터를 세계 지도에 시각화합니다.
    1. 'Country' 필드를 'Detail'에 추가하면 지도 상에 각 국가가 나타납니다.
    2. 'Happiness Score'를 'Color'에 추가하여 국가별 행복 점수를 색상으로 표현합니다. 이를 통해 색이 짙을수록 높은 점수를 나타내도록 **색 구성표(color scheme)**를 조정할 수 있습니다.
  • 색상 조정: 기본적으로 제공되는 파란색 범위는 색각 결핍이 있는 사람에게 명확하지 않을 수 있으므로, 녹색-파란색 대비(Green-Blue Diverging) 색 구성표를 사용합니다. 이를 통해 행복 점수의 최솟값과 최댓값을 더 명확히 구분할 수 있습니다.
  • 데이터 필터링: 지도에는 3년간의 행복 데이터가 포함되어 있습니다. 이를 필터링해 특정 연도의 데이터를 선택할 수 있습니다. 예를 들어 2016년 데이터만 표시하도록 필터를 적용하는 방법을 학습했습니다.
  • 지역 확대: 지도의 특정 지역(예: 유럽)을 확대해 해당 지역만을 분석할 수 있습니다. 보기 툴바를 사용해 확대하고, 자유형 선택 도구를 활용해 원하는 국가만 선택한 후, 'Keep Only' 옵션으로 필터링된 데이터를 시각화할 수 있습니다.

4. 추가 기능과 개선

  • 국가별 데이터 레이블 추가: 행복 점수를 더욱 쉽게 전달하기 위해 'Happiness Score'를 **'Label'**에 추가하여 지도에 각 국가의 행복 점수가 나타나도록 설정합니다.
  • 필터 슬라이더 추가: 상호작용성을 높이기 위해 행복 점수 범위 필터를 추가하고, 사용자들이 특정 점수 범위의 국가들만 보도록 슬라이더 필터를 사용할 수 있게 설정합니다.

5. 시각화 자료 저장 및 공유

만든 시각화 자료를 Tableau Public 프로필에 저장할 수 있으며, 필요한 경우 공개 상태를 조정할 수도 있습니다. 눈 아이콘을 클릭하면 시각화 자료를 숨기거나 공개할 수 있습니다.

Tableau Public의 갤러리에는 전 세계의 다양한 데이터 시각화 자료가 공유되어 있으며, 사용자는 이를 참고하여 더 나은 시각화를 만들 수 있습니다. 

 

 

 


스프레드시트와 Tableau의 시각화 자료

이 읽기 자료에서는 열 차트, 선 차트, 원형 차트, 수평 막대 그래프, 영역 차트, 분산형 차트, 콤보 차트의 7가지 차트 유형을 요약하여 설명합니다. 그런 다음 스프레드시트의 시각화 자료가 Tableau의 시각화 자료와 어떻게 다른지 설명합니다.

 

스프레드시트의 기본 차트 유형

스프레드시트에서 차트는 하나 이상의 시트에 있는 데이터를 그래픽으로 표현한 것입니다. 매우 다양한 차트를 선택할 수 있지만 스프레드시트에서 무엇을 할 수 있는지 감각을 익히기 위해 가장 광범위하게 적용할 수 있는 차트에 초점을 맞출 것입니다. 다음 예시를 검토할 때 자세한 튜토리얼이 아니라 시각화 자료에 대한 개요를 제공하기 위한 것임을 염두에 두어야 합니다. 이 과정의 또 다른 읽기 자료에서 더욱 구체적으로 차트를 작성하기 위해 적용 가능한 단계와 과정을 설명할 것입니다. 애플리케이션 사용 중 언제든지 메뉴 바에서 도움말을 선택하여 자세한 내용을 볼 수 있습니다. 

  • Google Sheets에서 차트를 만들려면 데이터 셀을 선택하고 삽입을 클릭한 다음 차트를 선택합니다. 오른쪽의 대화상자에서 차트를 설정하고 맞춤설정할 수 있습니다.
  • Microsoft Excel에서 차트를 만들려면 데이터 셀을 선택하고 기본 메뉴에서 삽입을 클릭한 다음 차트 유형을 선택합니다. 팁: 필요한 경우 추천 차트를 클릭하여 선택한 데이터에 대한 Excel의 추천 목록을 확인한 다음 표시된 차트에서 원하는 차트를 선택할 수 있습니다.

 

다음은 사용 가능한 기본 차트 유형입니다.

 

열(수직 막대):열 차트를 사용하면 여러 카테고리의 데이터를 해당 값별로 표시하고 비교할 수 있습니다.

 

  • : 선 차트는 일정 기간의 데이터 추세를 보여줍니다. 마지막 선 차트 예시는 선 차트를 포함할 수 있는 콤보 차트입니다. 콤보 차트 유형에 대한 설명을 참조하세요.

 

  • 원형: 원형 차트를 사용하여 각 데이터 포인트가 전체에서 차지하는 비율을 쉽게 시각화할 수 있습니다.

 

  • 수평 막대: 수평 막대 그래프는 열 차트와 비슷하게 작동하지만 가로로 눕혀져 있습니다.

 

  • 영역: 영역 차트를 사용하면 데이터의 여러 카테고리에서 값의 변화를 추적할 수 있습니다.

 

 

  • 분산형: 일반적으로 분산형 차트는 수치 데이터의 추세를 표시하는 데 사용됩니다.
  • 콤보: 콤보 차트는 열과 선 등과 같은 여러 시각적 마커를 사용하여 하나의 시각화 자료에서 데이터의 다양한 측면을 보여줍니다. 아래 예시는 열 차트와 선 차트가 함께 있는 콤보 차트입니다.

 

기타 차트에 대한 자세한 내용은 다음에서 찾아볼 수 있습니다.

 

Tableau의 시각화 자료와 차이점

지금까지 배운 것처럼 Tableau는 데이터 애널리스트가 데이터를 표시하고 이해할 수 있도록 지원하는 애널리틱스 플랫폼입니다. 스프레드시트에서 만들 수 있는 차트 중 대부분은 Tableau에서 사용할 수 있습니다. 그러나 Tableau는 스프레드시트에서 사용할 수 없는 몇 가지 고유한 차트를 제공합니다. 다음은 Tableau에서 차트 유형을 선택하는 데 도움이 되는 유용한 가이드입니다. 

 

다음은 Tableau의 더욱 전문화된 시각화 자료입니다. 예에 대한 링크 또는 예시를 만드는 단계가 포함되어 있습니다.

 

 


Tableau에서 데이터 시각화 자료 만들기

 

1. Tableau Public에 로그인하기

  • 먼저 Tableau Public에 로그인하세요. 계정이 없다면 새로 만드세요.

2. 데이터 세트 업로드하기

  • "My Profile"로 이동하고 "Create a Viz"를 선택하여 Tableau 인터페이스를 엽니다.
  • "Connect to Data" 창에서 "Files" 탭을 선택하고 CO2 데이터 세트를 업로드하세요.

3. 데이터 소스 설정

  • 업로드한 데이터 세트에서 ‘CO2 Data Cleaned’ 시트를 선택하고, 이를 기본 영역으로 드래그 앤 드롭하세요.
  • "Update Now" 버튼을 클릭하여 데이터를 미리 봅니다.
  • Tableau가 자동으로 데이터 유형을 해석하여 아이콘으로 표시해줍니다. 예를 들어, 지구본 아이콘은 지리 데이터를 나타냅니다.

4. Sheet에서 시각화 시작하기

  • 하단의 "Sheet 1"을 클릭하여 새로운 시트로 이동합니다.
  • 왼쪽 패널에서 'Country Name' 차원을 더블클릭하여 국가별로 데이터를 표시할 수 있는 지도를 생성합니다.

5. CO2 배출량 시각화

  • 'CO2(kt)' 측정값을 더블클릭하거나 드래그하여 지도의 국가별 점 크기가 CO2 배출량에 비례하도록 조정하세요.
  • 'CO2(kt)' 측정값을 "Color"로 드래그하여 국가별 CO2 배출량에 따라 점 색상을 변경할 수 있습니다.

6. 맞춤 설정

  • 점의 색상, 크기, 라벨 등 다양한 옵션을 활용하여 시각화를 맞춤 설정하세요.
  • 예를 들어, 차트 제목을 변경하려면 제목 상자를 클릭하고 "Edit Title"을 선택하여 ‘Global CO2 Emissions’와 같은 제목을 입력할 수 있습니다.

7. 변경사항 저장

  • 작업을 완료한 후, "Save" 버튼을 클릭하여 저장하세요. 추출 생성을 요청받으면 "Create Extract"를 선택하고 다시 저장하세요.

 

 

 


Tableau에서 시각화 자료 만들기

 

좋은 것, 나쁜 것, 추한 것

 

1. 효과적인 데이터 시각화

  • 5초 규칙: 효과적인 시각화 자료는 시청자가 자료를 보고 5초 내에 핵심 메시지를 파악할 수 있어야 합니다. 이는 데이터 전달의 명확성, 간결함, 그리고 설득력 있는 구조를 강조하는 규칙입니다.
  • 분기형 색상 팔레트 사용: 분기형 색상 팔레트는 데이터 값의 크기와 범위를 색상으로 표현하는 방법입니다. 예를 들어, 녹색은 높은 값을, 빨간색은 낮은 값을 나타내며, 색의 농도로 값을 더 직관적으로 표현합니다. 이러한 팔레트는 **비즈니스 측정 지표(KPI)**와 같은 상황에서 매우 유용하게 적용됩니다.
  • 예상 가능한 색상 사용: 시각화에 사용되는 색상은 사람들이 익숙하게 인식하는 방식에 맞추는 것이 중요합니다. 대부분의 사람은 녹색을 긍정적인 의미로, 빨간색을 부정적인 의미로 받아들이므로, 이러한 색상 선택은 데이터의 해석을 용이하게 합니다.

2. 비효과적인 데이터 시각화

  • 혼란스러운 색상 선택: 예를 들어, 녹색과 주황색을 함께 사용하면 데이터 포인트를 구분하기 어려워집니다. 이러한 색상 선택은 데이터 간의 차이를 명확하게 보여주지 못하고, 시각적으로 혼란스러워서 데이터 해석을 방해합니다.
  • 과도한 라벨 사용: 너무 많은 라벨을 추가하면 시각화 자료가 복잡해져 시청자가 데이터를 이해하는 데 어려움을 겪을 수 있습니다. 특히, 라벨이 서로 겹치거나 서로 다른 글꼴을 사용하면 자료의 가독성이 크게 떨어집니다.
  • 복잡한 디자인: 지나치게 많은 정보가 담기거나 불필요한 시각적 요소가 추가된 시각화 자료는 데이터를 오히려 혼란스럽게 만들 수 있습니다. 이를 피하고 데이터의 핵심만을 강조해야 효과적인 시각화가 가능합니다.

3. 결론

데이터 시각화는 단순히 보기 좋은 것뿐만 아니라 명확하고 쉽게 해석 가능해야 합니다. 이를 위해 색상, 라벨, 그리고 디자인의 간결함을 유지하며 데이터의 스토리를 명확히 전달하는 것이 중요합니다. 대화형 시각화 자료도 이러한 원칙을 따르는 것이 필수입니다.

 

 


창의성 발휘하기

 

 

  • 창의적 접근: 데이터 시각화는 크레용으로 색칠하는 것과 같이 창의적인 표현을 가능하게 합니다. 특히 색각 결핍이 있는 사람들을 고려하여 차트를 설계하는 것이 중요합니다.
  • Tableau 사용:
    • Google Career Certificates 페이지에서 제공하는 'World Happiness' 데이터를 사용하여 국가의 행복 점수에 기여하는 요소를 분석합니다.
    • 새 워크시트를 생성하고, 2016년 데이터를 필터링하여 분석 시작.
  • 시각화 작업 흐름:
    • 행복 점수를 'Rows' 섹션에 추가하고, **경제(GDP per Capita)**를 'Column' 섹션에 추가하여 각 국가의 데이터 포인트를 생성합니다.
    • 이 데이터를 통해 경제 점수가 높을수록 행복 점수도 높다는 점을 시각적으로 확인합니다.
    • 추세선을 추가하여 이 관계를 더욱 명확하게 표현합니다.
  • 시트 복제 및 측정값 변경:
    • 'Economy' 점수를 'Family'와 같은 다른 측정값으로 교체하는 방식으로 시트를 복제하여 데이터를 더 깊이 분석합니다.
    • 시트 이름을 적절히 변경하여 쉽게 찾아볼 수 있도록 합니다.
  • 대시보드 구성:
    • 여러 시각화 자료를 단일 대시보드에 배열하여 서로 간의 관계를 쉽게 비교합니다.
    • 각 차트의 목적을 명확히 하고, 보조 표를 추가하여 고객이 데이터에 접근할 수 있는 다양한 방법을 제공합니다.
  • 다양한 데이터 소스:
    • 시각화 작업을 통해 단일 데이터 소스뿐만 아니라 여러 데이터 세트를 동시에 다루는 방법을 배울 수 있습니다.

 

 


선택사항: 여러 데이터 소스 작업

 

Tableau에서 데이터 연결하기

 

 

  • 활동 준비:
    • 사용하기 위해 데이터 세트 4개를 다운로드합니다. Google 계정이 없을 경우, 첨부파일에서 데이터 세트를 직접 다운로드할 수 있습니다.
    • 이 데이터는 2000년부터 2011년까지 각 국가의 1인당 CO2 배출량, 인구, GDP, 에너지 사용 정보를 포함합니다.
  • Tableau Public 로그인:
    • Tableau Public에 로그인하고 'Create a Viz'를 선택하여 Tableau 인터페이스를 엽니다.
  • 데이터 세트 업로드:
    • ‘Connect to Data’ 창에서 ‘Files’ 탭을 클릭하고 CO2 데이터 세트를 업로드합니다.
    • 이어서 에너지 데이터, GDP 데이터, 총 인구 데이터를 추가하여 총 4개의 데이터 세트를 Tableau에 로드합니다.
  • 조인 설정:
    • 데이터 세트를 연결하기 위해 INNER JOIN과 OUTER JOIN을 사용합니다.
    • CO2 데이터와 에너지 데이터, GDP 데이터, 총 인구 데이터를 차례로 조인합니다.
    • 각 조인을 설정할 때는 관련된 열을 기준으로 조인을 설정하며, 데이터 유형이 일치하도록 조정합니다.
  • 데이터 세트 검토 및 수정:
    • CO2 데이터 세트는 19602011년의 데이터를 포함하고, 나머지 데이터는 20002015년의 데이터를 포함하므로, 공통 교차 연도는 2000~2011년입니다.
    • 데이터 유형을 변경하여 분석에 필요한 형식으로 조정합니다.
  • 시각화 자료 만들기:
    • ‘Sheet1’ 탭을 선택하고, ‘Country Name’을 ‘Detail’로 드래그하여 각 국가의 세부 정보를 표시합니다.
    • ‘CO2 Per Capita’를 ‘Color’로 드래그하여 배출량에 따라 색을 표현합니다. 색상 팔레트를 조정하여 시각적으로 효과적인 표현을 만듭니다.
    • ‘Year’를 ‘Filters’ 영역에 드래그하여 원하는 연도를 선택할 수 있도록 설정합니다.
  • 프로젝트 저장:
    • 진행 상황을 저장하고, 필요한 경우 데이터 추출을 생성합니다.
  • 마무리:
    • 데이터를 연결하고 시각화 자료를 만드는 과정을 통해 복잡한 분석을 수행하고 유용한 정보를 공유할 수 있음을 강조합니다.

 

 

 


여러 데이터 소스를 결합하기 위한 Tableau 리소스

Tableau에서 데이터를 다룬 경험이 어느 정도 있으므로 이제 여러 데이터 소스를 결합하는 등 더 많은 작업을 시작할 준비가 되었습니다. 이 읽기 자료는 이에 대한 몇 가지 안내 가이드와 Tableau를 직접 사용하여 실습할 때 사용할 수 있는 기타 유용한 리소스를 제공합니다. 

리소스설명 
데이터 소스 설정 이 페이지는 데이터 소스를 Tableau 계정에 연결한 후 분석하기 위해 준비하는 방법을 설명하는 데이터 소스 설정으로 연결됩니다. 특히 데이터를 조인하거나 혼합하는 방법과 합집합이 무엇인지 어떻게 작동하는지 설명하는 도움말이 포함되어 있습니다. 이 자료는 데이터 소스를 사용하고 결합할 준비를 시작하기에 좋은 출발점입니다. 
데이터 조인 조인이란 공통 필드를 기반으로 데이터 소스를 결합하는 프로세스를 말합니다. 이 도움말에서는 다양한 조인, Tableau에서 조인을 사용하는 방법, 단계별 안내가 포함된 조인의 예시를 자세히 설명합니다. 
관계에 대한 두려움 극복 관계를 통해 Tableau에서 여러 데이터 소스를 결합할 수 있습니다. 조인의 유연한 대안인 관계를 사용하면 여러 데이터 소스를 하나의 단일 표로 만들지 않아도 됩니다. 이 도움말에서는 관계가 작동하는 방식에 대해 더 유용한 정보를 제공합니다. 
관계가 조인과 다른 점 이 도움말에서는 관계와 조인 사용의 차이점을 자세히 설명하고 관계를 사용하여 데이터를 결합하는 프로세스를 안내합니다. 
데이터 혼합 데이터 혼합은 여러 데이터 소스를 결합하는 데 사용할 수 있는 또 다른 방법입니다. 혼합을 사용하면 데이터를 실제로 결합하는 대신 여러 소스에서 데이터를 쿼리하고 합산할 수 있습니다. 이 리소스에는 혼합에 대한 자세한 내용이 포함되어 있으며 튜토리얼이 포함되어 있습니다. 
여러 날짜 필드 결합 이 리소스에서는 Tableau에서 네 가지 다른 데이터 조합 방법을 사용할 때 날짜 필드를 결합하는 방법을 설명하는 예시를 제공합니다. 

이외에도 참고할 다양한 리소스가 있습니다. 온라인이나Tableau 커뮤니티 포럼에서 자세한 정보를 참고할 수 있습니다.

 

 

728x90

 

728x90
반응형