[Coursera Google] GCC 데이터 애널리틱스 : 데이터 기반 의사결정을 위한 질문 / 데이터 기반 의사결정

2024. 7. 26. 22:37GCC/데이터 애널리틱스

728x90
반응형

 

728x90

 

 

 

 

 

 

 

 

데이터 기반 의사결정

 

효과적인 의사결정을 위한 데이터 활용

 

데이터와 의사결정의 관계

우리는 데이터가 사실 정보의 모음이라는 것을 알고 있으며, 데이터 분석을 통해 중요한 패턴과 유용한 정보를 밝혀낼 수 있습니다. 이러한 과정은 정보 기반의 의사결정에 도움을 줍니다. 이제 데이터를 의사결정 과정에서 어떻게 활용하는지, 그리고 데이터 기반 의사결정과 데이터 직관형 의사결정의 차이점을 살펴보겠습니다.

 

데이터 기반 의사결정과 데이터 직관형 의사결정

  1. 데이터 기반 의사결정(Data-Driven Decision-Making):
    • 정의: 데이터를 수집, 분석하여 객관적인 사실을 기반으로 결정을 내리는 방식입니다.
    • 사례: 식당을 선택할 때 '우리 동네 맛집'을 검색하고 평점 순으로 정렬하여 가장 평점이 높은 식당을 선택하는 것이 데이터 기반 의사결정의 예입니다.
    • 특징: 데이터를 통해 추론을 하여 결정의 신뢰성을 높입니다. 주로 정량적 데이터를 활용합니다.
  2. 데이터 직관형 의사결정(Data-Informed Decision-Making):
    • 정의: 데이터에 기반하되, 데이터뿐 아니라 직관과 경험을 함께 고려하여 결정을 내리는 방식입니다.
    • 사례: Google이 데이터 센터 냉각 에너지 소모량을 줄이기 위해 AI를 사용하여 데이터를 분석한 결과, 40%의 에너지 절감을 이룬 것처럼 다양한 데이터 소스를 살펴보고 데이터 간의 공통점을 찾아 결정을 내리는 방식입니다.
    • 특징: 데이터 분석 결과를 참고하되, 최종 결정에는 경험과 직관도 반영합니다.

 

데이터의 역할

데이터는 어디에나 있으며, 방대한 양의 데이터가 매일 생성되고 있습니다. 이 데이터를 통해 문제를 해결하고 강력한 해결책을 마련할 수 있습니다. 하지만 데이터 수집은 문제 해결 과정의 일부에 불과합니다. 데이터를 지식으로 변환하여 실질적인 가치를 창출해야 합니다.

 

데이터에서 정보로, 정보에서 지식으로

  1. 데이터(Data):
    • 정의: 정확한 사실 정보나 설명 값을 한데 모은 것. 개별 데이터 포인트는 종합하고 구조화해야 유용성이 높아집니다.
    • 사례: 마이클 펠프스의 200미터 수영 기록 1분 54초.
  2. 정보(Information):
    • 정의: 데이터를 해석하고 맥락을 부여하여 의미를 찾은 것.
    • 사례: 펠프스의 기록을 경쟁자들의 기록과 비교하여 금메달을 딴 사실을 알게 되는 것.
  3. 지식(Knowledge):
    • 정의: 정보를 이해하고 응용하여 유용한 결론을 도출한 것.
    • 사례: 펠프스는 빠른 수영 선수라는 결론을 도출하는 것.

데이터 분석의 한계

데이터 애널리틱스에는 한계가 있습니다. 필요한 데이터 중 일부에만 접근할 수 있는 경우가 있으며, 프로그램마다 데이터가 다르게 측정되어 확실한 사례를 찾기 어려울 수도 있습니다. 이러한 한계를 인식하고 문제를 해결하는 데 유연하게 대처하는 것이 중요합니다.

 

데이터의 종류와 활용 방법

이제 다양한 데이터 유형과 이를 비즈니스 의사결정에 활용하는 방법에 대해 알아보겠습니다. 시각화에 대해 알아보고, 측정항목과 측정값을 분석에 이용하는 방법도 살펴보겠습니다. 데이터의 유용성을 최대한 활용하여 효과적인 의사결정을 내리는 방법을 배우는 것이 목표입니다.

 

 


정성적 데이터와 정량적 데이터

 

정량적 데이터와 정성적 데이터의 차이

데이터는 크게 두 종류로 나뉩니다: 정량적 데이터와 정성적 데이터. 이 두 가지 데이터 유형은 서로 보완적인 역할을 하며, 다양한 질문에 대한 답을 제공할 수 있습니다.

 

정량적 데이터 (Quantitative Data)

  • 정의: 숫자로 된 사실 정보를 측정한 구체적이고 객관적인 데이터.
  • 특징: 측정 가능하며, 객관적인 분석이 가능합니다. 문제의 빈도와 강도를 알려줍니다.
  • 예시: 매일 기차를 타고 출근하는 승객 수, 고객의 평균 평점, 리뷰에 언급된 특정 키워드의 빈도.
  • 분석 도구: 차트, 그래프 등을 사용해 시각적으로 표현.

정성적 데이터 (Qualitative Data)

  • 정의: 숫자로는 측정할 수 없는 품질과 특성 같은 것을 나타내는 주관적이거나 설명적인 데이터.
  • 특징: 이유를 밝히는 질문에 답하며, 맥락 정보를 제공합니다.
  • 예시: 고객이 특정 제품을 좋아하거나 싫어하는 이유, 리뷰에 언급된 감정적인 표현.
  • 분석 도구: 텍스트 분석, 주제 분석 등으로 데이터의 의미를 파악.

 

데이터 분석 사례

아이스크림 가게의 사례

  1. 문제 인식:
    • 온라인 리뷰에서 평점 하락과 부정적인 리뷰의 증가를 확인.
  2. 정량적 데이터 분석:
    • 질문: 부정적인 리뷰는 몇 건인가? 평균 평점은 얼마인가? 동일한 키워드가 나오는 리뷰는 몇 건인가?
    • 결과: 부정적인 리뷰 17건에서 '실망'이라는 단어가 반복적으로 등장.
  3. 정성적 데이터 분석:
    • 질문: 고객이 만족하지 못하는 이유는 무엇인가? 고객 경험을 개선할 방법은 무엇인가?
    • 결과: 고객들이 실망한 이유가 영업시간이 끝나기 전에 인기 아이스크림이 매진되기 때문임을 발견.
  4. 조치:
    • 일주일치 주문량을 변경하여 고객들이 좋아하는 아이스크림을 충분히 확보.

 

데이터 활용 방법

  1. 정량적 데이터의 활용: 숫자로 표현되는 데이터를 분석하여 문제의 빈도와 강도를 파악.
  2. 정성적 데이터의 활용: 텍스트나 주관적인 데이터를 분석하여 문제의 이유와 맥락을 파악.
  3. 두 가지 데이터의 결합: 정량적 데이터로 문제를 확인하고, 정성적 데이터로 그 이유를 분석하여 효과적인 해결책을 도출.

 

데이터 애널리스트의 역할

데이터 애널리스트는 다양한 질문을 통해 다양한 유형의 데이터를 수집하고, 이를 분석하여 효과적인 해결책을 도출하는 역할을 합니다. 이를 위해 창의적이고 직관적인 방법으로 데이터를 이해관계자에게 전달하는 것이 중요합니다. 예를 들면, 대화형 대시보드나 시각화를 활용하여 데이터를 쉽게 이해할 수 있도록 합니다.

 

 


 

비즈니스에서의 정성적 데이터와 정량적 데이터

이 읽기 자료에서는 정성적 데이터와 정량적 데이터의 의미를 자세히 설명합니다.

앞서 배웠듯이 데이터에는 정성적 데이터와 정량적 데이터의 두 가지 유형이 있습니다. 

 

정성적 데이터 도구 정량적 데이터 도구
  • 표적 집단
  • 소셜 미디어 텍스트 분석
  • 대면 인터뷰
  • 구조적 인터뷰
  • 설문조사
  • 투표

데이터 유형과 데이터 수집 도구에 관해 더 자세히 살펴보겠습니다. 여러분이 프랜차이즈 영화관의 데이터 애널리스트라고 생각해보세요. 매니저가 다음 항목의 추세를 파악해달라고 요청합니다.

  • 시간 경과에 따른 영화 관객 수
  • 영화관 매점의 수익성
  • 저녁 관객의 선호도 

이 시나리오에서는 세 가지 추세를 모두 모니터링하기 위한 정량적 데이터가 이미 존재한다고 가정합니다. 

 

시간 경과에 따른 영화 관객 수

여러분은 먼저 영화관의 고객 멤버십 보상 프로그램을 통해 축적된 과거 데이터를 확인한 후 이 데이터에서 얻을 수 있는 유용한 정보가 무엇인지 조사합니다. 지난 3개월간의 관객 수를 살펴봅니다. 그런데 지난 3개월 동안에는 공휴일이 없었기 때문에 일 년 치 데이터를 살펴보는 것이 낫겠다고 결정합니다. 추측한 대로, 정량적 데이터에 따르면 한 달 평균 관객 수는 550명이지만 공휴일이 있는 달에는 평균 관객 수가 1,600명으로 증가했습니다. 

과거 데이터를 통해 프로젝트에 필요한 정보를 확인했지만, 몇 달 후 저녁 시간대 티켓 가격이 인상되면 다시 분석하기로 합니다. 

 

영화관 매점의 수익성

이익은 매출액에서 비용을 빼서 계산합니다. 과거 데이터에 따르면 매점은 수익성이 있었지만 이익률은 5% 미만으로 아주 적었습니다. 평균 구매액은 총 20달러 이하였습니다. 이를 지속적으로 모니터링하기로 합니다. 

여러분은 데이터 애널리스트로서 데이터 수집 도구에 대해 잘 알고 있기 때문에 매점 음식에 관한 온라인 고객 설문조사를 제안합니다. 온라인 설문조사를 통해 더 많은 정량적 데이터를 수집하여 메뉴를 개편하고 이익을 증대할 수 있습니다. 

 

저녁 관객의 선호도

과거 데이터 분석에 따르면 관객 수가 가장 많은 최고 인기 시간대는 오후 7시 30분이었고, 오후 7시 15분과 오후 9시 상영이 그 뒤를 이었습니다. 여러분은 현재 관객 수가 적은 오후 8시 상영시간을 오후 8시 30분으로 변경하자고 제안하고 싶습니다. 그러나 사람들이 더 늦은 상영시간에 영화를 볼 가능성이 높다는 직감을 뒷받침하려면 더 많은 데이터가 필요합니다.

저녁 영화 관객은 영화관의 가장 큰 수입원입니다. 따라서 유용한 정보를 더 많이 얻기 위해 온라인 설문조사에도 질문을 포함하기로 했습니다. 

 

세 가지 추세의 정성적 데이터와 티켓 가격

여러분은 몇 달 후 저녁 시간대 티켓 가격이 인상된다는 사실을 알고 있으므로, 설문조사에 고객들의 가격 민감도를 알아보기 위한 질문도 포함할 것입니다. 

 

최종 온라인 설문조사에는 정성적 데이터를 얻기 위해 다음과 같은 질문을 포함할 수 있습니다.

  1. 오늘 이 영화관에서 영화를 보기로 한 이유는 무엇인가요? (영화 관객)
  2. 영화관 매점에서 구매한 상품의 품질과 가치에 관해 어떻게 생각하나요? (영화관 매점 수익성)
  3. 오후 8시와 오후 8시 25분 중 선호하는 상영시간은 언제이며, 선호하는 이유는 무엇인가요? (저녁 관객의 선호도)
  4. 어떤 경우에 야간 상영보다 주간 상영을 선택할 것 같나요? (티켓 가격 인상)

 

요약

데이터 애널리스트는 주로 두 가지 유형의 데이터를 모두 작업에 사용합니다. 일반적으로 정성적 데이터는 이유 또는 보다 자세한 설명을 알려주기 때문에 정량적 데이터를 이해하는 데 도움이 됩니다. 즉, 정량적 데이터는 보통 대상을 알려주고 정성적 데이터는 이유를 알려줍니다. 정량적 데이터와 정성적 데이터를 모두 사용하면 사람들이 영화를 보고 싶어 하는 시간과 해당 영화관을 선택한 이유를 알 수 있습니다. 고객들이 영화관의 리클라이너 의자를 매우 좋아한다면 매니저는 리클라이너 의자를 더 많이 구매하면 됩니다. 해당 영화관에서만 루트 비어 음료를 팔거나 인기 있는 식당에서 영화관으로 운전해서 오는 시간으로 인해 늦은 상영시간을 선호할 수도 있습니다. 자녀가 있거나 돈을 절약하고 싶어서 낮에 영화를 보러 갈 수도 있습니다. 이러한 정보는 관객, 이익, 상영시간에 관한 정량적 데이터만 분석해서는 알아낼 수 없습니다.

 

 


 

중요한 발견: 결과 공유

 

데이터 시각화 도구: 보고서와 대시보드

데이터가 유용하다는 것은 잘 알려져 있지만, 데이터를 제대로 전달하지 못하면 그 가치는 제한적일 수 있습니다. 데이터를 효과적으로 전달하기 위해 다양한 데이터 시각화 도구를 활용할 수 있습니다. 여기서는 보고서와 대시보드를 중심으로 살펴보겠습니다.

 

보고서 (Reports)

  • 정의: 특정 시점의 과거 데이터를 요약한 정적 데이터 모음.
  • 장점:
    • 정기적 업데이트: 원하는 형식으로 정기적으로 제공할 수 있습니다.
    • 정리된 정보: 정리와 정렬이 완료된 깔끔한 데이터를 제공.
    • 사용 용이성: 형식을 쉽게 바꿀 수 있고 사용하기 쉽습니다.
  • 단점:
    • 정기적 관리 필요: 계속 업데이트해야 합니다.
    • 실시간 데이터 부족: 실시간 데이터를 반영하지 못합니다.
    • 시각적 매력 부족: 자동화되지 않고 시각적으로 매력적이지 않을 수 있습니다.

 

대시보드 (Dashboards)

  • 정의: 실시간으로 데이터를 모니터링하고 시각화하는 도구.
  • 장점:
    • 실시간 정보 접근: 최신 정보를 실시간으로 확인할 수 있습니다.
    • 데이터 조정 가능: 필터를 적용하여 데이터를 조정할 수 있습니다.
    • 장기적 가치: 지속적으로 정보에 접근 가능하여 효율적입니다.
    • 시각적 매력: 다양한 시각적 요소를 포함하여 보기 좋습니다.
  • 단점:
    • 설계 시간 소요: 설계하는 데 시간이 걸립니다.
    • 유지보수 필요: 형식이 망가지면 복구와 유지보수가 필요합니다.
    • 정보 과부하 위험: 정보가 너무 많아 부담스러울 수 있습니다.

사례 비교: 보고서와 대시보드의 활용

예시 1: 소셜 미디어 활동 모니터링

  • 보고서:
    • 용도: 특정 시점에 계정의 신규 팔로워 수와 같은 데이터를 제공.
    • 장점: 과거 데이터를 요약하여 정기적으로 제공.
    • 단점: 실시간 업데이트가 불가능.
  • 대시보드:
    • 용도: 여러 플랫폼의 소셜 미디어 활동을 실시간으로 모니터링.
    • 장점: 실시간 정보와 데이터 필터링 기능 제공.
    • 단점: 설계와 유지보수에 시간과 노력이 필요.

 

스프레드시트로 데이터 시각화

스프레드시트를 활용한 데이터 시각화 방법을 간단히 살펴보겠습니다. 한 도매 회사의 주문 정보를 담은 데이터 세트를 가지고 예시를 들어보겠습니다.

  1. 데이터 준비:
    • 주문 날짜, 영업 사원, 단가, 매출 등의 다양한 기록이 포함된 데이터.
  2. 피벗 테이블 생성:
    • 단계: 'Data' 메뉴에서 'Pivot table' 버튼 클릭 -> 'Create' 클릭 -> 새 워크시트 생성.
    • 필드 선택: 'Salesperson'과 'Revenue' 선택.
    • 결과: 영업 사원별 매출을 요약한 피벗 테이블 생성.
  3. 그래프 생성:
    • 단계: 피벗 테이블 데이터를 기반으로 그래프 생성.
    • 결과: 정량적 데이터를 시각적으로 쉽게 이해할 수 있는 그래프 완성.

 

대시보드 활용

대시보드는 실시간 데이터를 제공하며, 다양한 관점에서 데이터를 분석하고 시각화할 수 있습니다. 예를 들어, Tableau 대시보드를 사용하면 다음과 같은 기능을 활용할 수 있습니다:

  • 대화형 그래프: 사용자가 직접 데이터를 필터링하고 조작할 수 있는 대화형 그래프 제공.
  • 실시간 업데이트: 최신 데이터를 실시간으로 반영.
  • 사용자 친화성: 클릭 몇 번으로 데이터를 다양한 방식으로 탐색 가능.

 

보고서와 대시보드는 각각의 장단점을 가지고 있으며, 특정 상황에 맞는 도구를 선택하는 것이 중요합니다. 이해관계자에게 효과적으로 데이터를 전달하기 위해 보고서와 대시보드를 적절히 활용하는 방법을 익히는 것이 데이터 애널리스트로서의 중요한 역할입니다. 앞으로 데이터 시각화 도구를 직접 다루면서 더 많은 경험을 쌓게 될 것입니다.

 

 


데이터와 측정항목 비교

 

데이터 분석에서 측정항목은 중요한 개념입니다. 측정항목은 원시 데이터를 유용한 정보로 전환할 수 있도록 도와주는 도구로, 구체적이고 정량적인 분석을 가능하게 합니다. 아래에서는 데이터와 측정항목의 차이점 및 측정항목을 활용하여 데이터를 유용한 정보로 바꾸는 방법을 설명하겠습니다.

 

데이터와 측정항목의 차이점

데이터

  • 정의: 처리되지 않은 원시 정보의 모음.
  • 특징: 다루기 어렵고, 단독으로는 의미가 모호함.
  • 예시: 영업 사원의 매출 기록, 고객의 구매 이력 등.

측정항목

  • 정의: 정량화하여 측정에 사용할 수 있는 단일 데이터 유형.
  • 특징: 데이터를 구조화하고 의미를 부여하여 분석 가능하게 만듦.
  • 예시: 영업 사원의 매출액, ROI, 고객 유지율 등.

 

측정항목을 활용하여 데이터를 유용한 정보로 바꾸는 방법

1. 측정항목 선택

  • 적절한 측정항목 선택: 원하는 정보를 도출하기 위해 필요한 측정항목을 선택합니다. 예를 들어, 영업 사원별 매출액을 알고 싶다면 매출액을 측정항목으로 선택합니다.

2. 측정항목 조합 및 수식 사용

  • 수식을 통한 계산: 여러 측정항목을 조합하여 수식을 만듭니다. 예를 들어, 매출액은 판매량과 판매 가격의 곱으로 계산할 수 있습니다.
  • 예시: ROI 계산
    • 측정항목: 순수익(Net Profit), 투자 비용(Investment Cost)
    • 수식: ROI = (순수익 / 투자 비용) * 100

3. 다양한 산업에서의 측정항목 활용 사례

  • 투자 분석: ROI를 통해 투자 실적을 평가하고, 미래 투자 전략을 수립.
  • 마케팅: 고객 유지율을 측정하여 마케팅 전략의 효과를 평가.

4. 측정 가능한 목표 설정

  • 목표 설정 및 평가: 회사는 측정 가능한 목표를 설정하고 이를 평가하기 위해 측정항목을 사용합니다. 예를 들어, 월간 매출액 목표나 재구매 비율 목표를 설정할 수 있습니다.

예시: 영업 사원별 매출액 분석

  1. 데이터 준비: 각 영업 사원의 매출 기록을 수집합니다.
  2. 측정항목 선택: 영업 사원의 매출액을 측정항목으로 선택.
  3. 피벗 테이블 생성: 영업 사원별 매출액을 계산하여 피벗 테이블로 요약.
  4. 결과 분석: 누가 최고 매출을 달성했는지 파악하여 성과 평가.

 

측정항목을 통해 원시 데이터를 정량화하고, 이를 기반으로 의미 있는 정보를 도출할 수 있습니다. 측정항목을 적절히 선택하고, 이를 조합하여 수식을 활용함으로써 데이터를 유용한 정보로 바꿀 수 있습니다. 이를 통해 데이터의 의미를 파악하고, 분석 결과를 효과적으로 활용할 수 있습니다. 

 

 


매력적인 대시보드 구성

대시보드의 이점

대시보드는 데이터 스토리를 전달하는 데 도움이 되는 강력한 시각적 도구입니다. 대시보드는 여러 데이터 세트의 정보를 한 곳에 정리하므로 시간을 절약해줍니다. 데이터 애널리스트는 질문에 답하고 문제를 해결하기 위해 대시보드를 사용하여 데이터를 추적, 분석, 시각화합니다. 대시보드 구성에 관한 기본적인 내용은 비즈니스 인텔리전스 대시보드의 6가지 실례 기사를 참고하세요. 이후 강좌에서 대시보드 생성 도구인 Tableau를 살펴봅니다.

 

다음 표에는 데이터 애널리스트와 이해관계자가 대시보드를 사용하여 얻을 수 있는 이점이 요약되어 있습니다.

 

이점데이터 애널리스트이해관계자
중앙 집중화 모든 이해관계자와 하나의 데이터 소스 공유 데이터, 이니셔티브, 목표, 프로젝트, 프로세스 등을 종합적으로 파악하여 작업
시각화 들어오는 데이터 실시간 표시 및 업데이트* 빠르게 추세 및 패턴 변화 파악
유용한 정보 획득 다양한 데이터 세트에서 관련 정보 확보 목표를 벗어나지 않고 데이터에 기반한 결정을 내리도록 숫자 뒤에 숨겨진 의미 파악
맞춤설정 특정 사용자, 프로젝트, 데이터 프레젠테이션 전용 맞춤 뷰를 생성할 수 있음 관심이 있거나 우려되는 특정 분야를 더 상세히 분석

*변경된 데이터는 데이터 구조가 같은 경우에만 자동으로 대시보드에 반영됨을 참고하세요. 데이터 구조가 변경되면 대시보드 구성을 업데이트해야 데이터를 실시간으로 업데이트할 수 있습니다.

 

대시보드 만들기

대시보드를 생성하는 과정은 다음과 같습니다.

 

1. 데이터를 확인해야 하는 이해관계자와 이해관계자의 데이터 사용 방식 파악

이를 위해서는 효과적으로 질문해야 합니다. Requirements Gathering Worksheet에서 관련 이해관계자와 이해관계자의 데이터 요구사항을 파악하는 데 사용할 수 있는 다양하고 좋은 질문을 확인해보세요. 요구사항을 파악하는 과정을 반복하는 데 도움이 되는 훌륭한 리소스입니다.

 

2. 대시보드 구성(표시해야 할 항목)

다음 팁을 참고하여 대시보드를 명확하고, 이해하기 쉽고, 간단하게 구성하세요.

  • 명확한 헤더를 사용하여 정보에 라벨 지정
  • 각 시각화 요소에 짧은 텍스트 설명 추가
  • 가장 중요한 정보를 상단에 표시

3. 시안 만들기(선택사항)

선택사항이지만, 많은 데이터 애널리스트가 대시보드를 만들기 전에 대략적으로 틀을 구성합니다. 

 

4. 대시보드에서 사용할 시각화 요소 선택

선택할 수 있는 시각화 요소는 다양하며, 어떤 시각화를 선택할지는 전달하고자 하는 데이터 스토리에 따라 달라집니다. 시간 경과에 따른 값의 변화를 표시해야 하는 경우 선 차트나 막대 그래프가 가장 좋은 선택지일 수 있습니다. 보고할 전체 양에서 각 부분이 차지하는 비율을 보여주고자 한다면 원형 차트나 도넛 차트가 적합합니다.

적합한 시각화 요소를 선택하는 방법에 관해 자세히 알아보려면 Looker의 designing great dashboards라는 단기 강좌를 확인해보세요. 가입만 하면 전체 강의를 무료로 이용할 수 있습니다. Tableau의 갤러리를 방문하는 방법도 있습니다.

  • 더 많은 영역 차트, 열 차트, 기타 시각화 요소의 샘플을 확인하려면 Tableau의 비주얼리제이션 갤러리 를 방문하세요. 여기에서 실제 데이터를 사용하여 만든 여러 가지 멋진 샘플을 확인할 수 있습니다. 아이디어가 필요하다면 갤러리를 살펴보세요.
  • 커뮤니티에서 선별한 시각화 자료를 보고 싶다면 Tableau의 오늘의 비주얼리제이션 을 살펴보세요. 여기에서 Tableau 사용자들이 만든 시각화 자료를 살펴볼 수 있습니다. 다른 데이터 애널리스트들이 데이터 시각화 도구를 사용하는 방법을 자세히 알아보세요. 

5. 필요에 따른 필터 생성

필터를 사용하면 대시보드에서 특정 데이터만 표시하고 나머지 데이터는 숨길 수 있습니다. 이렇게 하면 원본 데이터를 그대로 유지하면서 패턴을 파악하기가 매우 쉽습니다. 데이터 애널리스트들은 일반적으로 동일한 대시보드를 사용하고 공유하지만, 각자 담당하는 부분은 필터를 사용해 관리합니다. 필터에 관한 자세한 내용과 필터 동작 예시는 Tableau의 필터 동작 페이지를 참고하세요. 이 페이지를 저장해 두었다가 Tableau에서 필터를 사용할 때 참고하세요.

 

대시보드는 비즈니스 여정의 일부

이해관계자에게 대시보드는 조종사에게 항로를 보여주는 항공기 계기판과 같습니다. 대시보드는 이해관계자가 데이터를 헤치고 프로젝트가 나아가야 할 길을 파악하는 데 도움이 됩니다. 데이터 애널리스트가 대시보드에 명확한 마커를 추가하고 중요한 부분을 강조표시하면 사용자는 데이터 스토리의 방향을 이해할 수 있습니다. 데이터 애널리스트와 이해관계자는 이를 바탕으로 협력하면서 비즈니스 목표를 달성할 수 있습니다.

 

 


수학적 사고

 

수학적 사고란 무엇인가?

  • 정의: 문제를 논리적이고 단계적으로 분석하는 사고방식.
  • 목적: 데이터 패턴 간의 관계를 찾아내고, 이를 통해 문제를 파악하고 해결책을 도출하는 것.
  • 필요성: 수학적 사고는 다양한 각도에서 문제를 살펴보고 가장 논리적인 접근법을 선택하게 도와줍니다.

데이터의 크기와 분석 도구

  • 스몰데이터:
    • 특징: 크기가 작고, 보통 짧은 기간 동안 수집된 구체적인 데이터.
    • 예시: 하루 수분 섭취량.
    • 분석 도구: 스프레드시트.
  • 빅데이터:
    • 특징: 대규모, 장기간의 데이터 세트.
    • 예시: 병원의 환자 데이터.
    • 분석 도구: SQL (Structured Query Language).

 

수학적 사고의 적용: 병원 병상 가동률 최적화 사례

  1. 문제 정의:
    • 병상 가동률이 기준을 초과하거나 미달하는 문제.
  2. 목표 설정:
    • 병상 가동률 최적화.
  3. 측정항목 선택:
    • 사용 가능한 병상 수.
    • 사용된 병상 수.
    • 병상 점유율(Bed Occupancy Rate) 계산: 병상 점유율 = (총 입원 일수 / 사용 가능한 총 병상 수) * 100.
  4. 도구 선택:
    • 빅데이터 세트를 처리하기 위해 SQL 사용.
  5. 패턴 분석:
    • 데이터 분석을 통해 미사용 병상이 항상 존재함을 발견.
  6. 결론 도출 및 의사결정:
    • 병상 수를 줄이고 절약된 공간과 비용으로 보호 장비를 구매 및 보관.

 

수학적 사고의 장점

  • 문제의 세분화: 문제를 단계별로 나누어 각각의 부분을 논리적으로 분석.
  • 데이터 패턴의 발견: 데이터 내의 패턴을 찾아내어 문제 해결의 단서를 제공.
  • 효율적 의사결정: 새로운 관점에서 문제를 해결하고 최적의 결정을 내림.

 

수학적 사고는 데이터 분석의 중요한 도구입니다. 논리적이고 체계적으로 문제를 분석하고 해결하는 능력은 데이터 애널리스트에게 필수적입니다. 다음 시간에는 스프레드시트의 기초를 소개하고, 실습을 통해 배운 내용을 적용해 보겠습니다. 새로운 도구들을 배우면서 데이터 분석 과정을 더욱 깊이 이해할 수 있을 것입니다.

 

 

 


빅데이터와 스몰데이터

데이터 애널리스트로서 여러분은 빅데이터와 스몰데이터를 모두 사용해 작업하게 됩니다. 두 종류의 데이터 모두 가치가 있지만, 각자 역할이 매우 다릅니다. 

 

 

두 가지 데이터 모두 비즈니스 절차를 개선하고, 질문에 답하고, 새로운 제품을 만드는 등 이해관계자의 작업을 돕는 데 사용할 수 있습니다. 그러나 빅데이터에는 이점과 동시에 해결해야 할 과제도 있습니다. 다음 표에서 빅데이터와 스몰데이터의 차이점을 살펴보세요.

 

스몰데이터 빅데이터
정해진 단기간의 구체적인 측정항목으로 이루어진 데이터 세트를 설명함 장기간의 대략적인 대규모 데이터 세트를 설명함
일반적으로 스프레드시트에 정리하여 분석함 일반적으로 데이터베이스에 보관하고 쿼리함
소기업 및 중견 기업에서 주로 사용함 대기업에서 주로 사용함
수집, 저장, 관리, 정렬, 시각적 표현이 간편함 수집, 보관, 관리, 정렬, 시각적 표현에 큰 노력이 필요함
일반적으로 분석 시 관리 가능한 크기 효과적인 의사결정을 위해 정리하여 분석하려면 일반적으로 데이터를 작은 규모로 나누어야 함

 

과제와 이점

빅데이터로 작업할 때 직면할 수 있는 몇 가지 과제는 다음과 같습니다.

  • 많은 조직에서 데이터 과부하와 중요하지 않거나 관련 없는 정보로 인한 문제를 겪습니다. 
  • 중요한 데이터가 중요하지 않은 데이터로 인해 가려지게 되면 중요한 데이터를 찾아서 사용하기가 더 어려워집니다. 이에 따라 의사결정에 걸리는 시간이 길어지고 효율성이 저하될 수 있습니다.
  • 필요한 데이터에 항상 쉽게 접근할 수 있는 것은 아닙니다. 
  • 현재의 기술 도구와 솔루션에는 측정 가능하고 보고할 가치가 있는 데이터를 제공하는 데 아직 어려움이 있습니다. 이러한 어려움으로 인해 불공정한 알고리즘 편향이 발생할 수 있습니다. 
  • 빅데이터 비즈니스 솔루션은 많지만 서로 차이가 있습니다.

이제 이점을 살펴보겠습니다. 빅데이터의 몇 가지 이점은 다음과 같습니다.

  • 많은 양의 데이터를 저장하고 분석할 수 있으면 기업이 더욱 효율적으로 비즈니스를 운영하는 방법을 파악하고 많은 시간과 비용을 절약하는 데 도움이 됩니다.
  • 빅데이터는 조직이 고객 구매 패턴과 만족도 수준의 추세를 파악하여 고객을 만족시킬 수 있는 새로운 제품과 솔루션을 만드는 데 도움이 됩니다.
  • 기업은 빅데이터를 분석하여 현재 시장 상황을 보다 잘 파악하고 경쟁에서 앞서 나갈 수 있습니다.
  • 지난번 소셜 미디어 예와 마찬가지로, 빅데이터는 기업의 온라인 인지도, 특히 고객의 긍정/부정 피드백을 추적하는 데 도움이 됩니다. 이를 통해 기업은 브랜드를 개선하고 보호하는 데 필요한 정보를 확보할 수 있습니다.

 

V로 시작하는 빅데이터 단어 3가지(또는 4가지)

빅데이터의 이점과 과제에 관해 생각할 때는 V로 시작하는 3가지 단어, 볼륨(Volume), 다양성(Variety), 속도(Velocity)를 떠올리세요.볼륨은 데이터의 양을 말하며, 다양성은 다양한 종류의 데이터를 뜻합니다. 속도는 데이터를 처리할 수 있는 속도를 의미합니다. 일부 데이터 애널리스트는 네 번째 V인 정확성(Veracity)도 고려합니다. 이는 데이터의 품질과 신뢰성을 나타냅니다. 4가지 모두 거대하고 복잡한 데이터 세트를 처리할 때 고려해야 하는 중요한 요소입니다.

 

 

 

볼륨 다양성 속도 정확성
데이터의 양 다양한 종류의 데이터  데이터를 처리할 수 있는 속도 데이터의 품질과 신뢰성

 

반응형

 

728x90
반응형