[Coursera Google] GCC 데이터 애널리틱스 : 데이터 기반 의사결정을 위한 질문 | 스프레드시트 기본 사항 알아보기

2024. 8. 6. 22:39GCC/데이터 애널리틱스

728x90
반응형

 

728x90

 

 

 

 

 

 

 

 

스프레드 시트 작업

놀라운 스프레드시트

 

스프레드시트의 기본 기능과 활용

1. 데이터 입력 및 정리

  • 데이터 입력: 스프레드시트의 셀에 데이터를 입력하고, 표 형태로 정리합니다.
  • 시트 관리: 여러 시트를 사용해 데이터를 분류하고, 각 시트에 다른 데이터를 저장할 수 있습니다.

2. 기본 함수와 수식

  • 합계 (SUM): 여러 셀의 값을 더할 때 사용합니다.
    • 예: =SUM(A1:A10)
  • 평균 (AVERAGE): 여러 셀의 평균값을 구할 때 사용합니다.
    • 예: =AVERAGE(A1:A10)
  • 최대값 (MAX): 여러 셀 중 가장 큰 값을 찾을 때 사용합니다.
    • 예: =MAX(A1:A10)
  • 최소값 (MIN): 여러 셀 중 가장 작은 값을 찾을 때 사용합니다.
    • 예: =MIN(A1:A10)

3. 데이터 시각화

  • 차트 만들기: 데이터 범위를 선택하고 차트를 생성해 시각적으로 데이터를 분석할 수 있습니다.
    • 막대 차트: 카테고리 별로 데이터를 비교할 때 유용합니다.
    • 선 차트: 시간 경과에 따른 데이터 변화를 시각화할 때 사용합니다.
    • 파이 차트: 데이터의 비율을 시각적으로 표현할 때 좋습니다.

4. 피벗 테이블

  • 데이터 요약: 피벗 테이블을 사용해 대규모 데이터 세트를 요약하고, 데이터를 다양한 방식으로 그룹화하여 분석할 수 있습니다.
  • 동적 분석: 피벗 테이블은 데이터를 필터링하고 정렬해 원하는 정보를 빠르게 찾을 수 있게 해줍니다.

실습 예제: 구매 주문 데이터 분석

1. 데이터 입력

  • 구매 주문 데이터를 스프레드시트에 입력합니다. 예를 들어, 다음과 같은 데이터를 사용할 수 있습니다:
    • 주문 날짜, 영업 사원, 제품, 단가, 수량, 매출

2. 기본 함수 사용

  • 매출 계산: 각 주문의 매출을 계산하기 위해 단가와 수량을 곱한 값을 계산합니다.
    • 예: =B2*C2 (단가가 B열, 수량이 C열일 때)
  • 총 매출: 모든 주문의 매출 합계를 구합니다.
    • 예: =SUM(D2:D100) (매출이 D열에 있을 때)

3. 데이터 시각화

  • 매출 차트: 영업 사원별 매출을 막대 차트로 시각화합니다.
    • 데이터를 선택하고, 삽입 메뉴에서 막대 차트를 선택합니다.
  • 매출 추이: 월별 매출 변화를 선 차트로 시각화합니다.
    • 날짜와 매출 데이터를 선택하고, 선 차트를 삽입합니다.

4. 피벗 테이블 생성

  • 영업 사원별 매출 요약: 피벗 테이블을 사용해 영업 사원별 총 매출을 요약합니다.
    • 데이터 범위를 선택하고, 피벗 테이블을 삽입합니다.
    • 행에 '영업 사원', 값에 '매출'을 추가해 영업 사원별 매출을 계산합니다.

 

실습 예제: 병원 데이터 분석

  • 병원의 병상 가동률 최적화를 위한 데이터를 분석합니다.
  • 데이터 입력: 병상 수, 입원 일수 등의 데이터를 스프레드시트에 입력합니다.
  • 병상 점유율 계산: 병상 점유율을 계산하는 수식을 입력합니다.
    • 예: =E2/F2*100 (총 입원 일수가 E열, 사용 가능한 병상 수가 F열일 때)
  • 차트 시각화: 병상 점유율을 시각화해 추이를 분석합니다.

 


스프레드시트 작업 시작

 

스프레드시트 실습: 건설 회사 비용 데이터 분석

 

1. 데이터 입력

먼저, 건설 회사의 비용 데이터를 스프레드시트에 입력합니다. 다음과 같은 형식으로 데이터를 준비해 주세요:

프로젝트명날짜비용카테고리

프로젝트 A 2024-01-15 100000 자재비
프로젝트 B 2024-02-20 50000 인건비
프로젝트 A 2024-03-10 20000 기타비용
프로젝트 C 2024-04-05 30000 자재비
프로젝트 B 2024-05-22 15000 인건비
프로젝트 A 2024-06-12 25000 자재비
프로젝트 C 2024-07-03 35000 기타비용

 

2. 피벗 테이블 생성

데이터를 입력한 후, 피벗 테이블을 만들어 비용 데이터를 요약합니다.

  • 피벗 테이블 생성 방법:
    • 데이터 범위를 선택합니다.
    • 메뉴에서 삽입 > 피벗 테이블을 선택합니다.
    • 새로운 워크시트에 피벗 테이블을 생성합니다.
  • 피벗 테이블 구성:
    • 행: 프로젝트명
    • 값: 비용 (합계)

3. 데이터 필터링

최근 3개월 동안의 비용 정보를 필터링합니다. 예를 들어, 2024년 5월부터 7월까지의 데이터를 사용합니다.

  • 필터링 방법:
    • 데이터 범위에서 날짜 열을 선택합니다.
    • 메뉴에서 데이터 > 필터를 선택합니다.
    • 필터 아이콘을 클릭하고, 2024-05-01에서 2024-07-31까지의 날짜를 선택합니다.

4. 함수와 수식 사용

어떤 건설 프로젝트에 비용이 가장 많이 들었는지 계산합니다.

  • SUMIF 함수 사용:
    • 각 프로젝트별로 특정 기간 동안의 비용을 합산합니다.
    • 예: =SUMIF(A2:A8, "프로젝트 A", C2:C8) (프로젝트 A의 비용 합계)
  • MAX 함수 사용:
    • 가장 많은 비용이 든 프로젝트를 찾습니다.
    • 예: =MAX(D2:D4) (필터링된 데이터 범위에서 최대 비용 찾기)

5. 데이터 시각화

차트를 사용해 비용 데이터를 시각화합니다. 예를 들어, 프로젝트별 비용을 막대 차트로 시각화합니다.

  • 차트 만들기:
    • 피벗 테이블이나 필터링된 데이터를 선택합니다.
    • 메뉴에서 삽입 > 차트 > 막대 차트를 선택합니다.
    • 차트 제목과 축 레이블을 추가해 데이터를 명확하게 표시합니다.

6. 데이터 분석

  • 각 프로젝트의 비용 데이터를 분석해 어떤 프로젝트가 가장 비용이 많이 드는지, 비용이 많이 든 이유는 무엇인지, 비용을 줄일 수 있는 방법은 무엇인지 파악합니다.

이제 여러분이 스프레드시트를 사용해 데이터를 입력하고, 피벗 테이블로 요약하고, 데이터를 필터링하고, 함수를 사용해 계산하며, 데이터를 시각화하는 과정을 직접 해보실 수 있습니다

 

 


스프레드시트와 데이터 수명 주기

데이터 애널리틱스에서 스프레드시트를 사용하는 이점을 더 잘 이해하기 위해 스프레드시트와 데이터 수명 주기 각 단계 (계획, 캡처, 관리, 분석, 보관, 폐기) 의 관계를 살펴보겠습니다.

  • 계획: 구성 표준안을 마련하여 스프레드시트에서 작업할 사람들을 위해 계획을 세웁니다. 셀, 강조표시할 헤더, 색 구성표에 서식을 지정하고 데이터 포인트를 정렬하는 방식을 의미할 수 있습니다. 시간을 들여 표준안을 마련하면 의사소통을 개선하고 일관성을 보장하고 사람들이 시간을 보다 효율적으로 사용하는 데 도움이 됩니다.
  • 캡처: 스프레드시트를 온라인 설문조사 애플리케이션이나 데이터베이스와 같은 다른 데이터 소스에 연결하여 소스별로 데이터를 캡처합니다. 캡처된 데이터는 스프레드시트에서 자동으로 업데이트됩니다. 이를 통해 항상 최신 정보를 최대한 정확하게 유지할 수 있습니다.
  • 관리: 스프레드시트로 다양한 종류의 데이터를 관리합니다. 여기에는 정보 저장, 구성, 필터링 및 업데이트 작업이 포함될 수 있습니다. 또한 스프레드시트를 사용하면 데이터에 접근할 수 있는 대상, 정보 공유 방식, 데이터 보호 방식을 결정할 수 있습니다. 
  • 분석: 스프레드시트의 데이터를 분석하여 더 나은 결정을 내립니다. 가장 일반적인 스프레드시트 분석 도구로는 데이터를 집계하거나 보고서를 만드는 수식, 명확하고 이해하기 쉬운 시각화를 위한 피벗 테이블이 있습니다. 
  • 보관: 자주 사용하지 않지만 기본 제공 도구가 포함되어 있어 나중에 참고해야 할 수도 있는 스프레드시트를 보관합니다. 과거 데이터를 업데이트하기 전에 저장하려는 경우 특히 유용합니다. 
  • 폐기: 더 유용한 백업 사본이 있거나 법적 또는 보안상의 이유로 다시는 필요하지 않다고 확신하는 경우 스프레드시트를 폐기합니다. 많은 기업의 경우 데이터를 적절하게 폐기하기 위해 특정 규칙을 따르거나 조치를 마련해야 한다는 점에 유의합니다.

리소스

스프레드시트 단축키를 사용하면 스프레드시트를 보다 효율적으로 사용할 수 있습니다. 자세히 알아보려면 Google Sheets 단축키 모음을 살펴보거나 Excel을 사용하는 경우 Microsoft Excel 단축키 페이지를 참고하세요. 두 리소스에는 스프레드시트 단축키 목록이 포함되어 있습니다. 목록을 저장하여 더 많은 스프레드시트 작업을 할 때 참고하세요.

 

Google 스프레드시트용 단축키 - 컴퓨터 - Google Docs 편집기 고객센터

Excel의 바로 가기 키 - Microsoft 지원

 

 


스프레드시트 단계별 안내

 

스프레드시트 실습: 기본 데이터 정리

 

1. 스프레드시트 파일 열기

  • Excel 또는 Google Sheets를 엽니다.
  • 새 빈 파일을 만듭니다.

2. 스프레드시트 제목 지정 및 파일 저장

  • 첫 번째 행에 스프레드시트의 제목을 입력합니다. 예를 들어, "Population Data (2010-2019)".
  • Excel에서는 파일 > 다른 이름으로 저장을 선택하고 적절한 폴더에 파일을 저장합니다.
  • Google Sheets에서는 파일 > 제목 지정을 선택하고 이름을 입력한 후 저장합니다.

3. 폴더 생성 및 파일 이동 (Google Sheets 예시)

  • 파일 > 이동을 클릭합니다.
  • 새 폴더를 클릭하고 이름을 "Population Data"로 지정합니다.
  • 파일을 이 폴더로 이동합니다.

4. 데이터 입력

다음과 같은 인구 데이터를 입력합니다. 각 열에는 국가명, 연도, 인구수가 포함됩니다:

CountryYearPopulation

Argentina 2010 40117096
Argentina 2011 40788453
Argentina 2012 41446246
Brazil 2010 195713635
Brazil 2011 197514536
Brazil 2012 199287296
Chile 2010 17062523
Chile 2011 17374146
Chile 2012 17687016

5. 열 너비 조정

  • 전체 시트를 선택하려면 스프레드시트의 왼쪽 상단 모서리에 있는 Select All 버튼(또는 Ctrl+A)을 클릭합니다.
  • 아무 열의 경계를 드래그하여 모든 열의 너비를 조정합니다.

6. 첫 번째 행의 서식 지정

  • 첫 번째 행을 선택합니다.
  • 배경 색상을 지정하고, 글꼴을 굵게(Bold) 설정합니다. (예: 메뉴에서 서식 > 채우기 색상 및 굵게를 선택합니다.)

7. 열 추가 및 삭제

  • 열 추가: 예를 들어, "Country" 열과 "Year" 열 사이에 새로운 열을 추가합니다.
    • "Year" 열을 선택하고 마우스 오른쪽 버튼을 클릭한 후 열 삽입을 선택합니다.
  • 열 삭제: 추가된 빈 열을 삭제합니다.
    • 빈 열을 선택하고 마우스 오른쪽 버튼을 클릭한 후 열 삭제를 선택합니다.

8. 테두리 추가

  • 전체 시트를 선택하려면 왼쪽 상단 모서리에 있는 Select All 버튼을 클릭합니다.
  • 메뉴에서 Border 버튼을 클릭하고, 모든 셀에 테두리를 추가합니다.

스프레드시트 정리 완료

이제 데이터를 깔끔하게 정리한 상태입니다. 이를 통해 분석할 준비가 되었습니다. 데이터를 정리하고 구조화하는 작업은 분석의 첫걸음이며, 이후의 분석 과정에서 데이터를 더 쉽게 처리할 수 있도록 합니다.

 

 


스프레드 시트의 수식

 

성공적인 작업을 위한 수식

 

스프레드시트에서 계산 작업을 어떻게 수행하는지 단계별로 알아보겠습니다. 

 

1. 스프레드시트 열기 및 데이터 입력

  1. 새 스프레드시트 열기: Excel이나 Google Sheets를 엽니다.
  2. 데이터 입력: 다음과 같은 매출 데이터를 입력합니다.

YearJan SalesFeb SalesMar SalesApr SalesTotal SalesAverage SalesMin SalesMax Sales

2020 1500 2000 1700 2500        
2021 1800 2200 1600 2700        

2. 합계 계산

  • 셀 F2를 선택: 'Total Sales' 열의 첫 번째 데이터 셀을 선택합니다.
  • 수식 입력: =B2+C2+D2+E2를 입력하고 Enter를 누릅니다. 그러면 합계가 계산됩니다.
  • 수식 복사: 셀 F2를 복사(Ctrl+C)하고, F3 셀에 붙여넣기(Ctrl+V)합니다.

3. 평균 계산

  • 셀 G2를 선택: 'Average Sales' 열의 첫 번째 데이터 셀을 선택합니다.
  • 수식 입력: =(B2+C2+D2+E2)/4 또는 =AVERAGE(B2:E2)를 입력하고 Enter를 누릅니다.
  • 수식 복사: 셀 G2를 복사(Ctrl+C)하고, G3 셀에 붙여넣기(Ctrl+V)합니다.

4. 최소값 계산

  • 셀 H2를 선택: 'Min Sales' 열의 첫 번째 데이터 셀을 선택합니다.
  • 수식 입력: =MIN(B2:E2)를 입력하고 Enter를 누릅니다.
  • 수식 복사: 셀 H2를 복사(Ctrl+C)하고, H3 셀에 붙여넣기(Ctrl+V)합니다.

5. 최대값 계산

  • 셀 I2를 선택: 'Max Sales' 열의 첫 번째 데이터 셀을 선택합니다.
  • 수식 입력: =MAX(B2:E2)를 입력하고 Enter를 누릅니다.
  • 수식 복사: 셀 I2를 복사(Ctrl+C)하고, I3 셀에 붙여넣기(Ctrl+V)합니다.

6. 셀 참조와 수식 복사

  • 수식 복사의 장점: 셀 참조를 사용하면 수식을 복사할 때 각 행에 맞게 자동으로 업데이트되므로 시간을 절약할 수 있습니다.
  • 수정 시 자동 업데이트: 입력한 값이 변경되면 수식이 자동으로 업데이트되어 결과가 즉시 반영됩니다.

7. 오류 수정

  • 오류 확인: 수식이 작동하지 않을 경우 셀 참조나 입력값을 확인합니다.
  • 빈 셀 확인: 오류가 발생한 셀의 데이터를 추가하거나 수정합니다.

이제 스프레드시트에서 기본적인 계산 작업을 수행하는 방법을 익혔습니다. 이를 통해 데이터를 더 효율적으로 분석할 수 있게 될 것입니다. 다음 시간에는 더 복잡한 수식과 함수를 사용하여 분석 작업을 진행해보겠습니다.

 

 


스프레드시트의 수식

 

수식

기본사항

  • 수학에서 수식을 작성할 때는 일반적으로 등호(2 + 3 = ?)로 끝납니다. 그러나 스프레드시트의 수식에서는 항상 등호로 시작합니다(=A2+A3). 등호는 다음에 오는 항목이 셀의 단어나 숫자가 아니라 수식의 일부임을 스프레드시트에 알려줍니다. 
  • 등호를 입력하면 대부분의 스프레드시트 애플리케이션에서는 유효한 수식, 이름, 텍스트 문자열 목록의 자동 완성 메뉴가 표시됩니다. 이를 통해 입력 및 구문 오류를 피하면서 수식을 만들고 수정할 수 있습니다.
  • 등호와 알파벳 한 글자를 입력하면 새로운 수식을 배워볼 수 있습니다. 표시되는 옵션 중 하나를 선택하여 수식의 기능을 알아보세요.

수학 연산자

  • 스프레드시트 수식에 사용되는 수학 연산자는 다음과 같습니다.
  • 빼기: 빼기 기호(-)
  • 더하기: 더하기 기호(+)
  • 나누기: 슬래시(/)
  • 곱하기: 별표(*)

자동 채우기

각 셀의 오른쪽 아래 모서리에는 채우기 핸들이 있습니다. Microsoft Excel 에서는 작은 녹색 사각형이고 Google Sheets 에서는 작은 파란색 사각형입니다.

  • 셀의 채우기 핸들을 클릭하고 열 아래로 드래그하면 셀의 동일한 값 또는 수식으로 열의 다른 셀을 자동으로 채울 수 있습니다. 
  • 셀의 채우기 핸들을 클릭하고 행으로 드래그하면 셀의 동일한 값 또는 수식으로 행의 다른 셀을 자동으로 채울 수 있습니다. 
  • 열이나 행에 연속되는 숫자를 나열하려면 다음과 같이 합니다. 1) 인접한 두 셀에 연속 숫자 중 처음 두 숫자를 채웁니다. 2) 강조표시되도록 셀을 선택합니다. 3) 채우기 핸들을 마지막 셀로 드래그하여 연속되는 숫자를 나열합니다. 예를 들어 A열의 각 행에 1부터 100까지 삽입하려면 셀 A1에 1 을 입력하고 셀 A2 에 2 를 입력합니다. 그런 다음 강조표시되도록 두 셀을 선택하고 셀 A2의 채우기 핸들을 클릭한 다음 셀 A100 으로 드래그합니다. 이렇게 하면 숫자가 순차적으로 자동 채워지므로 각 셀에 입력할 필요가 없습니다.

절대 참조

  • 절대 참조는 달러 기호($)로 표시됩니다. 예를 들어 =$A$10은 열과 행 값 모두를 절대 참조한 것입니다.
  • 상대 참조 ('=A10' 과 같이 일반적인 참조) 는 수식을 복사하여 붙여넣을 때마다 변경됩니다. 참조된 셀이 있는 위치와 관련이 있습니다. 예를 들어 '=A10' 을 오른쪽 셀에 복사하면 '=B10' 이 됩니다. 절대 참조인 '=$A$10' 을 오른쪽 셀에 복사하면 '=$A$10' 이 유지됩니다. 그러나 $A10 을 아래 셀에 복사하면 행 값이 절대 참조가 아니기 때문에 $A11 로 변경됩니다.
  • 절대 참조는 다른 셀에 수식을 복사하여 붙여넣을 때 변경되지 않습니다. 참조되는 셀은 항상 동일합니다.
  • 수식 입력줄에서 절대 참조와 상대 참조 간에 쉽게 전환하려면 변경할 참조 값을 강조표시하고 F4 키를 누릅니다. 예를 들어 수식에서 절대 참조인 $A$10 을 상대 참조인 A10 으로 변경하려면 수식 입력줄에서 $A$10 을 강조표시한 다음 F4 키를 눌러 변경합니다.

데이터 범위

  • 수식을 클릭하면 색상이 지정된 범위를 통해 스프레드시트에서 사용 중인 셀을 확인할 수 있습니다. 수식의 범위별로 색상이 다릅니다.
  • 많은 스프레드시트 애플리케이션의 경우 F2(또는 Enter) 키를 누르면 수식에서 참조하는 스프레드시트의 데이터 범위를 강조표시할 수 있습니다. 수식이 있는 셀을 클릭한 다음 F2(또는 Enter) 키를 눌러 스프레드시트의 데이터를 강조표시하세요.

함수와 결합

COUNTIF() 는 수식이자 함수입니다. 즉, 수식에 의해 설정된 기준에 따라 실행되는 함수입니다. 이 경우 COUNT 는 수식입니다. 생성한 조건 (IF) 이 참이면 실행됩니다. 예를 들어 =COUNTIF (A1:A16, "7") 을 사용하면 숫자 7 이 포함된 셀만 계산할 수 있습니다. 수식과 함수를 결합하면 단일 명령어로 더 많은 작업을 수행할 수 있습니다.

 

 


스프레드시트 오류 및 수정

 

데이터 애널리스트의 스프레드시트 오류 해결 방법

 

데이터 애널리스트로서 스프레드시트에서 발생할 수 있는 다양한 오류와 이를 해결하는 방법을 알아보겠습니다. 여기서는 주요 오류 유형들을 다루고, 각 오류의 원인과 해결 방법을 예제와 함께 설명하겠습니다.

 

1. DIV 오류 (Divide by Zero Error)

  • 원인: 셀 값을 0 또는 빈 셀로 나누려고 할 때 발생.
  • 해결 방법: IFERROR 함수를 사용하여 오류를 처리합니다. 예를 들어, 완료율을 계산하는 수식에서 발생한 DIV 오류를 해결합니다.위 수식을 셀 C4에 입력하면 셀 A4의 값이 0일 경우 "Not applicable"이 표시됩니다. 이 수식을 C열의 나머지 셀에도 복사해서 사용합니다.
=IFERROR(B2/A2, "Not applicable")
 
 

2. ERROR (Syntax Error)

  • 원인: 수식을 입력값으로 해석할 수 없을 때 발생. 구문 오류라고도 합니다.
  • 해결 방법: 잘못된 구문을 수정합니다. 예를 들어, SUM 함수에서 쉼표가 빠진 경우를 수정합니다.
잘못된 수식
=SUM(B2:B6 C2:C6)

 

올바른 수식

=SUM(B2:B6, C2:C6)

 

 

3. N/A 오류 (Value Not Available Error)

  • 원인: 수식에서 데이터를 찾을 수 없을 때 발생.
  • 해결 방법: 데이터가 정확히 입력되었는지 확인합니다. VLOOKUP 함수에서 오타가 발생한 경우를 예로 들면, 'Almond' 대신 'Almonds'가 있어야 합니다.
    • Almond
    수정된 데이터:
    • Almonds
  • 잘못된 데이터:

4. NAME 오류

  • 원인: 수식의 이름이 인식되지 않거나 이해할 수 없을 때 발생.
  • 해결 방법: 함수 이름을 정확하게 입력합니다. 예를 들어, VLOOKUP 함수에서 철자가 잘못된 경우를 수정합니다.
잘못된 수식
=VLOOKUP(B2, A2:D10, 2, FALSE)
 

올바른 수식

=VLOOKUP(B2, A2:D10, 2, FALSE)

 

 

5. NUM 오류

  • 원인: 지정된 데이터로는 수식을 계산할 수 없을 때 발생. 보통 수식에 사용할 수 없는 데이터가 입력된 경우입니다.
  • 해결 방법: 데이터를 확인하고 수정합니다. 예를 들어, DATEDIF 함수에서 종료일이 시작일보다 빠를 때 발생하는 오류를 해결합니다.
잘못된 수식
=DATEDIF(C2, B2, "M")​

 

올바른 수식

=DATEDIF(B2, C2, "M")

 

 

6. VALUE 오류

  • 원인: 수식 또는 참조된 셀에 문제가 있을 때 발생. 주로 텍스트가 숫자 또는 날짜로 처리되어야 할 때 발생합니다.
  • 해결 방법: 수식의 입력값을 정확하게 수정합니다. 예를 들어, 시작일에 잘못된 텍스트가 입력된 경우를 수정합니다.
    • John Welty
    수정된 데이터:
    • 2016-09-01
  • 잘못된 데이터:

7. REF 오류 (Reference Error)

  • 원인: 수식에 참조된 셀이 삭제된 상태일 때 발생.
  • 해결 방법: 삭제된 셀을 참조하지 않도록 수식을 수정합니다. 예를 들어, 행을 삭제한 후 발생한 오류를 해결합니다.
 잘못된 수식
=B2 + B3 + B4
 

 

올바른 수식

=SUM(B2:B3)

 

이와 같이 오류를 이해하고 해결하는 방법을 배우면, 데이터 분석에서 발생하는 문제를 효과적으로 처리할 수 있습니다. 데이터 애널리스트의 핵심 스킬 중 하나는 바로 이러한 문제 해결 능력입니다.

 

 


오류를 방지하는 몇 가지 기본적인 방법을 배웠으니 이제 오류 창이 표시되더라도 해야 할 작업에 집중할 수 있습니다. 다음 표에는 일반적인 스프레드시트 오류와 각각의 예가 나와 있습니다. 오류의 의미를 알면 오류 발생으로 인한 두려움을 어느 정도 극복할 수 있습니다.

오류설명
#DIV/0! 수식이 셀의 값을 0 (또는 값이 없는 빈 셀) 으로 나누려고 합니다. =B2/B3, 셀 B3 의 값이 0인 경우
#ERROR! (Google Sheets 만 해당) 해석할 수 없는 값을 입력했습니다. 이는 구문 분석 오류라고도 합니다. =COUNT(B1:D1 C1:C10)은 셀 범위가 쉼표로 구분되지 않았기 때문에 유효하지 않습니다.
#N/A 수식이 데이터를 찾을 수 없습니다. 참조된 셀을 찾을 수 없습니다.
#NAME? 사용된 수식 또는 함수의 이름을 인식할 수 없습니다. 함수 이름의 철자가 잘못되었습니다.
#NUM! 셀에 잘못된 숫자 값이 있으므로 스프레드시트에서 수식 계산을 처리할 수 없습니다. =DATEDIF(A4, B4, "M") 은 셀 A4 의 날짜가 셀 B4 의 날짜보다 과거이기 때문에 두 날짜 사이의 개월 수를 계산할 수 없습니다.
#REF! 수식이 유효하지 않은 셀을 참조합니다. 삭제된 열의 셀을 수식에 사용했습니다.
#VALUE! 수식 또는 참조된 셀에 문제가 있음을 나타내는 일반적인 오류입니다. 공백이나 텍스트와 관련된 문제 또는 수식에 참조된 셀에 문제가 있을 수 있습니다. 문제의 원인을 찾기 위해 추가 작업이 필요할 수 있습니다.

Microsoft Excel로 작업하는 경우 대화형 웹페이지인 #VALUE! 오류를 수정하는 방법 에서 오류의 원인을 찾을 수 있습니다. 드롭다운 목록에서 특정 함수를 선택하면 함수 사용 시 오류를 수정하는 데 도움이 되는 팁 링크가 표시됩니다.

 

 


스프레드 시트의 함수

함수 입문

 

스프레드시트에서 함수와 수식의 활용

스프레드시트를 사용할 때 함수와 수식은 작업의 효율성을 크게 높여줍니다. 이번에는 수식과 함수의 차이점과 사용법, 그리고 유용한 단축키에 대해 알아보겠습니다.

함수와 수식의 차이점

  • 수식(Formulas): 데이터를 사용하여 계산을 수행하는 사용자 정의 명령어입니다. 예를 들어, 셀 A1과 A2의 값을 더하는 수식은 =A1 + A2입니다.
  • 함수(Functions): 특정 작업을 자동으로 수행하는 미리 정의된 명령어입니다. 예를 들어, 셀 A1부터 A10까지의 합계를 구하는 함수는 =SUM(A1:A10)입니다.

주요 함수 사용법

1. SUM 함수

  • 목적: 지정된 범위의 셀 값을 모두 더합니다.
  • 사용법: =SUM(범위)

예제:

=SUM(B2:B6)​

이 수식을 셀 F2에 입력하면 총 매출액이 계산됩니다.

 

2. AVERAGE 함수

  • 목적: 지정된 범위의 셀 값의 평균을 구합니다.
  • 사용법: =AVERAGE(범위)

예제:

=AVERAGE(B2:B6)​

월별 평균 매출액을 구할 때 사용합니다.

 

3. MIN 함수

  • 목적: 지정된 범위의 셀 값 중 최솟값을 구합니다.
  • 사용법: =MIN(범위)

예제:

=MIN(B2:B6)
 

데이터 세트에서 최저 월 매출액을 찾을 때 사용합니다.

 

4. MAX 함수

  • 목적: 지정된 범위의 셀 값 중 최댓값을 구합니다.
  • 사용법: =MAX(범위)

예제:

=MAX(B2:B6)
 

데이터 세트에서 최고 월 매출액을 찾을 때 사용합니다.

 

채우기 핸들(Fill Handle) 사용법

  • 기능: 셀의 오른쪽 하단 모서리에 있는 작은 사각형을 드래그하여 수식이나 함수를 다른 셀로 복사할 수 있습니다.
  • 사용법:
    1. 수식이나 함수가 들어 있는 셀을 선택합니다.
    2. 셀 오른쪽 하단 모서리에 있는 작은 사각형에 커서를 놓습니다.
    3. 원하는 방향(같은 행이나 열)으로 드래그합니다.

이를 통해 원래 셀에 있던 수식이나 함수가 자동으로 복사되며, 셀 참조 역시 드래그한 셀의 행/열에 맞게 자동으로 변경됩니다.

 

예제

  1. 총 매출액 계산
    • 셀 F2에 =SUM(B2:B6)을 입력합니다.
    • 채우기 핸들을 사용하여 셀 F2의 수식을 F3, F4 등 다른 셀로 복사합니다.
  2. 월별 평균 매출액 계산
    • 셀 G2에 =AVERAGE(B2:B6)을 입력합니다.
  3. 최저 월 매출액 찾기
    • 셀 H2에 =MIN(B2:B6)을 입력합니다.
    • 최저 매출액 셀에 색상을 넣어 강조합니다. (예: 노란색)
  4. 최고 월 매출액 찾기
    • 셀 I2에 =MAX(B2:B6)을 입력합니다.
    • 최고 매출액 셀에 색상을 넣어 강조합니다. (예: 파란색)

이러한 기본적인 함수와 수식은 데이터를 분석하고 정리하는 데 큰 도움을 줍니다. 스프레드시트를 사용할 때 자주 사용되는 이 함수들을 잘 익혀두면 작업의 효율성을 크게 높일 수 있습니다. 

 

 

 


구조적 사고로 시간절약

 

문제 해결을 위한 문제 파악

 

문제 정의의 중요성과 구조적 사고

알베르트 아인슈타인은 "만일 한 시간 안에 세계를 구해야 한다면 59분 동안 문제를 정의하고 나머지 1분 동안 해결할 것이다"라고 말했습니다. 이 말은 문제를 해결하기 전에 문제를 명확하게 정의하는 것이 얼마나 중요한지 강조하고 있습니다. 이는 데이터 분석에서도 매우 중요한 원칙입니다.

 

문제 정의의 중요성

많은 경우 데이터 분석을 바로 시작했다가 몇 달이 지난 뒤에야 잘못된 문제를 해결했다거나 필요한 데이터가 없다는 사실을 깨닫곤 합니다. 이는 문제를 정의하는 단계가 충분하지 않아서 발생하는 문제입니다. 문제를 올바르게 정의하면 해결책을 찾는 데 소요되는 시간과 비용, 리소스를 절약할 수 있습니다.

 

문제 영역의 이해

데이터 분석 프로젝트에서 첫 번째 단계는 문제 영역을 이해하는 것입니다. 문제 영역은 해결할 문제에 영향을 미치거나 영향을 받는 모든 활동을 포함합니다. 이를 통해 전체적인 맥락을 파악하고 문제의 모든 요소와 관계를 이해할 수 있습니다.

 

퍼즐 비유

문제 영역을 이해하는 과정을 직소 퍼즐에 비유할 수 있습니다. 퍼즐 조각은 모두 있지만 상자(참고할 이미지)가 없다면 퍼즐을 완성하기 어렵습니다. 데이터 애널리스트도 마찬가지로 프로젝트의 큰 그림을 파악하지 못하면 문제를 해결하는 데 어려움을 겪게 됩니다.

 

구조적 접근법과 비판적 사고

 

구조적인 접근법을 개발하고 비판적 사고를 통해 문제를 정의하는 것이 데이터 애널리스트의 중요한 역할입니다. 이를 위해 다음과 같은 단계를 따릅니다:

  1. 문제 이해: 문제의 범위와 맥락을 파악합니다.
  2. 문제 정의: 문제의 구체적인 정의를 내립니다.
  3. 데이터 수집: 문제를 해결하는 데 필요한 데이터를 수집합니다.
  4. 데이터 분석: 수집한 데이터를 분석하여 문제의 원인을 파악합니다.
  5. 결과 해석: 분석 결과를 해석하고 해결책을 도출합니다.

구조적 사고의 훈련

데이터 애널리스트로서 문제를 제대로 해결하려면 구조적으로 사고하도록 두뇌를 훈련시켜야 합니다. 구조적 사고를 통해 문제를 체계적으로 접근하고 해결할 수 있습니다.

 

 

문제를 정의하는 것은 문제 해결의 첫걸음이자 가장 중요한 단계입니다. 문제를 명확하게 정의하면 효율적으로 문제를 해결할 수 있습니다. 구조적 사고와 비판적 사고를 통해 문제 영역을 이해하고 분석하는 능력을 키우는 것이 데이터 애널리스트로서의 중요한 역할입니다. 다음 강의에서는 구조적 사고의 구체적인 방법에 대해 알아보겠습니다.

 

 


작업 범위와 구조적 사고

 

구조적 사고와 작업 범위(SOW)의 중요성

비즈니스 문제를 효과적으로 해결하기 위해 구조적 사고와 명확한 작업 범위(Scope of Work, SOW)를 사용하는 것이 중요합니다. 이 두 가지는 문제를 명확히 정의하고 효율적으로 해결책을 찾는 데 큰 도움이 됩니다.

 

구조적 사고

구조적 사고는 문제나 상황을 인식하고, 입수된 정보를 정리하며, 격차와 기회를 파악하여 해결 방안을 찾아내는 과정입니다. 이는 철저한 준비를 의미하며, 다음 단계를 포함합니다:

  1. 문제 영역 이해: 분석이 필요한 영역을 구체적으로 알아내는 과정입니다. 문제를 이해하고 분석할 기초적인 조건을 설정합니다.
  2. 기초 조건 설정: 요건과 가설을 수립하여 조사를 시작합니다. 이 과정에서 탄탄한 기초를 바탕으로 어려움에 대처할 준비를 합니다.
  3. 데이터 분석: 데이터를 수집하고 분석하여 문제를 해결할 수 있는 인사이트를 도출합니다.

구조적 사고를 활용하면 문제를 대강 파악한 뒤 더 깊게 조사하고 이해해야 할 부분을 명확히 할 수 있습니다. 이를 통해 초기 문제를 완전히 이해하지 못해 발생할 수 있는 시간 낭비와 자원 낭비를 방지할 수 있습니다.

 

작업 범위(SOW)

작업 범위(SOW)는 프로젝트 작업의 개요를 정의하는 문서로, 프로젝트의 범위와 일정, 고객에게 제공할 결과물 등을 명시합니다. SOW는 다음과 같은 내용을 포함합니다:

  1. 작업의 결과물: 프로젝트가 완료된 후 제공해야 할 구체적인 결과물과 결과물의 기준을 정의합니다. 예를 들어, 청첩장 준비를 맡은 웨딩 플래너는 청첩장 선택, 하객 명단 작성, 주소 수집, 청첩장 인쇄 등의 작업을 수행합니다.
  2. 타임라인: 프로젝트가 일정대로 진행되도록 날짜와 주요 단계가 명시됩니다. 이는 일정 관리와 진행 상황 확인에 유용합니다.
  3. 보고서: 각 단계가 완료될 때 고객에게 알림을 제공하는 역할을 합니다. 이는 고객에게 진행 상황을 알려주고 안심시킬 수 있는 방법입니다.

작업 범위는 간단하면서도 강력한 도구가 될 수 있습니다. 잘 작성된 SOW는 혼란이나 모순을 사전에 방지하고, 데이터에 관한 질문을 미리 해결할 수 있도록 도와줍니다. 또한, 어려움이 발생하더라도 차질 없이 프로젝트를 진행할 수 있게 합니다.

 

예시: 웨딩 플래너의 작업 범위

  • 결과물: 청첩장 선택, 하객 명단 작성, 주소 수집, 청첩장 인쇄, 주소 기입, 우표 붙이기
  • 타임라인: 각 작업의 시작일과 마감일, 주요 단계
  • 보고서: 각 단계 완료 시 고객에게 알림 제공

작업 범위(SOW)는 프로젝트가 잘 진행되도록 보장하며, 데이터 애널리스트가 프로젝트를 구조적으로 접근하고 효과적으로 해결할 수 있도록 돕는 중요한 도구입니다.

 

구조적 사고와 작업 범위(SOW)는 비즈니스 문제를 명확히 정의하고 효율적으로 해결하는 데 필수적인 요소입니다. 구조적 사고를 통해 문제를 깊이 이해하고, 작업 범위를 통해 프로젝트의 범위와 일정, 결과물을 명확히 하면 시간과 비용을 절약할 수 있습니다.

 

 


객관성 유지

 

데이터의 맥락화와 편향 인식

데이터를 분석할 때는 단순히 숫자를 보고 결론을 내리는 것보다 데이터의 맥락과 편향을 이해하는 것이 중요합니다. 데이터 분석의 정확성과 신뢰성을 높이기 위해, 데이터를 수집한 맥락과 분석의 편향을 인식하는 것이 필수적입니다.

 

1. 데이터의 맥락화

데이터의 맥락은 데이터를 분석하고 해석하는 데 중요한 역할을 합니다. 맥락을 이해하지 않으면 데이터의 의미를 제대로 파악하기 어렵습니다. 데이터의 맥락을 고려해야 하는 이유는 다음과 같습니다:

  • 상황에 따라 다름: 데이터가 수집된 상황에 따라 그 의미가 달라질 수 있습니다. 예를 들어, 특정 행동이 누군가에게는 적절할 수 있지만, 다른 상황에서는 전혀 다르게 해석될 수 있습니다.
  • 데이터의 용도: 데이터가 어떻게 사용될지에 따라 맥락이 달라질 수 있습니다. 설명적(Descriptive) 데이터, 진단적(Diagnostic) 데이터, 예측적(Predictive) 데이터, 규범적(Prescriptive) 데이터는 각각 다른 용도와 목표를 가지고 있습니다.

2. 데이터 분석에서의 편향

편향은 데이터의 해석과 결론에 영향을 미칠 수 있는 주관적 요소입니다. 편향을 인식하고 관리하지 않으면 분석 결과가 왜곡될 수 있습니다. 편향의 유형에는 다음이 있습니다:

  • 문화적 편향: 분석자가 속한 문화나 사회적 배경에 따라 데이터 해석이 달라질 수 있습니다.
  • 개인적 편향: 개인의 경험이나 신념이 데이터 해석에 영향을 줄 수 있습니다.
  • 수집 방법의 편향: 설문조사와 대면 인터뷰 등 데이터 수집 방법에 따라 결과가 달라질 수 있습니다.

3. 데이터 분석 시 고려해야 할 질문

데이터를 정확히 이해하고 분석하기 위해 다음과 같은 질문을 스스로에게 던져야 합니다:

  • 누가 데이터를 수집했는가? 데이터 수집자의 배경과 목적이 데이터에 영향을 미칠 수 있습니다.
  • 무엇에 관한 데이터인가? 데이터의 주제와 관련된 정보를 명확히 해야 합니다.
  • 데이터가 실제로 의미하는 것은 무엇인가? 데이터가 나타내는 진정한 의미와 다른 데이터와의 관계를 이해해야 합니다.
  • 언제 수집된 데이터인가? 데이터의 수집 시점이 현재의 상황과 어떻게 맞물리는지 고려해야 합니다.
  • 어디서 수집된 데이터인가? 데이터 수집 장소에 따른 차이를 인식해야 합니다.
  • 어떻게 수집된 데이터인가? 데이터 수집 방법이 결과에 미친 영향을 이해해야 합니다.
  • 왜 데이터를 수집했는가? 데이터 수집의 목적과 의도가 분석 결과에 영향을 미칠 수 있습니다.

4. 공정하고 객관적인 데이터 수집 방법

정확한 데이터 분석을 위해 다음의 방법을 고려해야 합니다:

  • 대표성 있는 모집단 선정: 분석 대상이 되는 모집단이 실제 상황을 반영하도록 해야 합니다.
  • 객관적인 데이터 수집 방법 사용: 가능한 한 주관적인 요소를 배제하고 객관적인 방법으로 데이터를 수집해야 합니다.
  • 편향 관리: 데이터 분석 과정에서 편향을 인식하고 이를 최소화하기 위한 노력을 해야 합니다.

 

데이터를 정확히 분석하고 해석하기 위해서는 데이터의 맥락과 편향을 이해하는 것이 중요합니다. 데이터를 단순히 수치로만 보고 분석하기보다는, 그 데이터가 수집된 맥락과 분석 과정에서의 편향을 고려해야 합니다. 이를 통해 공정하고 객관적인 분석 결과를 도출할 수 있습니다.

 

 

 

 

반응형

 

728x90
반응형