[Coursera Google] GCC 데이터 애널리틱스 데이터 구조화와 프로그램 및 솔루션(스프레드 시트, 데이터 베이스&쿼리언어, 시각화 도구)

2024. 1. 6. 22:53GCC/데이터 애널리틱스

728x90
반응형

 

728x90

 

 

 

 

 

 

 

데이터 구조화

 

테이블로 데이터를 구조화합니다.

테이블은 행과 열고 구성되어 있으며, 각 행은 다른 관측값입니다.

그리고 각 열은 해당 관측값의 다른 속성을 가지고 있습니다.

 

데이터 애널리스트가 사용하는 가장 일반적인 프로그램과 솔루션은 스프레드 시트, 쿼리 언어, 시각화 도구가 있습니다.

 

 

스프레드 시트(Microsoft Excel, Google Sheets)
스프레드 시트에서는 다음 작업으로 데이터를 의미있게 구조화 할 수 있습니다.
  • 정보 수집, 저장, 구성, 정렬
  • 패턴 식별, 각 특정 데이터 프로젝트에 적합한 방식으로 데이터 통합
  • 그래프 및 차트와 같은 우수한 데이터 시각화 자료 생성

 

데이터베이스 및 쿼리 언어
데이터 베이스는 컴퓨터 시스템에 저장된 구조화된 데이터 모음입니다. 
SQL(구조적 쿼리 언어)(MySQL, Microsoft SQL Server, BigQuery)
  •  애널리스트가 데이터 베이스에서 특정정보를 분리할 수 있음
  • 데이버테이스에 대한 요청을 더 쉽게 알아보고 이해할 수 있음
  • 애널리스트가 분석을 위해 데이터 베이스에서 데이터를 선택, 생성, 추가, 다운로드 할 수 있음

 

시각화 도구(Tableau, Looker)
그래프, 맵, 테이블, 차트 등 다양한 시각화 도구를 사용
  • 복잡한 숫자를 사람들이 이해할 수 잇는 스토리로 전환
  • 이해관계자가 정보에 기반한 의사결정과 효과적인 비즈니스 전략으로 이어지는 결론을 찾아내도록 지원
  • 여러 기능 지원
Tableau
간단한 드래그 앤 드롭 기능을 통해 사용자는 대시보드와 워크시트에서 대화형 그래프르 만들 수 있습니다.

Looker
데이터베이스와 직접 상호작용하므로 사용자가 원하는 시각적 도구에 데이터를 바로 연결할 수 있습니다.

 

이외에도 R, 파이썬 등의 프로그래밍 언어를 사용하기도 합니다.

 

 

 

 

사용하는 도구 마다 목적이 다르게 때문에 두 도구를 적절히 이용하여 작업합니다.

스프레드 시트 데이터 베이스
소프트웨어 애플리케이션 데이터 저장소 - 쿼리 언어(SQL 등)를 사용하여 액세스
행 및 열 형식으로 데이터 구조화 규칙 및 관계를 사용하여 데이터를 구조화
셀에 정보 구성 복잡한 모음에 정보 구성
제한된 양의 데이터에 대한 액세스 제공 방대한 양의 데이터에 대한 액세스 제공
데이터 직접 입력 엄격하고 일관된 데이터 입력
일반적으로 한번에 사용자 한명 여러 사용자
사용자가 제어 데이커 베이스 관리 시스템에서 제어

 

 

 

 

 

반응형

 

728x90
반응형