데이터애널리틱스(30)
-
[Coursera Google] GCC 데이터 애널리틱스 : 데이터 분석을 통한 해답 찾기 | 데이터 형식 지정 및 조정
데이터 변환 및 형식 지정한 가지 유형에서 다른 유형으로 1. 데이터 형식 지정의 중요성데이터를 변환하지 않으면 스프레드시트가 잘못된 방식으로 데이터를 해석할 수 있습니다. 예를 들어, 날짜 형식으로 변환하지 않으면 날짜가 알파벳순으로 정렬될 수 있습니다.일관되지 않은 단위(예: 미국 달러와 영국 파운드)가 혼재되어 있을 경우, 분석 전에 이를 통일하는 작업이 필요합니다.2. 스프레드시트에서 데이터 형식 지정하기숫자 형식을 변환하는 방법툴바에서 데이터 형식을 지정할 수 있습니다. 숫자, 화폐, 날짜, 백분율 등의 옵션을 선택하여 데이터의 형식을 일관되게 설정할 수 있습니다.예를 들어, 화폐 형식으로 변환하려면 해당 열을 선택한 후, 툴바에서 화폐 아이콘을 클릭하면 됩니다.예시:영화 데이터에서 예산 열을..
2024.09.11 -
[Coursera Google] GCC 데이터 애널리틱스 : 데이터 분석을 통한 해답 찾기 | 분석 시작 전 데이터 구성
데이터 분석의 기초분석 과정 1. 데이터 분석이란?정의: 데이터 분석은 수집된 데이터의 의미를 파악하고, 그 안에서 패턴과 관계를 찾아 결과를 도출하는 과정입니다.목표: 데이터를 통해 문제를 해결하거나 질문에 답할 수 있는 유용한 정보를 찾아내는 것이 목적입니다.2. 데이터 분석의 4단계분석 과정은 데이터를 정리하고, 해석하여 결과를 도출하는 일련의 단계를 포함합니다. 이 4단계를 자세히 알아보면:1. 데이터 구성데이터를 쉽게 이해할 수 있도록 정리하고 구조화하는 단계입니다.복잡한 데이터를 체계적으로 배열하여 분석을 쉽게 합니다.예시: 결혼 선물 목록에서 모든 데이터를 한눈에 보기 좋게 정리합니다.2. 형식 지정 및 조정데이터를 필터링하고 정렬하여 원하는 형태로 만들어 데이터를 더 잘 이해할 수 있게 합..
2024.09.10 -
[Coursera Google] GCC 데이터 애널리틱스 : 데이터 정리 | 선택사항: 이력서에 데이터 추가
데이터 애널리스트 채용 과정데이터 애널리스트 입사 지원 과정 구직 활동의 주요 단계채용 공고 확인 및 조사:채용 사이트와 회사 웹사이트에서 원하는 직무를 찾고, 매칭되는 공고를 확인하세요.채용 알림 기능을 활용하면 새로운 공고가 게시될 때 빠르게 확인할 수 있습니다.지원하려는 회사에 대해 충분히 조사해보는 것이 중요합니다. 회사 문화, 직무 요구 사항 등을 잘 파악해야 합니다.이력서 준비:기본 이력서를 마련한 뒤, 지원하는 직무에 맞게 내용을 수정하는 것이 좋습니다.스프레드시트에 경력과 성과를 기록해 두면, 이력서를 업데이트할 때 유용하게 사용할 수 있습니다.네트워킹:LinkedIn과 같은 네트워킹 사이트에서 인맥을 활용해 추천서를 받거나 직무 정보를 알아낼 수 있습니다.직접적인 네트워크가 없다면, 관심..
2024.09.09 -
[Coursera Google] GCC 데이터 애널리틱스 : 데이터 정리 | 정리 결과 검증 및 보고
데이터 수동 정리결과 검증 및 보고 이 단계는 단순히 데이터가 깔끔하게 정리됐는지를 넘어서, 데이터의 **무결성(Integrity)**을 확인하는 중요한 과정입니다. 데이터가 정리되었지만, 작은 실수나 잘못된 입력이 남아 있을 수 있기 때문입니다. 또한 검증이 완료된 후에는 보고하는 절차도 필요합니다. 검증 과정에서 발견된 내용, 진행 상황, 데이터의 상태 등을 팀원들이나 이해관계자들에게 투명하게 공유하는 것이죠.1. 데이터 검증이란?데이터 검증은 정리된 데이터가 정확하고 신뢰할 수 있는지를 확인하는 단계입니다. 분석에 사용할 데이터가 올바른지 확인하는 과정으로, 이 작업이 제대로 이루어지지 않으면 분석의 결과도 신뢰할 수 없게 됩니다. 왜 검증이 중요한가요?데이터 검증은 작은 실수 하나가 큰 문제로 이..
2024.09.06 -
[Coursera Google] GCC 데이터 애널리틱스 : 데이터 정리 | SQL을 사용한 데이터 정리
SQL을 사용하여 데이터 정리 SQL 기능 이해 SQL이란 무엇인가?SQL(Structured Query Language, 구조적 쿼리 언어)은 데이터베이스와 상호작용하고 데이터를 처리하는 데 사용되는 언어입니다. 데이터 애널리스트는 SQL을 통해 대량의 데이터 세트를 효율적으로 처리하고, 수조 개의 행을 몇 초 만에 다룰 수 있습니다. 이를 통해 방대한 데이터를 빠르고 정확하게 처리할 수 있는 SQL의 강점이 부각됩니다.예를 들어, 전 세계 80억 명의 이름이 담긴 데이터 세트를 처리할 때 사람이 이를 모두 읽는 데 101년이 걸리지만, SQL은 이를 단 몇 초 만에 처리할 수 있습니다. 이는 스프레드시트와 같은 도구로는 처리하기 힘든 대규모 데이터를 SQL로 처리하는 이유 중 하나입니다. SQL의 역..
2024.09.05 -
[Coursera Google] GCC 데이터 애널리틱스 : 데이터 정리 | 깨끗하게 정리된 데이터
데이터 정리는 필수!정리하자! 정확하고 일관된 데이터는 모든 데이터 기반 분석의 기초가 됩니다. 그러나 많은 기업들이 매년 수조 달러를 잘못된 데이터로 인해 낭비하고 있다는 사실을 알고 계셨나요? IBM에 따르면, 미국에서는 매년 약 3조 1천억 달러가 저품질 데이터로 인해 손실된다고 합니다. 이는 데이터 품질이 비즈니스에 미치는 영향을 잘 보여주는 수치입니다. 더티 데이터와 클린 데이터더티 데이터는 불완전하거나, 부정확하거나, 해결하려는 문제와 관련이 없는 데이터입니다. 더티 데이터가 생성되는 주된 원인은 다음과 같습니다:입력 오류: 사용자가 데이터를 잘못 입력하거나, 서식을 다르게 하거나, 필드를 비워두는 경우.중복 데이터: 같은 데이터를 두 번 이상 입력하는 경우.시스템 결함: 데이터가 시스템 간에..
2024.09.04 -
[Coursera Google] GCC 데이터 애널리틱스 : 데이터 정리 | 무결성의 중요성
무결성에 초점 맞추기무결성에 초점 맞추기 개론 데이터 무결성의 중요성데이터 무결성이란 데이터의 정확성, 일관성, 완전성을 유지하는 것을 의미합니다. 이는 데이터가 변질되지 않고 원본의 상태를 유지하며, 모든 관련 데이터가 포함되어 있는 상태를 뜻합니다. 데이터 무결성은 데이터 분석의 신뢰성을 확보하는 데 필수적입니다. 데이터 무결성이 보장되지 않으면 분석 결과가 왜곡될 수 있으며, 비즈니스 결정에 잘못된 영향을 미칠 수 있습니다. 클린 데이터란?클린 데이터는 오류, 중복, 불완전성이 없는 데이터를 말합니다. 데이터 분석에서 클린 데이터는 필수적입니다. 클린 데이터가 아니면 분석 결과가 부정확하게 되고, 이에 따른 비즈니스 결정도 잘못될 가능성이 높아집니다.예를 들어, 앞서 설명한 중복 데이터의 경우처럼,..
2024.09.03