데이터관리(11)
-
SQLD 자격증 정보 및 이론 학습 | 데이터 모델과 SQL(정규화, 반정규화)
데이터 모델링과 SQL 정규화 vs 반정규화정규화(Normalization) : 데이터베이스에서 데이터를 효율적으로 저장하고 중복을 최소화 하기위해 테이블을 구조화하는 과정, 정규화의 주요 목표는 데이터 일관성을 유지하고 저장소의 무결성을 보장하는 것반정규화(Denormalization) : 반정규화는 성능 향상을 위해 정규화된 데이터베이스 구조를 일부러 역행하는 과정, 정규화된 구도는 데이터 무결성을 유지하는데 도움이 되지만 쿼리 성능이 떨어질 수 있음, 반정규화는 이러한 성능 문제를 해결하기 위해 데이터를 중복 저장하거나, 데이터 조인을 줄이는 등의 방법을 사용 정규화(Normalization)정규화를 하면 일반적으로 조회 성능은 향상되거나 하락(테이블이 많이 분리되기 때문에 원하는 결과를 얻으려면 ..
2024.10.18 -
[Coursera Google] GCC 데이터 애널리틱스 : 데이터 분석을 통한 해답 찾기 | 데이터 계산
데이터 계산 시작하기데이터 계산 1. 데이터 분석에서의 효율성SQL 사용의 중요성: Google에서의 경험을 공유하며, SQL을 통해 데이터를 가져오고 분석하는 것이 업무 효율성을 크게 향상시켰다는 내용을 강조합니다.효율적 작업: 분석 시간 단축과 성과 향상을 위해 SQL을 활용한 사례 소개.2. 스프레드시트 기본 계산식기본 계산식: 스프레드시트의 기본 계산식을 살펴보고 이를 활용해 효율적인 계산을 진행합니다.IF 함수: 조건부 수식을 통해 특정 조건을 충족하는 데이터를 필터링하고 계산할 수 있는 방법을 다룹니다.3. SUMPRODUCT 함수SUMPRODUCT의 활용: 덧셈과 곱셈을 한 번에 처리하여 분석 속도를 5배 이상 향상시키는 방법을 소개합니다.4. 피벗 테이블피벗 테이블 복습: 피벗 테이블을 ..
2024.09.13 -
[Coursera Google] GCC 데이터 애널리틱스 : 데이터 분석을 통한 해답 찾기 | 분석을 위한 데이터 집계
VLOOKUP으로 데이터 집계분석을 위한 데이터 집계 데이터 집계 및 집계의 중요성데이터 집계란 여러 개별 데이터를 수집하거나 모아서 하나의 완전한 데이터로 결합하는 과정입니다. 쉽게 말해, 여러 조각의 데이터를 하나의 큰 그림으로 만드는 작업입니다. 1. 집계의 개념집계란 단어는 여러 요소를 모아 하나의 집합체로 만드는 과정을 의미합니다. 예를 들어, 은하수는 별, 먼지, 가스가 모여 이루어진 집합체입니다. 마찬가지로, 데이터 집계는 서로 다른 데이터 소스에서 데이터를 모아서, 하나의 요약된 데이터 모음으로 결합하는 것을 말합니다.2. 데이터 집계의 예시퍼즐 예시: 캐비닛에 여러 개의 퍼즐이 들어있는 상자들이 있다고 가정해 봅시다. 어느 날 선반이 부서지면서 퍼즐 상자들이 넘어지고, 퍼즐 조각들이 사..
2024.09.12 -
[Coursera Google] GCC 데이터 애널리틱스 : 데이터 분석을 통한 해답 찾기 | 데이터 형식 지정 및 조정
데이터 변환 및 형식 지정한 가지 유형에서 다른 유형으로 1. 데이터 형식 지정의 중요성데이터를 변환하지 않으면 스프레드시트가 잘못된 방식으로 데이터를 해석할 수 있습니다. 예를 들어, 날짜 형식으로 변환하지 않으면 날짜가 알파벳순으로 정렬될 수 있습니다.일관되지 않은 단위(예: 미국 달러와 영국 파운드)가 혼재되어 있을 경우, 분석 전에 이를 통일하는 작업이 필요합니다.2. 스프레드시트에서 데이터 형식 지정하기숫자 형식을 변환하는 방법툴바에서 데이터 형식을 지정할 수 있습니다. 숫자, 화폐, 날짜, 백분율 등의 옵션을 선택하여 데이터의 형식을 일관되게 설정할 수 있습니다.예를 들어, 화폐 형식으로 변환하려면 해당 열을 선택한 후, 툴바에서 화폐 아이콘을 클릭하면 됩니다.예시:영화 데이터에서 예산 열을..
2024.09.11 -
[Coursera Google] GCC 데이터 애널리틱스 : 데이터 정리 | 선택사항: 이력서에 데이터 추가
데이터 애널리스트 채용 과정데이터 애널리스트 입사 지원 과정 구직 활동의 주요 단계채용 공고 확인 및 조사:채용 사이트와 회사 웹사이트에서 원하는 직무를 찾고, 매칭되는 공고를 확인하세요.채용 알림 기능을 활용하면 새로운 공고가 게시될 때 빠르게 확인할 수 있습니다.지원하려는 회사에 대해 충분히 조사해보는 것이 중요합니다. 회사 문화, 직무 요구 사항 등을 잘 파악해야 합니다.이력서 준비:기본 이력서를 마련한 뒤, 지원하는 직무에 맞게 내용을 수정하는 것이 좋습니다.스프레드시트에 경력과 성과를 기록해 두면, 이력서를 업데이트할 때 유용하게 사용할 수 있습니다.네트워킹:LinkedIn과 같은 네트워킹 사이트에서 인맥을 활용해 추천서를 받거나 직무 정보를 알아낼 수 있습니다.직접적인 네트워크가 없다면, 관심..
2024.09.09 -
[Coursera Google] GCC 데이터 애널리틱스 : 데이터 정리 | 정리 결과 검증 및 보고
데이터 수동 정리결과 검증 및 보고 이 단계는 단순히 데이터가 깔끔하게 정리됐는지를 넘어서, 데이터의 **무결성(Integrity)**을 확인하는 중요한 과정입니다. 데이터가 정리되었지만, 작은 실수나 잘못된 입력이 남아 있을 수 있기 때문입니다. 또한 검증이 완료된 후에는 보고하는 절차도 필요합니다. 검증 과정에서 발견된 내용, 진행 상황, 데이터의 상태 등을 팀원들이나 이해관계자들에게 투명하게 공유하는 것이죠.1. 데이터 검증이란?데이터 검증은 정리된 데이터가 정확하고 신뢰할 수 있는지를 확인하는 단계입니다. 분석에 사용할 데이터가 올바른지 확인하는 과정으로, 이 작업이 제대로 이루어지지 않으면 분석의 결과도 신뢰할 수 없게 됩니다. 왜 검증이 중요한가요?데이터 검증은 작은 실수 하나가 큰 문제로 이..
2024.09.06 -
[Coursera Google] GCC 데이터 애널리틱스 : 데이터 정리 | SQL을 사용한 데이터 정리
SQL을 사용하여 데이터 정리 SQL 기능 이해 SQL이란 무엇인가?SQL(Structured Query Language, 구조적 쿼리 언어)은 데이터베이스와 상호작용하고 데이터를 처리하는 데 사용되는 언어입니다. 데이터 애널리스트는 SQL을 통해 대량의 데이터 세트를 효율적으로 처리하고, 수조 개의 행을 몇 초 만에 다룰 수 있습니다. 이를 통해 방대한 데이터를 빠르고 정확하게 처리할 수 있는 SQL의 강점이 부각됩니다.예를 들어, 전 세계 80억 명의 이름이 담긴 데이터 세트를 처리할 때 사람이 이를 모두 읽는 데 101년이 걸리지만, SQL은 이를 단 몇 초 만에 처리할 수 있습니다. 이는 스프레드시트와 같은 도구로는 처리하기 힘든 대규모 데이터를 SQL로 처리하는 이유 중 하나입니다. SQL의 역..
2024.09.05