데이터구성(2)
-
[Coursera Google] GCC 데이터 애널리틱스 : R 프로그래밍을 사용한 데이터 분석 | R을 사용한 데이터 작업
데이터와 R 살펴보기R 데이터 프레임 데이터 프레임 및 Tibble 사용에 관한 요약데이터 프레임 정의데이터 프레임은 열의 모음으로, 스프레드시트나 SQL 테이블과 유사한 구조를 가집니다.각 열은 하나의 변수를 나타내며, 행에는 해당 변수에 대한 값이 포함됩니다.데이터 프레임은 데이터를 요약하고 사용하기 쉬운 형식으로 만들기 위해 사용됩니다.열 이름은 반드시 있어야 하며, 데이터 항목의 개수는 동일해야 합니다.데이터 프레임의 주요 속성데이터 프레임에는 수치, 팩터, 문자 등 다양한 데이터 유형이 포함될 수 있습니다.날짜, 타임스탬프, 논리 벡터와 같은 데이터 유형도 지원됩니다.각 열의 데이터는 일관된 개수를 가져야 하며, 데이터가 누락되더라도 행은 유지됩니다.Tibble이란?Tibble은 간소화된 데이터..
2024.10.01 -
[Coursera Google] GCC 데이터 애널리틱스 : 데이터 분석을 통한 해답 찾기 | 분석 시작 전 데이터 구성
데이터 분석의 기초분석 과정 1. 데이터 분석이란?정의: 데이터 분석은 수집된 데이터의 의미를 파악하고, 그 안에서 패턴과 관계를 찾아 결과를 도출하는 과정입니다.목표: 데이터를 통해 문제를 해결하거나 질문에 답할 수 있는 유용한 정보를 찾아내는 것이 목적입니다.2. 데이터 분석의 4단계분석 과정은 데이터를 정리하고, 해석하여 결과를 도출하는 일련의 단계를 포함합니다. 이 4단계를 자세히 알아보면:1. 데이터 구성데이터를 쉽게 이해할 수 있도록 정리하고 구조화하는 단계입니다.복잡한 데이터를 체계적으로 배열하여 분석을 쉽게 합니다.예시: 결혼 선물 목록에서 모든 데이터를 한눈에 보기 좋게 정리합니다.2. 형식 지정 및 조정데이터를 필터링하고 정렬하여 원하는 형태로 만들어 데이터를 더 잘 이해할 수 있게 합..
2024.09.10