[Coursera Google] GCC 데이터 애널리틱스 : 데이터 정리 | 깨끗하게 정리된 데이터
데이터 정리는 필수!정리하자! 정확하고 일관된 데이터는 모든 데이터 기반 분석의 기초가 됩니다. 그러나 많은 기업들이 매년 수조 달러를 잘못된 데이터로 인해 낭비하고 있다는 사실을 알고 계셨나요? IBM에 따르면, 미국에서는 매년 약 3조 1천억 달러가 저품질 데이터로 인해 손실된다고 합니다. 이는 데이터 품질이 비즈니스에 미치는 영향을 잘 보여주는 수치입니다. 더티 데이터와 클린 데이터더티 데이터는 불완전하거나, 부정확하거나, 해결하려는 문제와 관련이 없는 데이터입니다. 더티 데이터가 생성되는 주된 원인은 다음과 같습니다:입력 오류: 사용자가 데이터를 잘못 입력하거나, 서식을 다르게 하거나, 필드를 비워두는 경우.중복 데이터: 같은 데이터를 두 번 이상 입력하는 경우.시스템 결함: 데이터가 시스템 간에..
2024.09.04