데이터 클리닝 팁 & 블로그

데이터세탁소에서 제공하는 실무에 당장 써먹을 수 있는 데이터 전처리 및 정제 노하우들을 정리했습니다.

2024-03-12

이메일 마스킹은 어떻게 해야 안전할까?

고객 데이터나 개인정보가 포함된 엑셀 파일을 공유할 때, 이메일 마스킹은 필수입니다. 가장 보편적인 규칙은 무엇일까요?

표준 이메일 마스킹 규칙

일반적으로 ID의 앞 3자리를 남기고 나머지를 별표(*) 처리하는 방식이 가장 많이 쓰입니다.

  • 예시 1: hello@gmail.com → hel**@gmail.com
  • 예시 2: kim@naver.com → kim@naver.com (ID가 짧으면 첫 글자만 남김)
# 고객 데이터 공유 시 필수적인 이메일 마스킹의 표준 규칙과 안전한 처리 방법을 알아봅니다.
2024-03-05

B2B 영업 시 엑셀 데이터 전처리 노하우

회사명이 통일되지 않으면 CRM 업로드 시 데이터가 분산됩니다. "(주)"와 "주식회사" 수식어를 제거하여 순수한 명칭만 남기는 것이 핵심입니다.

전처리 팁

자연어 프롬프트에 "회사명에서 (주)와 주식회사라는 단어를 삭제해줘"라고 입력하면 한 번에 수만 건을 정제할 수 있습니다.

# 회사명 데이터의 불일치(주식회사, (주) 등)를 해결하여 CRM 중복 등록을 방지하는 방법.
2024-02-28

전화번호 하이픈(-) 정규화 패턴의 이해

01012345678, 010.1234.5678 등 다양한 데이터를 표준 하이픈 형식으로 맞추는 법을 알아봅니다. 엑셀 수식 없이 데이터세탁소 엔진으로 한 번에 처리하세요.

# 다양한 형식의 전화번호를 010-XXXX-XXXX 표준 포맷으로 한 번에 통일하는 방법.
2024-02-21

엑셀 지수(1.23E+11) 현상 해결하기

엑셀에서 긴 숫자를 입력하면 1.23E+11처럼 보이는 현상이 있습니다. 이는 데이터 유실이 아닌 표시 형식의 문제입니다.

데이터세탁소의 '엑셀 지수 복원' 기능을 사용하면 텍스트 형식을 유지하며 원본 숫자를 완벽하게 되찾을 수 있습니다.

# 긴 숫자(운송장, 계좌번호)가 지수로 변환되어 깨지는 현상을 완벽하게 복구하는 팁.
2024-02-14

개인정보 보호를 위한 주민번호 처리 가이드

주민번호 전체를 수집하는 것은 위험합니다. 뒷자리는 마스킹하고, 분석에 필요한 '나이'와 '성별' 정보만 추출하는 것이 현명한 방법입니다.

# 주민등록번호 뒷자리 마스킹 및 연령대 추출을 활용한 데이터 보존과 보안의 균형.

전체 16개의 포스트 중 1-5 표시