
엑셀에서 데이터를 깨끗하게 정리하는 것은 분석의 첫걸음이자 가장 중요한 과정입니다. 중복된 데이터는 보고서의 신뢰도를 떨어뜨리고 불필요한 수작업을 초래하죠. 이 글에서는 데이터를 훼손하지 않고 중복을 찾거나, 깔끔하게 삭제하는 등 여러분의 목적에 맞는 엑셀의 다양한 중복 데이터 제거 방법을 상세히 알아보겠습니다.
혹시 여러분의 엑셀 파일에도 숨겨진 중복 데이터가 있지는 않나요? 지금 바로 여러분의 파일 상태를 점검해보고, 어떤 방법이 가장 적합할지 함께 고민해 봅시다!
중복 행을 바로 삭제하는 ‘중복 항목 제거’
가장 빠르고 직접적으로 중복을 없애고 싶을 때는 엑셀의 ‘중복 항목 제거’ 기능을 활용할 수 있습니다. 이 기능은 지정된 열을 기준으로 완전히 동일한 값을 가진 행 전체를 영구적으로 삭제하여, 데이터에서 고유한 행만 남기는 방식입니다. 대규모 데이터에서 불필요한 중복을 일괄적으로 정리해야 할 때 매우 유용합니다.
사용 방법
- 중복을 검사할 데이터 범위를 드래그하여 선택합니다.
- 상단 메뉴의 데이터 탭으로 이동한 뒤, ‘데이터 도구’ 그룹에 있는 중복된 항목 제거 버튼을 클릭하세요.
- 나타나는 대화 상자에서 중복 여부를 판단할 기준이 될 열(들)을 선택합니다.
- 선택을 마친 후 확인을 누르면 중복된 행이 제거됩니다.
주의사항: 이 기능은 원본 데이터를 직접 수정하기 때문에, 중요한 데이터의 손실을 막기 위해 사전에 반드시 백업 복사본을 만들어 두는 것을 권장합니다.
데이터를 보존하며 중복을 시각적으로 확인하는 방법
데이터를 삭제하지 않고 중복 현황만 빠르게 파악하고 싶을 때는 ‘조건부 서식’이 최적의 선택입니다. 이 기능은 중복된 셀에 특정 색상이나 서식을 적용하여 사용자가 한눈에 중복을 식별할 수 있도록 돕습니다. 데이터를 직접 정리하기 전에 전체적인 중복 현황을 시각적으로 분석하는 데 효과적입니다.
사용법
- 먼저 중복을 찾을 데이터 범위를 선택합니다.
- 홈 탭으로 이동한 후 ‘스타일’ 그룹에 있는 조건부 서식을 클릭합니다.
- 드롭다운 메뉴에서 셀 강조 규칙을 선택하고, 중복 값을 선택하세요.
- 나타나는 대화 상자에서 적용하고 싶은 서식을 지정하고 확인을 누르면, 중복 값이 포함된 셀이 자동으로 강조되어 표시됩니다.
원본 데이터 손상 없이 고유 목록을 만드는 ‘UNIQUE’ 함수
Microsoft 365 또는 Excel 2021 이상 버전을 사용하고 있다면, UNIQUE 함수를 이용해 원본 데이터를 건드리지 않고 중복이 제거된 새로운 목록을 만들 수 있습니다. 이 동적 배열 함수는 복잡한 절차 없이 단 하나의 셀에 수식을 입력하는 것만으로 결과를 반환하는 혁신적인 방식입니다.
함수 사용법
결과가 표시되길 원하는 셀에 간단히 =UNIQUE(범위)
와 같이 수식을 입력하면 됩니다. 예를 들어, A1부터 A100까지의 데이터에서 고유한 값만 추출하고 싶다면 =UNIQUE(A1:A100)
을 입력합니다. 그러면 함수가 자동으로 결과를 배열 형태로 확장하여(스필) 표시해줍니다.
UNIQUE 함수의 가장 큰 장점은 원본 데이터를 그대로 유지한 채, 중복이 제거된 목록을 실시간으로 참조할 수 있다는 점입니다. 원본 데이터에 변화가 생기면 추출된 목록도 자동으로 업데이트됩니다.
엑셀 중복 처리 3가지 방법 비교
방법 | 특징 | 주요 사용 목적 |
---|---|---|
중복 항목 제거 | 원본 데이터 직접 수정(삭제) | 불필요한 중복 행 일괄 삭제 |
조건부 서식 | 데이터 보존, 시각적 강조 | 중복 현황 파악 및 분석 |
UNIQUE 함수 | 원본 보존, 새로운 목록 생성 | 실시간으로 중복 제거된 고유 목록 참조 |
상황에 맞는 최적의 방법 선택하기
엑셀에서 중복 데이터를 처리하는 방법은 단순히 삭제하는 것 외에도 시각적으로 확인하거나, 새로운 목록을 만드는 등 다양합니다. 각 방법은 고유한 장점을 가지고 있으며, 작업의 목적과 데이터의 중요도에 따라 가장 효율적인 방법을 선택하는 것이 핵심입니다.
‘중복 항목 제거’는 데이터베이스에서 불필요한 행을 신속하게 정리할 때, ‘조건부 서식’은 데이터를 삭제하지 않고 중복 현황을 한눈에 파악할 때 유용합니다. 마지막으로, ‘UNIQUE’ 함수는 원본 데이터를 안전하게 보존하면서 실시간으로 중복이 제거된 목록을 얻고 싶을 때 가장 적합합니다. 이 세 가지 방법을 적절히 활용하여 데이터 관리의 효율을 극대화해 보세요.
이 세 가지 방법 중 어떤 방법이 여러분의 작업 스타일에 가장 잘 맞나요? 여러분의 경험을 댓글로 공유해 주세요!
자주 묻는 질문
‘중복 항목 제거’와 ‘UNIQUE’ 함수의 차이점은 무엇인가요?
답변: ‘중복 항목 제거’는 원본 데이터를 영구적으로 삭제합니다. 반면 ‘UNIQUE’ 함수는 원본을 훼손하지 않고 중복이 제거된 새로운 목록을 동적 배열로 반환합니다. 즉, 원본 데이터 보존 여부가 가장 큰 차이입니다.
여러 열을 기준으로 중복을 제거할 수 있나요?
답변: 네, 가능합니다. ‘중복 항목 제거’ 기능 사용 시 대화 상자에서 중복 여부를 판단할 여러 열을 동시에 선택할 수 있습니다. ‘이름’과 ‘생년월일’ 두 값이 모두 동일한 경우에만 중복으로 간주하여, 더욱 정확하고 유의미한 고유 레코드를 식별할 수 있습니다.
‘서울’과 ‘서울 ‘처럼 공백이 다른 데이터도 중복으로 인식하나요?
답변: 엑셀은 공백을 포함한 모든 문자를 다르게 인식합니다. 따라서 중복 제거 전에 불필요한 공백이나 대소문자를 통일하는 데이터 전처리 과정이 필요합니다. 아래 함수들을 활용하면 효과적입니다.
TRIM
: 앞뒤 공백 제거UPPER
또는LOWER
: 대소문자 통일