Python의 세트(Set) 데이터 구조
카테고리
프로그래밍/소프트웨어 개발
서브카테고리
데이터 분석
대상자
- Python 초보 개발자 및 데이터 처리 분야에 관심 있는 사람들*
- 기초 수준의 데이터 구조 이해가 필요한 학습자*
핵심 요약
- 세트는 중복을 허용하지 않는 불변 요소의 무순서 컬렉션
add()
및update()
메서드를 통해 요소 추가 가능remove()
는 요소 누락 시 예외 발생,discard()
는 예외 없이 처리- 집합 연산:
intersection()
,difference()
,symmetric_difference()
사용
섹션별 세부 요약
1. 세트의 기본 특성
- 무순서성: 요소 순서는 출력 시 변경 가능
- 예:
{'Cherry', 'Banana', 'Apple'}
→{ 'Banana', 'Cherry', 'Apple'}
- 중복 제거: 중복된 요소는 자동으로 제거
- 예:
{1,2,3,1,2} → {1,2,3}
2. 요소 추가 및 제거
- 추가 메서드:
add()
→ 단일 요소 추가:my_set.add(6)
update()
→ 리스트/세트로 추가:my_set.update([6,7,8])
- 제거 메서드:
remove()
→ 요소 누락 시KeyError
발생discard()
→ 요소 누락 시 예외 없이 처리
3. 집합 연산
- 공통 요소:
intersection()
- 예:
{1,2,3} & {3,4} → {3}
- 차집합:
difference()
- 예:
{1,2,3} - {3,4} → {1,2}
- 대칭 차집합:
symmetric_difference()
- 예:
{1,2,3} ^ {3,4} → {1,2,4}
4. 기타 참고 사항
- 문서 내부 링크: 다른 Python 주제(클래스, 상속, 람다 함수 등) 포함
- Heroku 프로필 이미지: 관련 없음(예시로 포함됨)
결론
- 세트 연산 시
discard()
메서드 사용 권장으로 예외 처리 방지 - 데이터 중복 제거 및 집합 연산이 필요한 경우 세트 자료형 활용
intersection()
,difference()
등은 데이터 분석/처리에서 유용한 기능