10. 문자열 처리(String Handling)
문자열 다루기 기본 (String Basics)
문자열은 Python에서 중요한 데이터 타입으로, 인덱싱과 슬라이싱을 통해 특정 위치의 문자를 가져오거나 부분 문자열을 추출할 수 있습니다.
# 인덱싱과 슬라이싱 s = "Hello, World!" print(s[0]) # H print(s[-1]) # ! print(s[7:12]) # World print(s[:5]) # Hello print(s[7:]) # World!
문자열 메서드 활용 (String Methods)
Python의 문자열 메서드들은 문자열을 수정하고 조작하는 다양한 기능을 제공합니다. 예를 들어, split
, join
, replace
메서드는 각각 문자열을 분할, 결합, 대체하는 데 사용됩니다.
# split 메서드: 문자열 분할 sentence = "Python is awesome" words = sentence.split() print(words) # ['Python', 'is', 'awesome'] # join 메서드: 문자열 결합 joined_sentence = '-'.join(words) print(joined_sentence) # Python-is-awesome # replace 메서드: 문자열 대체 new_sentence = sentence.replace('awesome', 'great') print(new_sentence) # Python is great
정규 표현식 (Regular Expressions)
정규 표현식은 문자열 패턴을 정의하고 검색하거나 대체하는 데 사용됩니다. Python에서는 re
모듈을 사용하여 정규 표현식을 처리합니다.
import re # 정규 표현식 패턴 정의 pattern = r'\b\d{2}-\d{2}-\d{4}\b' # 날짜 형식 패턴 (dd-mm-yyyy) # 텍스트에서 패턴 검색 text = "생일은 01-07-1990 입니다." matches = re.findall(pattern, text) print(matches) # ['01-07-1990']
위 예제에서는 re.findall
메서드를 사용하여 텍스트에서 날짜 형식의 패턴을 검색합니다. 정규 표현식은 복잡한 문자열 패턴을 간편하게 처리할 수 있는 강력한 도구입니다.
문자열은 Python 프로그래밍에서 빈번하게 사용되며, 이러한 다양한 기능들을 활용하여 효과적으로 처리할 수 있습니다.