문자열 자료형(String type)과 관련된 함수들을 알아보겠다.
1. count 함수
- 문자열 내 특정 문자를 포함한 횟수 반환
- Syntax: 문자열.count('문자')
str = "나는야 퉁퉁이. 골목대장이라네. 나는야 퉁퉁이. 골목골목골목골목"
print(str.count('퉁'))
# 출력 → 4
print(str.count('골'))
# 출력 → 5
# 머신러닝, 딥러닝에서 일상어 분석 시 주로 사용
2. strip 함수
- 문자열 양쪽의 공백 삭제
- Syntax: 문자열.strip()
str1 = " 아메리카노 "
str2 = str1.strip()
# 함수의 결과물을 원래 변수 or 새 변수에 저장
print(str1)
# 출력 → 아메리카노
print(str2)
# 출력 → 아메리카노
# 데이터 수집 시 공백 제거 처리
3. replace 함수
- 특정 문자를 다른 문자로 대체
- Syntax: 문자열.replace(대체될 문자, 대체할 문자)
str3 = "야 이 바보야"
print(str3 + "..를 순화하면")
# 출력 → 야 이 바보야..를 순화하면
str3 = str3.replace("야 이 바보", "모자라지만 착한 친구")
print(str3)
# 출력 → 모자라지만 착한 친구야
# 게임이나 채팅 앱에서 비속어 대체 시 사용(필터링)
4. split 함수
- 문자열을 구분자 기준으로 자르는 함수
- Syntax: 문자열.split(구분자)
str4 = "앗 음 그게 아니라 음 뭐라고 해야 하지 음 잘 모르겠다 음"
# 구분자 입력하지 않으면 공백 기준으로 문자열을 자름
result = (str4.split('음'))
# split의 결과물은 list 타입으로 반환
print(result)
# 출력 → ['앗 ', ' 그게 아니라 ', ' 뭐라고 해야 하지 ', ' 잘 모르겠다 ', '']
# 자료형 확인
type(result)
# list type
'Python > Python Study' 카테고리의 다른 글
| [Python Study] Operator(연산자) (0) | 2024.02.15 |
|---|---|
| [Python Study] input Function(input 함수) (0) | 2024.02.15 |
| [Python Study] Formatting (0) | 2024.02.14 |
| [Python Study] Indexing & Slicing (0) | 2024.02.14 |
| [Python Study] 기초 (2) | 2024.02.14 |