본문 바로가기

regular_expression3

[텍데분] Regular Expression 3 Python으로 Regular Expression 사용하기 정규표현식 사용위한 모듈 import import re 패턴 생성하기 re.compile() # 패턴 [a-Z] 생성 p = re.compile('[a-Z]') print(type(p)) # print(p.__class__.__name__) # Pattern # 패턴은 Pattern이라는 클래스의 객체 Pattern 객체의 메소드 match() : 문자열의 처음부터 패턴과 매칭되는지 확인 match()로 생성되는 결과물은 Match라는 클래스의 객체 → 메소드 사용 가능 Match클래스 메소드: group(), start(), end(), span() ... search() : 문자열 전체를 탐색하여 정규식과 매칭되는지 확인 findall() :.. 2023. 4. 12.
[텍데분] Regular Expression 2 Regular Expression 사용하기 실습 환경| RegExr: Learn, Build, & Test RegEx 패턴을 입력하면, 입력한 텍스트에서 패턴과 일치하는 텍스트를 찾아줌 문자클래스 [ ] 대괄호 [ ] 안에 있는 문자들과 매치하라는 의미 [abcde]: 문자열에서 a,b,c,d,e와 매칭이 되는 부분 탐색 [12345]: 문자열에서 1,2,3,4,5와 매칭이 되는 부분 탐색 하이픈 - 을 사용해서 범위 지정도 가능 [a-e]: 문자열에서 a,b,c,d,e와 매칭이 되는 부분 탐색 [1-5]: 문자열에서 1,2,3,4,5와 매칭이 되는 부분 탐색 → [abcde]와 [a-e] / [12345]와 [1-5]는 동일한 의미인 것 대괄호 내에 여러 개의 패턴 사용 가능 [dn]a → da, na.. 2023. 4. 12.
[텍데분] Regular Expression 1 Regular Expression 정규표현식 특정한 문자의 패턴을 정의하는 방식 특정한 규칙을 가진 문자열 탐색 ex. 이메일 주소만 추출, 전화번호만 추출, ip주소만 추출 정규표현식 활용 방법 데이터 수집하기 특정한 패턴을 갖는 데이터만 수집 데이터 전처리하기 특정 패턴을 갖고 있는 데이터 제거 정규표현식 활용 예시 파이썬에서 정규표현식을 사용하기 위해서는 re라는 모듈 불러와서 사용 # 휴대폰 번호 가운데 자리를 *로 변경 data = \ """kim 010-1234-5678 park 010-8765-4321""" # 정규표현식 미사용 result = [] for line in data.split('\n'): tmp_result = [] for word in line.split(' '): if le.. 2023. 4. 12.