본문 바로가기

AUTOML3

[ML] TPOT 사용해보기 (optuna와 비교) 데이터는 전에 뇌졸중 데이터를 전처리 했던 걸로 사용했다. train, test 나누기 from sklearn.model_selection import train_test_split Stroke = Stroke.iloc[:,1:] train, test = train_test_split(Stroke, test_size=0.3) X_train = train.iloc[:,:-1] y_train = train.iloc[:,-1].reset_index()[['stroke']] X_test = test.iloc[:,:-1] y_test = test.iloc[:,-1].reset_index()[['stroke']] 옵튜나를 활용해서 XGBClassifier 튜닝하기 TPOT을 활용 위 결과에서는 TPOT의 결과 XG.. 2022. 4. 27.
[ML] TPOT TPOT? 머신러닝 pipeline을 최적화 하는 Python AutoML 툴이다. 수천 개의 사용가능한 파이프라인을 지능적으로 탐색해서 가장 적합한 파이프라인을 찾아낸다. TPOT가 검색을 마치면 Python 코드로 파이프라인을 확인할 수 있어, 파이프라인을 고칠 수도 있다. TPOT은 Skickit-learn 위에 구축되어있어 sklearn과 유사하다. 아직 개발 중이라 업데이트를 위해서 정기적으로 repository를 확인하는 것이 좋다. 설치 TPOT은 기존의 여러 Python 라이브러리 위에 빌드되어 있어 아래의 패키지를 설치해야한다. NumPy SciPy scikit-learn DEAP update_checker tqdm stopit pandas joblib xgboost 파이썬 버전 3.4 .. 2022. 4. 27.
[ML] AutoML AutoML Automated machine learning, 자동 기계 학습 말그대로 Machine Learning을 적용하는 작업을 자동화하는 과정이다. 원본 데이터 셋에서 시작하는 것부터 학습된 머신러닝 모델을 만드는 것까지 모든 단계가 포함될 수 있다. AutoML의 목표 데이터 준비 및 수집 (원본 데이터 & 기타 형식) column 타입 찾기 (ex. boolean, int, float, string) column 파악 (ex. target/label, 계층화 필드, 숫자 피쳐, 범주형 피쳐, 자유 텍스트 피쳐) task 찾기 (ex. 이항분류(binary classification), 회귀분석(regression), 클러스터링(clustering), 순위(ranking)) Feature en.. 2022. 4. 27.