시기
프로젝트 소개
개발 환경
항목 | |
---|---|
O/S | Ubuntu 20.04 |
언어 | Python |
프레임 워크 | Pytorch, Numpy, Scikit-learn, Pandas, transformers |
misc | Docker, Jupyter lab server |
인력 구성
역할
KocoHub, SmileGate AI, Kaggle의 데이터 셋 전처리 작업 수행
레이블 불균형 문제를 위해 데이터 증강 옵션 구현
[사진 1] 데이터 증강 전, 증강 후 데이터 분포
Huggingface API를 이용해 KcELECTRA 신경망을 fine-tuning 후 학습
[사진 2] 검증 데이터 셋 검증 평가 지표
[사진 3] 시험 데이터 셋 검증 평가 지표