logo
그린텍 하수처리 수질 예측 AI
하수처리공정 수질 예측 및 이상탐지
약 4개월
2024.07 ~ 2024.11
PL (팀 2명: 본인 포함)
개발자 2명

하수처리장의 공정 단계별 수질 예측 모델 개발 및 실시간 이상 탐지 시스템. 19개 타겟 변수에 대한 예측 모델 구축으로 품질 Hunting 최소화 및 안정 운전 지원.

기술 스택

ml

PyTorch
LightGBM
XGBoost
CatBoost

anomaly

PyOD
COMBO

dataprocessing

NumPy
Pandas
Numba

visualization

Matplotlib
Seaborn
Plotly Dash

backend

Flask
Gunicorn

timeseries

statsmodels

deployment

Docker

주요 성과

T-N 방류수 예측
Before:-
After:R² 0.9244
RandomForest
TOC 방류수 예측
Before:-
After:R² 0.8640
CatBoost
이상 탐지 정확도
Before:-
After:98.50%
Random Forest

주요 기능

도전 과제 및 극복

시계열 데이터 처리

결측치, 이상치가 많은 공정 데이터. 도메인 지식 기반 전처리 및 피처 엔지니어링으로 해결

모델 선택

다양한 ML/DL 모델 실험 필요. 체계적인 실험 관리 및 성능 비교로 최적 모델 도출

배운 점 및 성장

  • 앙상블 모델의 강력함: 단일 모델 대비 성능 향상
  • 도메인 지식의 중요성: 하수처리 공정 이해가 피처 엔지니어링에 핵심
  • 실시간 시스템 구축: 배치 예측과 실시간 모니터링의 차이
  • 클라이언트 커뮤니케이션: 기술 용어를 비즈니스 가치로 전달