고령 이용자 지하철 운임 손실 예측

Last updated on

고령 이용자 지하철 운임 손실 예측


Duration
2023.04 ~ 2023.05
Tech Stack
PythonTensorflowMachine LearningScikit-Learn
Roles
Product LeadData PreprocessingModel Tune

Abastract

선형 회귀 및 다항 회귀를 이용하여 데이터를 분석하고, 필요한 데이터를 가공하여 최종적으로 예측 모델을 개발했다. 수입액의 경우 약 0.2% 오차, 적자액의 경우 약 2% 오차의 성과를 만들어냈다.

Description

“지하철 이용자에 따른 적자를 예측할 수 있을까?”

“65세 이상 이용자가 적자에 영향을 끼칠까?”

노령 인구 증가 및 청, 장년층 인구 감소에 따라 만 65세 이상 노인 인구의 지하철 무임승차가 수도권 지하철의 적자에 끼치는 영향이 의문점으로 작용하여 이 프로젝트를 시작하였다.
기획을 할 당시 “예측이 가능할까?”라는 불확실한 답에서도 생각보다 정확한 답을 내어주어 놀랐던 경험이 있는 프로젝트이며, 머신러닝 분야에 처음으로 관심을 갖게 되었던 프로젝트이기도 했다.

생각보다 많지 않은 데이터양(2018년 ~ 2021년)과 코로나19로 인한 데이터의 일부 부재로 인해 높은 정확도를 보이진 않았지만 그럼에도 꽤나 작은 오차로 결론이 나왔으며, 더 많은 데이터가 있다면 다시 한 번 도전해보고자 한다.

Image