Processing math: 100%
본문 바로가기
FastCampus X Upstage AI 부트캠프

AI lab 머신러닝 경진대회 부동산 예측 회고

by tankwoong 2024. 7. 20.
반응형

먼저 이전 프로젝트의 경험으로 baseline code를 먼저 제출하고 그것을 바탕으로 개선시키는 방법을 사용하였다.

아무래도 강남지역의 집값이 너무 급상승하다보니 그 부분에서 개선시킬만한 방법을 찾지 못해 아쉬웠고, 다음번에는 값이 급변하는 상황에서 해야되는 모델을 선택하고 싶다. 

그리고 앙상블 모델을 이번에는 시도를 많이 못 해보았는데 다음 번에는 모델 측면에서도 개선을 시켜보고 싶다.

팀의 목표와 나의 목표는 따로 없었던 것 같고, 일단 최대한 성능을 개선하는데 집중했던 것 같다. 

가장 잘했다고 생각하는 것은 backword selection으로 접근하는 것이 아니라 중요 feature를 먼저 뽑은 후 

forward selection으로 접근 한 것이 성능을 개선시키고, 데이터를 전처리하는데 중요한 역할을 한 것 같다.

원래는 backword selection으로 접근하고 있었는데, 나는 randomforest의 feature importance와  chatgpt가 뽑아준 중요 feature를 고려하면서 진행했고, 결론적으로 그것을 바탕으로 팀 작업이 진행되었다. 

신기했던 것은 실제 데이터와 chatgpt가 뽑아준 feature가 거의 일치했다는 것이었다. 

아쉬운 점은 상당한 시간을 피처를 개선하는데 쏟았고,그러다보니 모델 자체를 개선하고 앙상블 하는 데 초점을 맞추지 못한 것 같다. 팀은 매일 만나서 했는데, 아무래도 서로의 페이스가 다르다 보니 다음 번 부터는 내 페이스를 고려해서 팀에 참여해야할 것 같다. 쉬는 시간이 딱 정해진 것이 아니다보니 페이스 조절이 중요한 것 같고, 욕심내느라 건강을 잃지 않도록 중간 중간 쉬어가면서 너무 과몰입하지 않도록 주의해야 할 것 같다. 

반응형