먼저 이전 프로젝트의 경험으로 baseline code를 먼저 제출하고 그것을 바탕으로 개선시키는 방법을 사용하였다.
아무래도 강남지역의 집값이 너무 급상승하다보니 그 부분에서 개선시킬만한 방법을 찾지 못해 아쉬웠고, 다음번에는 값이 급변하는 상황에서 해야되는 모델을 선택하고 싶다.
그리고 앙상블 모델을 이번에는 시도를 많이 못 해보았는데 다음 번에는 모델 측면에서도 개선을 시켜보고 싶다.
팀의 목표와 나의 목표는 따로 없었던 것 같고, 일단 최대한 성능을 개선하는데 집중했던 것 같다.
가장 잘했다고 생각하는 것은 backword selection으로 접근하는 것이 아니라 중요 feature를 먼저 뽑은 후
forward selection으로 접근 한 것이 성능을 개선시키고, 데이터를 전처리하는데 중요한 역할을 한 것 같다.
원래는 backword selection으로 접근하고 있었는데, 나는 randomforest의 feature importance와 chatgpt가 뽑아준 중요 feature를 고려하면서 진행했고, 결론적으로 그것을 바탕으로 팀 작업이 진행되었다.
신기했던 것은 실제 데이터와 chatgpt가 뽑아준 feature가 거의 일치했다는 것이었다.
아쉬운 점은 상당한 시간을 피처를 개선하는데 쏟았고,그러다보니 모델 자체를 개선하고 앙상블 하는 데 초점을 맞추지 못한 것 같다. 팀은 매일 만나서 했는데, 아무래도 서로의 페이스가 다르다 보니 다음 번 부터는 내 페이스를 고려해서 팀에 참여해야할 것 같다. 쉬는 시간이 딱 정해진 것이 아니다보니 페이스 조절이 중요한 것 같고, 욕심내느라 건강을 잃지 않도록 중간 중간 쉬어가면서 너무 과몰입하지 않도록 주의해야 할 것 같다.