본문 바로가기

전체 글14

시계열 공부 (2) - ARIMA 모형 안녕하세요! 제리입니다. 이번에도 DMQA 김성범 교수님의 ARIMA 모형 강의를 내용을 토대로 작성했습니다. https://www.youtube.com/watch?v=ma_L2YRWMHI&list=PLpIPLT0Pf7IqSuMx237SHRdLd5ZA4AQwd&index=9 정상 프로세스 (Stationary Process) : 시간에 관계 없이 평균과 분산이 일정한 시계열 데이터 정상성 확인 (Autocorrelation Function 패턴) Lag1 : 현 시점과 한 시점 미룬 데이터와의 차이 Lag2 : 현 시점과 두 시점 미룬 데이터와의 차이 PACF(Partial AutoCorrelation Function) : 특정한 패턴 없이 랜덤할 경우 stationary 하다고 할 수 있다 (정상) N.. 2023. 6. 27.
시계열 공부 (1) - 시계열회귀분석 안녕하세요! 제리입니다. DMQA 김성범교수님 유튜브인 Time Series Regression (1)~(3) 강의를 보며 정리했습니다. https://www.youtube.com/watch?v=7Do_hixXCpc 시계열 데이터 : 시간의 흐름에 따라 순서대로 관측되어 시간의 영향을 받게 되는 데이터로 일, 달, 분기, 년 등 구성 – 추세(trend), 순환(cycle), 계절(seasonal variations), 우연(random fluctuation) 추세 : 시간이 경과함에 따라 관측값이 지속적으로 증가하거나 감소하는 추세를 갖는 경우의 변동 (Downward, Upward) 순환, 주기 : 주기적인 변화를 가지거나, 계절에 의한 것이 아니고 주기가 긴 경우의 변동 계절 : 주별, 월별, 계졀.. 2023. 6. 27.
one class svm (1-svm)에 대해서 안녕하세요! 제리입니다. 이번 참고 자료는 이곳! https://www.youtube.com/watch?v=OmK_GQ40yko&t=2267s 정상 데이터를 최대한 원점에서 멀어지도록 하는 것이 포인트 (hyperplane을 찾는 것이 목표) 최적화 문제에서 w는 regularization을 진행하며 이를 min을 통해 최소화 시켜준다. ==> 모델의 변동성 감소 두번째의 경우 정상 값이 로우보다 가까울 때 패널티를 주는 것으로 정상 데이터는 원점보다 바깥 쪽에 존재하도록 하는 거임 -> 그렇지 않을 경우 패널티 term ==> 조건에 맞지 않을 시 패널티 부여 로우는 원점에서 최대한 멀리 떨어진 hyperplane과의 거리 ==> 결정 경계 예측 4번째 식은 개별적 객체는 원점보다 멀리 있도록 하고 아.. 2023. 5. 19.
isolation forest에 대해서 안녕하세요! 제리입니다. 참고 자료는 이곳! https://www.youtube.com/watch?v=puVdwi5PjVA&t=1s isolation forest에서의 가정 1. 이상점은 minority니까 훨씬 더 적은 개수의 객체들로 구성되어 있을 것이다. 2. 객체들은 노멀 범주 객제와 매우 다른 속성 값을 가지고 있을 것이다. => 그렇기에 isolate (고립)을 시키기 쉬울 것이다. (적은 split으로 분리가 가능할 것이다.) 랜덤 variable에 랜덤 value로 split을 해서 이상 값이 속하지 않은 곳은 고려하지 않음 -> 계속 랜덤하게 해서 split하고 버려서 이상 값을 고립 시키기 위해서 몇번의 split이 되는 지를 작성 랜덤에 랜덤을 하게 충분히 많은 횟수를 하게 된다면, .. 2023. 5. 19.