본문 바로가기

시각화2

pandas를 이용한 시계열 데이터 처리에 대해 안녕하세요! 제리입니다. 오늘은 시계열 데이터에 대해서 다뤄보는데 그 중 pandas를 사용한 방법에 대해서 소개하려고 합니다. 참고한 곳은 유데미 강의 중 '시계열 데이터 분석 with 파이썬' 입니다! 우선 시계열 데이터는 시간 속 데이터로 일반 데이터와 다른 특징을 지니고 있기에 다른 데이터 처리 방법을 사용해야합니다. 우선 코드로 간단히 한번 봐보시죠! 간단한 시계열 데이터 처리 from datetime import datetime # 시계열 데이터를 표현하는 라이브러리 중 하나 # 연, 월, 일, 시, 분, 초 이렇게 있으며 입력하지 않은 값은 자연스럽게 0으로 처리가 됩니다. my_date_time = datetime(my_year,my_month,my_day,my_hour,my_minute,.. 2023. 5. 3.
클러스터링(군집화) 알고리즘에 대해 안녕하세요! 제리입니다. 오늘은 클러스터링 알고리즘에 대해서 소개해볼까 합니다. 클러스터링이란? 흔히 군집화라고 하며 비지도 학습 (unsupervised learning)의 가장 일반적인 형태 중 하나라고 할 수 있습니다. 이것은 데이터 내에서 자연적인 그룹을 자동으로 발견을 하며 특히 아무것도 모르는 데이터를 탐색을 할 때 유용합니다. 그래서 흔히 데이터 분석할 때 많이 사용하여 군집별로 어떤 특성을 가지고 있는 지 파악해 아이디어를 도출합니다. 비지도 학습이란? 학습에는 지도학습, 비지도학습, 강화학습이 있습니다. (준지도학습도 있긴합니다.) 지도 학습 - 정답이 있는 데이터를 활용해 데이터 학습 비지도 학습 - 정답이 없는 데이터를 확룔해 비슷한 특징끼리 묶어 새로운 데이터 결과 예측 학습 강화학.. 2023. 5. 1.