본문 바로가기

전체 글14

pandas를 이용한 시계열 데이터 처리에 대해 안녕하세요! 제리입니다. 오늘은 시계열 데이터에 대해서 다뤄보는데 그 중 pandas를 사용한 방법에 대해서 소개하려고 합니다. 참고한 곳은 유데미 강의 중 '시계열 데이터 분석 with 파이썬' 입니다! 우선 시계열 데이터는 시간 속 데이터로 일반 데이터와 다른 특징을 지니고 있기에 다른 데이터 처리 방법을 사용해야합니다. 우선 코드로 간단히 한번 봐보시죠! 간단한 시계열 데이터 처리 from datetime import datetime # 시계열 데이터를 표현하는 라이브러리 중 하나 # 연, 월, 일, 시, 분, 초 이렇게 있으며 입력하지 않은 값은 자연스럽게 0으로 처리가 됩니다. my_date_time = datetime(my_year,my_month,my_day,my_hour,my_minute,.. 2023. 5. 3.
클러스터링(군집화) 알고리즘에 대해 안녕하세요! 제리입니다. 오늘은 클러스터링 알고리즘에 대해서 소개해볼까 합니다. 클러스터링이란? 흔히 군집화라고 하며 비지도 학습 (unsupervised learning)의 가장 일반적인 형태 중 하나라고 할 수 있습니다. 이것은 데이터 내에서 자연적인 그룹을 자동으로 발견을 하며 특히 아무것도 모르는 데이터를 탐색을 할 때 유용합니다. 그래서 흔히 데이터 분석할 때 많이 사용하여 군집별로 어떤 특성을 가지고 있는 지 파악해 아이디어를 도출합니다. 비지도 학습이란? 학습에는 지도학습, 비지도학습, 강화학습이 있습니다. (준지도학습도 있긴합니다.) 지도 학습 - 정답이 있는 데이터를 활용해 데이터 학습 비지도 학습 - 정답이 없는 데이터를 확룔해 비슷한 특징끼리 묶어 새로운 데이터 결과 예측 학습 강화학.. 2023. 5. 1.
Pandas에 대해 (Series, DataFrame) 안녕하세요! 제리입니다. 오늘은 데이터 분석에서 거의 필수 요소라고 생각되는 pandas에 대해서 다뤄보려고 합니다. Pandas란? 고수준의 자료 구조와 빠르고 쉬운 데이터 분석도구를 제공 Pandas에 대해서 알기 위해서는 Series와 DataFrame이라는 것을 먼저 알아야합니다. Series란? 일련의 객체를 담을 수 있는 1차원 배열 구조 넘파이의 배열과 유사하다고 보시면 될 것 같습니다! # numpy와 pandas의 경우 np, pd로 줄여서 사용합니다. import numpy as np import pandas as pd labels = ['a','b','c'] my_list = [10,20,30] arr = np.array([10,20,30]) # 딕셔너리 형태 d = {'a':10,'.. 2023. 4. 30.
개발자를 위한 머신러닝&딥러닝 안녕하세요! 제리입니다. 오늘 리뷰해볼 책은 바로 이 책입니다! 우선 인공지능에서 매우 유명한 앤드루 응님의 추천 도서라기에 너무너무 끌렸습니다!! ​ 번외이긴 하지만 앤드루 응님의 강의는 코세라에 무료로 한글 자막도 있으니 딥러닝 공부하기에 도움이 된다는 점! 참고바랍니다. ​ 다시 돌아와서 이 책을 좀 더 소개해보자면 이름부터 알수있듯이 개발자를 위한 AI 쪽이라고 보시면 될꺼 같습니다. ​ 제가 이 책을 선정한 이유도 요즘 인공지능을 활용한 앱, 웹 프로젝트가 있어야할 거 같다는 생각에 한번 읽어봤습니다. ​ 전체적인 목차는 https://www.hanbit.co.kr/store/books/look.php?p_code=B9073454247 위 사이트에서 확인을 하시면 좋으실 것 같고 사실 앞부분의 .. 2023. 4. 30.