본문 바로가기

머신러닝4

pandas를 이용한 시계열 데이터 처리에 대해 안녕하세요! 제리입니다. 오늘은 시계열 데이터에 대해서 다뤄보는데 그 중 pandas를 사용한 방법에 대해서 소개하려고 합니다. 참고한 곳은 유데미 강의 중 '시계열 데이터 분석 with 파이썬' 입니다! 우선 시계열 데이터는 시간 속 데이터로 일반 데이터와 다른 특징을 지니고 있기에 다른 데이터 처리 방법을 사용해야합니다. 우선 코드로 간단히 한번 봐보시죠! 간단한 시계열 데이터 처리 from datetime import datetime # 시계열 데이터를 표현하는 라이브러리 중 하나 # 연, 월, 일, 시, 분, 초 이렇게 있으며 입력하지 않은 값은 자연스럽게 0으로 처리가 됩니다. my_date_time = datetime(my_year,my_month,my_day,my_hour,my_minute,.. 2023. 5. 3.
클러스터링(군집화) 알고리즘에 대해 안녕하세요! 제리입니다. 오늘은 클러스터링 알고리즘에 대해서 소개해볼까 합니다. 클러스터링이란? 흔히 군집화라고 하며 비지도 학습 (unsupervised learning)의 가장 일반적인 형태 중 하나라고 할 수 있습니다. 이것은 데이터 내에서 자연적인 그룹을 자동으로 발견을 하며 특히 아무것도 모르는 데이터를 탐색을 할 때 유용합니다. 그래서 흔히 데이터 분석할 때 많이 사용하여 군집별로 어떤 특성을 가지고 있는 지 파악해 아이디어를 도출합니다. 비지도 학습이란? 학습에는 지도학습, 비지도학습, 강화학습이 있습니다. (준지도학습도 있긴합니다.) 지도 학습 - 정답이 있는 데이터를 활용해 데이터 학습 비지도 학습 - 정답이 없는 데이터를 확룔해 비슷한 특징끼리 묶어 새로운 데이터 결과 예측 학습 강화학.. 2023. 5. 1.
파이썬 기반 금융 인공지능 안녕하세요! 제리입니다.​ 오늘 리뷰해볼 책은 바로 이 책입니다. 책 표지부터 그려져 있는 쥐,,,,,, 쥐를 싫어하시는 분은 경악하실도 있겠네요 ​ 요즘 IT 책을 많이 보는데, 주로 동물들이 표지에 많이 그려져 있다라구요? (이유는 모르겠네요?) 물고기, 공룡, 도마뱀, 수달 등등 참 다채롭습니다 ㅎ ​ 목차는 아래와 같습니다 ​ 알고리즘부터 해서 금융에 대한 설명, 머신러닝, 딥러닝까지 진짜 알차게 다 있는 것을 확인할 수 있습니다. ​ 1장에서는 앞으로 설명에 필요한 기초적인 내용을 담고 있다고 봐도 무방합니다 진짜 스윽 스윽 넘겨서 훑기 좋습니다. ​ 2장의 경우, 초지능 AI에 대해서 전반적인 소개를 해주고 있습니다. 왜 AI가 유망한지, 어디에 쓰였는지, 목표가 무엇인 지 등 AI에 대한 소.. 2023. 4. 30.
Numpy에 대해 안녕하세요! 제리입니다. 기술 블로그를 쓸 때 어떤 것을 먼저 써야할 지, 내가 지금 하고 있는 것을 먼저 써야할 지 고민이 참 많았습니다. 복습도 할 겸, 자세히 다시 리마인드하는 느낌으로 하나씩 작성해보려고 합니다! Numpy란? 파이썬에서 배열을 사용하기 위한 표준 패키지, 수치 해석용 패키지 벡터 / 행렬 사용하는 선형대수 계산에 주로 이용 왜 알아야할까? 처음에 저도 사용할 일이 없어서 그렇게 중요하지 않다고 생각했습니다. numpy보다 이후의 pandas가 데이터 분석에 있어서 더 많이 쓰이고 관련 라이브러리가 많기 때문이죠. 그런데 딥러닝을 배울 때 이 부분이 중요합니다! 그렇기에 처음을 잘 다잡고 가시는 것을 추천합니다~~~ 배열 : 같은 타입의 변수들로 이뤄진 유한집합 인덱스 : 배역에서.. 2023. 4. 30.