본문 바로가기

머신러닝7

클러스터링(군집화) 알고리즘에 대해 안녕하세요! 제리입니다. 오늘은 클러스터링 알고리즘에 대해서 소개해볼까 합니다. 클러스터링이란? 흔히 군집화라고 하며 비지도 학습 (unsupervised learning)의 가장 일반적인 형태 중 하나라고 할 수 있습니다. 이것은 데이터 내에서 자연적인 그룹을 자동으로 발견을 하며 특히 아무것도 모르는 데이터를 탐색을 할 때 유용합니다. 그래서 흔히 데이터 분석할 때 많이 사용하여 군집별로 어떤 특성을 가지고 있는 지 파악해 아이디어를 도출합니다. 비지도 학습이란? 학습에는 지도학습, 비지도학습, 강화학습이 있습니다. (준지도학습도 있긴합니다.) 지도 학습 - 정답이 있는 데이터를 활용해 데이터 학습 비지도 학습 - 정답이 없는 데이터를 확룔해 비슷한 특징끼리 묶어 새로운 데이터 결과 예측 학습 강화학.. 2023. 5. 1.
Pandas에 대해 (Series, DataFrame) 안녕하세요! 제리입니다. 오늘은 데이터 분석에서 거의 필수 요소라고 생각되는 pandas에 대해서 다뤄보려고 합니다. Pandas란? 고수준의 자료 구조와 빠르고 쉬운 데이터 분석도구를 제공 Pandas에 대해서 알기 위해서는 Series와 DataFrame이라는 것을 먼저 알아야합니다. Series란? 일련의 객체를 담을 수 있는 1차원 배열 구조 넘파이의 배열과 유사하다고 보시면 될 것 같습니다! # numpy와 pandas의 경우 np, pd로 줄여서 사용합니다. import numpy as np import pandas as pd labels = ['a','b','c'] my_list = [10,20,30] arr = np.array([10,20,30]) # 딕셔너리 형태 d = {'a':10,'.. 2023. 4. 30.
Numpy에 대해 안녕하세요! 제리입니다. 기술 블로그를 쓸 때 어떤 것을 먼저 써야할 지, 내가 지금 하고 있는 것을 먼저 써야할 지 고민이 참 많았습니다. 복습도 할 겸, 자세히 다시 리마인드하는 느낌으로 하나씩 작성해보려고 합니다! Numpy란? 파이썬에서 배열을 사용하기 위한 표준 패키지, 수치 해석용 패키지 벡터 / 행렬 사용하는 선형대수 계산에 주로 이용 왜 알아야할까? 처음에 저도 사용할 일이 없어서 그렇게 중요하지 않다고 생각했습니다. numpy보다 이후의 pandas가 데이터 분석에 있어서 더 많이 쓰이고 관련 라이브러리가 많기 때문이죠. 그런데 딥러닝을 배울 때 이 부분이 중요합니다! 그렇기에 처음을 잘 다잡고 가시는 것을 추천합니다~~~ 배열 : 같은 타입의 변수들로 이뤄진 유한집합 인덱스 : 배역에서.. 2023. 4. 30.