본문 바로가기

전체 글

(6)
[KHUDA_NLP] 혼공머신 Chapter 07. 딥러닝을 시작합니다 Chapter 07. 딥러닝을 시작합니다 07-1 인공 신경망 ✅ 패션 MNIST 더보기 MNIST가 뭐죠? 머신러닝과 딥러닝을 처음 배울 때 많이 사용하는 데이터셋이 있습니다. 머신러닝에서는 붓꽃 데이터셋이 유명하죠. 딥러닝에서는 MNIST 데이터셋이 유명합니다. 이 데이터는 손으로 쓴 0~9까지의 숫자로 이루어져 있습니다. MNIST와 크기, 개수가 동일하지만 숫자 대신 패션 아이템으로 이루어진 데이터가 바로 패션 MNIST입니다. from tensorflow import keras (train_input, train_target), (test_input, test_target) =\ keras.datasets.fashion_mnist.load_data() keras.datasets.fashion_m..
[ML 세션] 혼공머신 Chapter 06. 비지도 학습 Chapter 06. 비지도 학습 06-1 군집 알고리즘 ✅ 타깃을 모르는 비지도 학습 타깃이 없을 때 사용하는 머신러닝 알고리즘을 비지도 학습이라고 합니다. 사람이 가르쳐 주지 않아도 데이터에 있는 무언가를 학습하는 거죠. ✅ 과일 사진 데이터 준비하기 더보기 !는 뭔가요? 코랩의 코드 셀에서 '!' 문자로 시작하면 코랩은 이후 명령을 파이썬 코드가 아니라 리눅스 셀(shell) 명령으로 이해합니다. print(fruits.shape) #-> (300, 100, 100) fruits 배열의 첫 번째 차원(300)은 샘플의 개수를 나타내고, 두 번째 차원(100)은 이미지 높이, 세 번째 차원(100)은 이미지 너비입니다. 이미지 크기는 100 * 100입니다. 각 픽셀은 넘파이 배열의 원소 하나에 대응..
[ML 세션] 혼공머신 Chapter 05. 트리 알고리즘 Chapter 05. 트리 알고리즘 05-1 결정 트리 ✅ 로지스틱 회귀로 와인 분류하기 wine.describe() describe() 메서드를 통해 평균(mean), 표준편차(std), 최소(min), 최대(max)값을 볼 수 있습니다. 또 중간값(50%)과 1사분위수(25%), 3사분위수(75%)를 알려줍니다. ✅ 결정 트리 결정 트리 모델은 스무고개와 같습니다. 밑에 있는 그림처럼 질문을 하나씩 던져서 정답과 맞춰가는 거죠. 데이터를 잘 나눌 수 있는 질문을 찾는다면 계속 질문을 추가해서 분류 정확도를 높일 수 있습니다. import matplotlib.pyplot as plt from sklearn.tree import plot_tree plt.figure(figsize=(10,7)) plot_..
[ML 세션] 혼공머신 Chapter 04. 다양한 분류 알고리즘 Chapter 04. 다양한 분류 알고리즘 04-1 로지스틱 회귀 ✅ 럭키백의 확률 더보기 데이터프레임은 판다스에서 제공하는 2차원 표 형식의 주요 데이터 구조입니다. 데이터프레임은 넘파이 배열과 비슷하게 열과 행으로 이루어져 있습니다. 타깃 데이터에 2개 이상의 클래스가 포함된 문제를 다중 분류라고 부릅니다. ✅ 로지스틱 회귀 로지스틱 회귀는 이름은 회귀이지만 분류 모델입니다. 이 알고리즘은 선형 회귀와 동일하게 선형 방정식을 학습합니다. z는 어떤 값도 가능합니다. 하지만 확률이 되려면 0~1 사이 값이 되어야 합니다. z가 아주 큰 음수일 때 0이 되고, 아주 큰 양수일 때 1이 되도록 바꾸려면 시그모이드 함수(로지스틱 함수)를 사용하면 됩니다. z가 0이 될 때는 0.5가 됩니다. 이진 분류일 경..
[ML 세션] 혼공머신 Chapter 03. 회귀 알고리즘과 모델 규제 Chapter 03. 회귀 알고리즘과 모델 규제 03-1 k-최근접 이웃 회귀 ✅ k-최근접 이웃 회귀 지도 학습 알고리즘은 크게 분류와 회귀로 나뉩니다. 회귀는 클래스 중 하나로 분류하는 것이 아니라 임의의 어떤 숫자를 예측하는 문제입니다. 회귀는 정해진 클래스가 없고 임의의 수치를 출력합니다. k-최근접 이웃 회귀도 kNN 알고리즘과 같이 간단합니다. 예측하려는 샘플에 가장 가까운 샘플 k개를 선택합니다. 하지만 이웃한 샘플의 타깃은 어떤 클래스가 아니라 임의의 수치입니다. 이웃한 수치들의 평균을 구해 예측 타깃값을 구합니다. ✅ 데이터 준비 reshape() 메서드 사이킷런에 사용할 훈련 세트는 2차원 배열이어야 합니다. 넘파이 배열에서는 배열의 크기를 바꿀 수 있는 reshape() 메서드를 제공..
[ML 세션] 혼공머신 Chapter 01. 나의 첫 머신러닝 & Chapter 02. 데이터 다루기 Chapter 01. 나의 첫 머신러닝 01-1 인공지능과 머신러닝, 딥러닝 인공지능이란 인공지능은 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템을 만드는 기술입니다.인공일반지능 or 강인공지능은 사람과 구분하기 어려운 지능을 가진 컴퓨터 시스템입니다. 약인공지능은 아직까지는 특정 분야에서 사람의 일을 도와주는 보조 역할만 가능합니다.(ex. 음성 비서, 자율 주행 자동차, 음악 추천, 기계 번역 등) 머신러닝이란 머신러닝은 규칙을 일일이 프로그래밍하지 않아도 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야입니다. 인공지능의 하위 분야 중에서 지능을 구현하기 위한 소프트웨어를 담당하는 핵심 분야입니다. 머신러닝은 통계학과 깊은 관련이 있습니다. 하지만 최근 머신러닝의 발전은 통..