티스토리 뷰

 

이번 여름! 딥러닝에 대해 관심이 가던 차였는데 우연히 혼공학습단이라는 것을 알게 되었다.

개발 공부할 때 한빛미디어의 책을 자주 참고했었고 밀리지 않고 꾸준히 공부하고 싶어서 참여하게 되었다. 

 

자, 그럼 1주차 시작!


Ch 01. 나의 첫 머신러닝

인공지능

- 인공일반지능: 사람과 구분하기 어려운 지능을 가진 컴퓨터 시스템. (아마도 챗GPT?)

- 강인공지능: (아마도 중간단계)

- 약인공지능: 특정분야에서 사람의 일을 도와주는 보조 역할

 

머신러닝:

규칙을 일일이 프로그래밍 X, 자동으로 데이터에서 규칙을 학습하는 알고리즘

사이킷런 -> 대표적인 머신러닝 라이브러리

 

딥러닝:

머신러닝 중에 인공신경망을 기반으로 한 방법들을 통칭하여 딥러닝이라고 부름.

+딥러닝 라이브러리는 구글의 텐서플로와 메타의 파이토치가 대표적

 

머신러닝 학습을 위해 구글 코랩 사용

 

Google colab - https://colab.google/

 

colab.google

Colab is a hosted Jupyter Notebook service that requires no setup to use and provides free access to computing resources, including GPUs and TPUs. Colab is especially well suited to machine learning, data science, and education.

colab.google

 

참고: 데이터셋은 주로 전세계에서 가장 큰 머신러닝 경연 대회 사이트 캐글(kaggle.com)에서 제공

 

1) k-최근접 이웃 알고리즘

어떤 데이터에 대한 답을 구할 때 주위의 다른 데이터를 보고 다수를 차지하는 것을 정답으로 사용

 

도미와 빙어 분류 예제

- 데이터 가져오기

- 특성 분류 후 합친 파이썬 리스트로 만들기

- 사이킷런의 k-최근접 알고리즘을 이용하여 정답 맞추기 -> 정확도

- KNeighborsClassfier 클래스의 fit(), score(), predict() 사용

 

Ch 02. 데이터 다루기

지도학습과 비지도학습

지도학습: 데이터와 정답 필요

비지도학습: 데이터만 필요

 

비지도학습의 경우, 데이터를 훈련세트와 테스트 세트로 나누어서 진행

-> 샘플링 편향 주의해야함.

 

데이터 전처리

- 가장 널리 사용하는 전처리 방법 중 하나는 표준점수

-> 각 특성값이 평균에서 표준편차의 몇 배만큼 떨어져 있는지를 나타냄.

 

데이터에서 특성의 스케일은 다르면 안됨. 이를 표준점수로 변환. 

 

1주차 과제

 

기본숙제(필수): 코랩 실습 화면 캡쳐하기

 

우선 1주차 끄읕.

 

역시 벼락치기는 힘들다..

그럼 다음주차도 파이팅!

공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/02   »
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28
글 보관함