본문 바로가기

머신러닝7

24-11-01 TIL 오늘은 딥러닝 코드공부랑 새로받은 AI활용 강의를 들었다. 팀 도전과제로 짰었던 딥러닝 코드와 다른 팀들의 코드들도 비교해 가면서 한 줄 한 줄 이해하는 것을 목표로 공부를 했었고, 오후 중간쯤 부터는 새로받은 강의를 들었다. 딥러닝이랑 머신러닝만 들었을때는 코드적인 부분에서 이해가지 않는 것도, 이걸 어떻게 만들어 가야할 지도 막막했는데, 활용강의 에서는 조금 더 세세하게 코드들에 대해서 설명을 해주셔서 이전 강의 보다는 이해하기가 수월했다. 따라가기가 훨씬 편했다. 이전의 줄어들었던 자신감이 다시 조금씩 올라오는 것도 같다.안그래도 내가 딥러닝과 머신러닝에 너무 시간을 많이 잡아 먹혀서 이렇게 하는것이 맞는건가 하는 의문과 이전 강의도 제대로 못 이해했는데 새로운 강의를 듣는것이 맞는가 하는 의문을 .. 2024. 11. 1.
앙상블 학습 (Ensemble Learning) 앙상블 학습이란?기존에 있던 모델에 다양한 기법을 적용하여 좀 더 나은 모델을 만드는 방법. 주요 학습법에는 배깅(Bagging)과 부스팅(Boosting)이 있다. 배깅(Bagging) : 여러개의 모델을 병렬로 학습. 예측결과를 평균 또는 다수결로 결합한다. 부트스트래핑 기법을 사용해 원본 데이터셋에서 중복을 허용한 무작위 샘플을 생성함. 각 모델은 서로 다른 데이터 샘플을 학습하게 되어, 모델 간의 상관성을 줄이고 예측 성능을 향상시킨다. 부스팅(Boosting) : 약한 학습기부터 순차적으로 학습한뒤 예측 결과를 결합하여 강한 학습기를 만드는 방법이다. 이전 모델이 잘못 예측한 데이터 포인트에 가중치를 부여하여, 다음 모델이 더 잘 학습하도록 한다.   랜덤 포레스트(Random Forest) 배.. 2024. 10. 31.
24-10-25 TIL 오늘은 머신러닝강의를 다듣고 딥러닝을 다시 재청강하였다.전에는 이해하기도 힘들고 감도 잡히지 않았었는데 요즘은 그래도 슬슬 개념이 이해가 가기시작한다. 강의듣고 바로 같은 주제를 검색해서 다시 찾아보고하니 확실히 머릿속에 더 잘 들어오는것 같다.하지만 코드를 짜는것은 아직도 쉽지않다. 강의에서 주는 실습코드같은 경우는 정말 기본적인것이고, 그 코드에 대해서 하나하나 뜯어서 살펴본다고 해도 막상 내가 처음부터 끝까지 코드를 짜보려고 하면 엄두가 나지 않는다. 다른 사람들이 짜놓은 머신러닝 코드를 보는것만 해도 머리가 아픈것같은 느낌이다. 정말.아직은 개념도 머릿속에 자리잡지 않았으니 당연한것일 수도 있다. 지금은 개념에 집중하는게 더 중요한것 같다.딥러닝 개념까지 끝내고 나서는  머신러닝을 생성해 학습을 .. 2024. 10. 25.
24-10-18 WIL 이번주는 머신러닝과 딥러닝강의를 수강하고 이해해야 되는 한주였다. 다음주부터 팀과제가 있어서 이번주에 정말 열심히 공부해놓지 않으면 팀원들에게 민폐가 될수도...그런고로 열심히 강의를 수강하고 있지만 너무 어렵다. 정말 무슨말을 하고있는지 잘 모르겠다..머신러닝은 그래도 이해'는' 어느정도 됬지만, 딥러닝은 답도없다. 하지만 이또한 헤쳐나가야 하는것. 이해가 안된다면 될때까지 공부하는거다. 열심히 공부하다보면 임계치에 도달해서 나도 실력이 확 오르지 않을까? 이렇게 믿고 앞만보고 달리자. 지금은 앞이 보이지 않는것 같지만 언젠가는 도달할 것이다. 어렵다어렵다 하는것도 마음가짐의 문제일 수도 있다.사실은 충분히 이해할 수 있는데 어렵다고 생각하니까 어렵게 보이는것 일수도. 처음이면 어려운게 당연한건데 마음.. 2024. 10. 18.
(머신러닝 2-1)데이터 불러오기 기본적인 데이터를 csv 파일을 불러오는 방법은↓import pandas as pd# CSV 파일 불러오기df = pd.read_csv('data.csv')# 데이터 프레임의 첫 5행 출력print(df.head()) 엑셀 파일은 import pandas as pd# 엑셀 파일 불러오기df = pd.read_excel('data.xlsx', sheet_name='Sheet1')# 데이터 프레임의 첫 5행 출력print(df.head()) Kaggle 이란?데이터 과학 및 머신러닝 경진대회 플랫폼이다. 모델을 개발하는데 필요한 데이터셋과 도구를 무료로 제공한다. 또한 커뮤니티에서는 데이터 과학자와 머신러닝 엔지니어들이 지식을 공유하고 협업하는 장소로 쓰이고 있다. 커널이라는 웹기반의 코드 실행환경을 제공하.. 2024. 10. 18.
머신러닝에 대하여 머신러닝의 구성요소 (머신러닝의 구성요소는 항상 정해져 있는것이 아니다.) 데이터셋 : 데이터로부터 규칙이나 논리를 학습하는 알고리즘 머신러닝의 베이스가 데이터이므로 데이터셋은 항상 존재한다. 입력과 출력데이터로 구성된다. 비지도학습은 정답이 필요없기 때문에 레이블이 없다. 그래서 구성요소는 항상 정해져 있는게 아닌 유동적인 것이다.   √입력 데이터 : 정답을 추론하기 위해 사용하는 정보들  √출력 데이터(레이블rabel) : 맞추기 위한 정답  Feature(특징): 비지도학습에서 분류하는 행위를 clustering한다고  표현. 모델이 학습할 수 있는 모든 개별 속성.  레이블 : 지도학습 모델에서 레이블이 있는 데이터셋을 이용하여 모델을 학습시킴. 예측하고자 하는 목표변수(목표변수는 정답을 의미).. 2024. 10. 16.