본문 바로가기

분류 전체보기212

24-10-21 TIL 오늘은 팀과제 발제가 있었고, 팀과제에 민폐를 끼치지 않기위해 머신러닝 강의부터 실습을 해보며 재수강을 하였다. 모르는 용어는 많아서 찾아보는데 시간이 많이 걸리긴 했지만, 이것도 다 배우는 것이니까 시간낭비라고는 생각하지 않는다. 그냥 넘어가면 이해하기가 좀 힘들어서.. 저녁에는 AI활용에 대한 특강과 팀회의가 있었는데, 딱히 정해진것은 없고 그저 필수과제를 끝내야할 시간이 빡빡하다는것.. 그래도 빨리끝내고 나면 좀더 공부할 여유가 있겠지..팀 필수과제를 수요일로 팀내에서 기한을 정해서 이제 내일부터는 팀과제만 주구장창 파면된다. 다른걸 할 여유도 없고, 시간도 없을것 같다. 아직도 어려운것이 많지만 부딪혀봐야 성장하는것이다. 모르는 것이 나오면 튜터님들한테 찾아가서 물어볼 수도 있다. 멈추지말고 나아.. 2024. 10. 21.
SQL 문제 : 조건에 부합하는 중고거래 상태 조회하기 문제 설명다음은 중고거래 게시판 정보를 담은 USED_GOODS_BOARD 테이블입니다. USED_GOODS_BOARD 테이블은 다음과 같으며 BOARD_ID, WRITER_ID, TITLE, CONTENTS, PRICE, CREATED_DATE, STATUS, VIEWS은 게시글 ID, 작성자 ID, 게시글 제목, 게시글 내용, 가격, 작성일, 거래상태, 조회수를 의미합니다.Column nameTypeNullableBOARD_IDVARCHAR(5)FALSEWRITER_IDVARCHAR(50)FALSETITLEVARCHAR(100)FALSECONTENTSVARCHAR(1000)FALSEPRICENUMBERFALSECREATED_DATEDATEFALSESTATUSVARCHAR(10)FALSEVIEWSNUM.. 2024. 10. 21.
SQL 문제 : 특정 옵션이 포함된 자동차 리스트 구하기 문제 설명다음은 어느 자동차 대여 회사에서 대여중인 자동차들의 정보를 담은 CAR_RENTAL_COMPANY_CAR 테이블입니다. CAR_RENTAL_COMPANY_CAR 테이블은 아래와 같은 구조로 되어있으며, CAR_ID, CAR_TYPE, DAILY_FEE, OPTIONS 는 각각 자동차 ID, 자동차 종류, 일일 대여 요금(원), 자동차 옵션 리스트를 나타냅니다.Column nameTypeNullableCAR_IDINTEGERFALSECAR_TYPEVARCHAR(255)FALSEDAILY_FEEINTEGERFALSEOPTIONSVARCHAR(255)FALSE자동차 종류는 '세단', 'SUV', '승합차', '트럭', '리무진' 이 있습니다. 자동차 옵션 리스트는 콤마(',')로 구분된 키워드 리스.. 2024. 10. 20.
24-10-18 WIL 이번주는 머신러닝과 딥러닝강의를 수강하고 이해해야 되는 한주였다. 다음주부터 팀과제가 있어서 이번주에 정말 열심히 공부해놓지 않으면 팀원들에게 민폐가 될수도...그런고로 열심히 강의를 수강하고 있지만 너무 어렵다. 정말 무슨말을 하고있는지 잘 모르겠다..머신러닝은 그래도 이해'는' 어느정도 됬지만, 딥러닝은 답도없다. 하지만 이또한 헤쳐나가야 하는것. 이해가 안된다면 될때까지 공부하는거다. 열심히 공부하다보면 임계치에 도달해서 나도 실력이 확 오르지 않을까? 이렇게 믿고 앞만보고 달리자. 지금은 앞이 보이지 않는것 같지만 언젠가는 도달할 것이다. 어렵다어렵다 하는것도 마음가짐의 문제일 수도 있다.사실은 충분히 이해할 수 있는데 어렵다고 생각하니까 어렵게 보이는것 일수도. 처음이면 어려운게 당연한건데 마음.. 2024. 10. 18.
(머신러닝 2-2) 전처리 전처리란(Data Cleaning)?데이터 분석, 모델링을 위해 데이터를 준비하는 과정. 여러가지 전처리를 해주지 않으면 머신러닝이 제대로 된 일반화 지식이 아닌 잘못된 지식을 배우게 된다. 결과 정상적인 학습이 이뤄지지않음. 품질을 높이기 위해서는 필수이다.  결측값 처리 데이터셋에서 누락된 값을 처리하는 작업이상값 처리데이터셋에서 비정상적으로 큰 값이나 작은 값을 처리하는 작업중복 데이터 제거동일한 데이터가 여러 번 나타나는 경우 이를 제거데이터 타입 변환데이터의 타입을 적절하게 변환하는 작업데이터 정규화데이터의 범위를 일정하게 맞추는 작업인코딩범주형 데이터를 수치형 데이터로 변환샘플링데이터셋의 크기를 줄이거나 늘리는 작업특징 선택 및 추출모델 성능을 높이기 위해 중요한 특징을 선택하거나 새로운 특징.. 2024. 10. 18.
(머신러닝 2-1)데이터 불러오기 기본적인 데이터를 csv 파일을 불러오는 방법은↓import pandas as pd# CSV 파일 불러오기df = pd.read_csv('data.csv')# 데이터 프레임의 첫 5행 출력print(df.head()) 엑셀 파일은 import pandas as pd# 엑셀 파일 불러오기df = pd.read_excel('data.xlsx', sheet_name='Sheet1')# 데이터 프레임의 첫 5행 출력print(df.head()) Kaggle 이란?데이터 과학 및 머신러닝 경진대회 플랫폼이다. 모델을 개발하는데 필요한 데이터셋과 도구를 무료로 제공한다. 또한 커뮤니티에서는 데이터 과학자와 머신러닝 엔지니어들이 지식을 공유하고 협업하는 장소로 쓰이고 있다. 커널이라는 웹기반의 코드 실행환경을 제공하.. 2024. 10. 18.