본문 바로가기

분류 전체보기212

수준별 학습에서 배운것들 오늘의 수준별 학습에서 많은 것들을 배웠다. 쉬운 기초 프로그래머스 문제를 튜터님이 풀이해 주셨는데, 쉬운 문제라도 푸는방법이 여러가지가 있고, 몰랐던 방법들을 많이 알게 되었다.   1.문자열 출력하기 str = input()print(str) 2. a와 b출력하기# f-string 방법a, b = map(int, input().strip().split(' '))print(f'a = {a}')print(f'b = {b}')---# format 방법 - 1a, b = map(int, input().strip().split(' '))print('a = {0}'.format(a))print('b = {0}'.format(b))# format 방법 - 2a, b = map(int, input().strip().. 2024. 11. 7.
하이퍼 파라미터 튜닝 하이퍼 파라미터란? 모델 학습 과정에서 사용자가 설정해야 하는 값으로, 모델의 성능에 큰 영향을 미친다. 종류 학습률 (Learning Rate)모델의 가중치를 업데이트하는 속도를 결정한다.너무 크면 학습이 불안정해지고, 너무 작으면 학습이 느려진다.일반적으로 0.1, 0.01, 0.001 등의 값을 시도해 볼 수 있다.배치 크기 (Batch Size)한 번의 업데이트에 사용되는 데이터 샘플의 수를 결정한다. 큰 배치크기는 학습 속도를 높이지만 메모리 사용량이 증가한다.일반적으로 32, 64, 128 등의 값을 시도해 볼 수 있다. 에포크 수 (Number of Epochs)전체 데이터 셋을 몇 번 반복하여 학습할지를 결정한다. 너무 적으면 과소적합이 발생하고, 너무 많으면 과적합이 발생할 수 있다. 조.. 2024. 11. 6.
과적합 방지 기법 정규화(Nomalization) 입력 데이터의 분포를 일정한 범위로 조정하여 모델의 학습을 안정화하고 성능을 향상시키는 기법이다. 배치 정규화(Batch Nomalization) : 미니 배치 단위로 평균과 분산을 계산하여 각 배치의 입력을 정규화한다. 학습 속도를 높이고 안정적이다. ( 미니배치란? 전체 데이터셋을 작은 부분집합으로 나눈것이다. 이것은 적절한 크기로 나누어 모델을 업데이트 하기 위함이다.)레이어 정규화(Layer Normalization) : 모든 활성화 값을 본다음 평균과 분산을 보고 이 값을 통해 정규화하는 것이다.     드롭아웃(Dropout) 학습 과정 중 무작위로 뉴런을 비활성화하여 일부 뉴런의 영향을 제거하는 방법이다. 학습된 모델이 특정 뉴런에 의존하지 않게 해준다. 학습.. 2024. 11. 6.
오토인코더 & 생성형 모델 & 전이 학습 오토인코더란?입력 데이터를 압축하고, 이를 다시 복원하는 과정을 통해 데이터를 효율적으로 표현하는 비지도 학습 모델이다. 주로 차원 축소, 잡음 제거, 생성 모델 등 다양한 분야에서 활용된다.  구조  √ 인코더(Encoder) : 입력 데이터를 압축하여 저차원 표현으로 변환하는 역할이다. 주요 특징들을 선택해 작은 벡터로 압축한다. √  잠재 공간(Latent Space) : 인코더에서 압축된 정보가 잠시 저장되는 공간이다. 핵심 특징을 함축하고 있으며, 차원이 낮기 때문에 정보의 손실이 있을 수 있지만 중요한 특징들은 남아 있다.   √  디코더(Decoder) : 압축된 데이터를 다시 원래 크기로 복원하는 역할이다. 역과정을 수행하며 데이터를 원래의 형태에 가깝게 재구성한다.  입력 데이터와 출력 .. 2024. 11. 5.
이미지 처리 모델 ResNet (Residual Network)깊은 신경망을 학습하기 위해 개발된 모델이다. 잔차학습 개념을 도입하여 기울기 소실 문제를 해결하였고, 층이 몇개로 구성되어 있냐에 따라 이름이 바뀐다. 딥러닝에서 중요한 발전을 이룩한 모델이다. 이미지 분류, 객체 검출 등 다양한 컴퓨터 비전 작업에서 높은 성능을 발휘하고, 깊은 네트워크에서도 안정적으로 학습할 수 있어, 복잡한 패턴을 잘 학습한다. -> 잔차학습 (Residual Learning) : 잔차연결 또는 스킵연결 이라 불리는 연결 방식을 도입하는 것이다. 일반적인 네트워크는 각 층이 이전층의 출력을 받아 계산하지만 ResNet에서는 일부 층을 건너뛰어 신호를 다음 층으로 직접 전달하는 잔차연결이 추가된다. 이를 통해 각 레이어는 이전 출력의 잔차.. 2024. 11. 5.
SQL 문제 : 저자 별 카테고리 별 매출액 집계하기 문제 설명다음은 어느 한 서점에서 판매중인 도서들의 도서 정보(BOOK), 저자 정보(AUTHOR) 테이블입니다.BOOK 테이블은 각 도서의 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다.Column nameTypeNullableDescriptionBOOK_IDINTEGERFALSE도서 IDCATEGORYVARCHAR(N)FALSE카테고리 (경제, 인문, 소설, 생활, 기술)AUTHOR_IDINTEGERFALSE저자 IDPRICEINTEGERFALSE판매가 (원)PUBLISHED_DATEDATEFALSE출판일AUTHOR 테이블은 도서의 저자의 정보를 담은 테이블로 아래와 같은 구조로 되어있습니다.Column nameTypeNullableDescriptionAUTHOR_IDINTEGERFALSE저자.. 2024. 11. 5.