본문 바로가기
Coding/TIL & 배운것들

생성형 모델의 기본 원리

by 코딩짜는 머글 2024. 11. 12.

▼ 랜덤성(Randomness)

생성형 모델이 다양한 결과를 생성할 수 있도록 도와주는 중요한 요소이다. 모델이 동일한 입력을 받아도 매번 다른출력을 생성할 수 있는 것은 이 랜덤성 덕분이다. 

  • 랜덤성의 역할 : 랜덤성은 모델이 출력 데이터를 생성할 때, 일정한 확률에 따라 다양한 선택지를 고려하게 한다. 이로 인해 생성된 데이터는 항상 고정된 것이 아니라, 매번 조금씩 다르게 생성될 수 있다. 
  • 확률 분포 : 생성형 모델은 학습 데이터를 통해 얻은 확률 분포를 기반으로 새로운 데이터를 생성한다. 예를 들어 텍스트 생성 모델은 다음에 올 단어를 예측할 때 각 단어의 확률을 계산하고, 그 확률에 따라 랜덤하게 단어를 선택한다. 

▼ 조건성(Conditionality)

생성형 모델이 특정 조건을 기반으로 데이터를 생성하는 능력이다. 조건이 주어지면 모델은 그 조건에 맞춰 출력을 생성한다. 예를 들어 텍스트 설명을 주면 그에 맞는 이미지를 생성하거나, 특정 주제에 맞는 글을 생성하는 것이 조건성을 활용한 예시이다. 

  • 조건 입력 : 생성형 모델은 입력된 조건에 따라 결과를 다르게 생성한다. 텍스트, 이미지, 오디오 등 다양한 형식의 조건이 있을 수 있으며, 모델은 이 조건을 바탕으로 학습한 패턴에 따라 출력을 생성한다. 
  • 조건의 중요성 : 조건성 덕분에 생성형 모델은 매우 다양한 상황에 적응할 수 있다. 예를 들어, 사용자가 원하는 특정 스타일, 주제, 분위기에 맞게 텍스트나 이미지를 생성할 수 있다.

 

▼ 텍스트 기반 생성형 모델의 작동 원리

  1. 입력 토큰화 : 사용자가 입력한 텍스트를 토큰(단어 또는 서브워드)으로 변환한다.
  2. 확률 예측 : 모델은 주어진 텍스트를 기반으로 다음에 올 단어의 확률을 예측한다.
  3. 랜덤 선택 : 예측된 확률 분포에서 랜덤하게 다음 단어를 선택한다. 이때 temperature 파라미터를 조정하여 랜덤성을 조절할 수 있다. 
  4. 반복 생성 : 이러한 과정을 반복하여 문장이 완성될 때까지 텍스트를 생성한다. 

▼ 이미지 기반 생성형 모델의 작동 원리

  1. 텍스트 인코딩 : 입력된 텍스트 조건을 벡터로 인코딩하여 모델에 입력한다. 
  2. 이미지 생성 : 모델은 인코딩된 텍스트와 함께 이미지의 주요 특징 (형태, 색상 질감 등)을 생성한다. 
  3. 세부 사항 추가 : 랜덤성을 적용하여 세부적인 이미지 요소를 생성하고, 이를 합성하여 최종 이미지를 생성한다. 

▼ 오디오 기반 생성형 모델의 작동 원리

  1. 텍스트 또는 멜로디 인코딩 : 입력된 텍스트(노래 가사 등)나 멜로디를 인코딩하여 모델에 입력한다. 
  2. 오디오 생성 : 모델은 인코딩된 입력을 바탕으로 오디오 신호를 생성한다. 이 과정에서 음색, 리듬, 멜로디 등을 조합한다.
  3. 랜덤성 적용 : 랜덤성을 통해 음성의 미세한 변화를 추가하여, 동일한 조건에서도 다양한 오디오를 생성할 수 있다. 

 

▼ 랜덤성과 조건성의 상호작용

생성형 AI는 랜덤성과 조건성을 결합하여 다양한 결과를 생성한다. 조건은 출력의 전반적인 특과 스타일을 결정하고, 랜덤성은 결과의 세부적인 변화를 만들어낸다. 이 두 요소의 상호작용 덕분에 생성형 AI는 창의적이고 예측 불가능한 결과를 생성할 수 있다. 

 

--> 예시 : DALL-E는 '코딩짜는 고양이'라는 텍스트 조건을 받아 이를 바탕으로 다양한 이미지를 생성할 수 있다. 랜덤성을 추가하면 고양이의 모습, 방안의 배경, 색감 등이 매번 다르게 표현될 수 있다.

'Coding > TIL & 배운것들' 카테고리의 다른 글

Ultralytics YOLO활용  (1) 2024.11.12
모델 서빙  (0) 2024.11.12
생성형 AI  (1) 2024.11.12
사전 학습 & 파인 튜닝  (0) 2024.11.11
다양한 NLP모델  (5) 2024.11.11