Scientia Conditorium

[책리뷰] 확산 모델의 수학 본문

서평/IT-책

[책리뷰] 확산 모델의 수학

크썸 2024. 7. 13. 17:41

[책리뷰] 확산 모델의 수학

예술과 기초 과학을 가르쳐야 한다.
지금 고등학교에선 프로그래밍을, 대학에선 캐드(CAD)를 가르치는데, 이건 미친 짓이다.
읽고 쓰고 생각하고 예술을 하고 연극을 하고 악기를 배우고 수학, 물리학, 화학, 생물학, 역사를 배워야 한다.
기본이 항상 최고다.
반도체의 마법사 짐 켈러 曰

 

전반적인 소감 및 마음에 드는 부분

인공지능 수학을 다루는 책이 메마른 가운데 황금비와 같은 책이 등장했다.  우리나라는 항상 잘 팔리는 책을 집필하기 때문에 언제나 기초책 혹은 가장 인기있는 도구를 사용해서 '돈' 버는 방법 혹은 '효율'을 높이는 방법의 책만 나온다. 이런 식의 근본 원리를 탐구하는 책은 정말 오랜만에 만나보며 이런 책을 출판한 제이펍에게 감사의 인사를 올린다.

우선 제목에 충실한 책이다. 쓸데없는 내용은 일절 제거하고 오로지 '확산 모델'에 대해서만 다룬다. 수식을 이해하기 위해 쓸데없이 기초 내용을 추가하여 페이지 수를 늘려 책 값을 올리는 짓을 하지 않는다. 이 점이 굉장히 마음에 든다. 행렬, 벡터, 미분방정식을 하나하나 설명하지 않을테니 알아서 공부하고 이 책을 보라는 식으로 시작한다. 심지어 저자의 머리말에도 딥러닝이나 신경망, 확률미분방정식에 대한 내용은 다른 문헌을 참고하라고 딱 1줄로 넘어간다. 특정 주제에 다루는 책이라면 응당 이래야 한다고 생각한다.

 

 

대상 독자 및 책 난이도

절대 일반 독자를 대상으로 한 책이 아닙니다. 가벼운 마음으로 이 책을 선택하지 않기 바랍니다.

위 기호들이 뭔 소리인지 모르겠다면 이 책을 권장하지 않습니다

 

시작하기에 앞서 이 책의 기호 일람을 설명해주는 페이지가 있다. 최소한 실수, 벡터, 집합, 함수를 하나도 모른다면 이 책을 추천하지 않는다. 그러나 인공지능 엔지니어로 일하고 있거나, 인공지능 핵심 기술의 근본 원리에 관심이 있거나, 확산 모델의 수학적 배경과 풀이/증명 등에 관심이 있다면 적극 추천한다.

데이터 생성 기술의 수학적 원리를 설명해주기 때문에 코드는 나오지 않는다. 물론 알고리듬을 설명하기 위해 슈도 코드 형태로 일부분 등장한다. 책의 처음부터 끝까지 수식과 설명만이 전부다. 그렇기 때문에 이 책의 대상 독자는 생성형 인공지능의 핵심 기술을 깊게 파헤치고 있는 연구원들, DALL-E 혹은 Midjourney 같은 생성형 AI 들의 근본 원리를 제대로 이해하고 싶은 분들에게 추천한다.

수학적 지식이 없다면 절대 보면 안되는가? 반드시 그렇지는 않다. 이 수식이 무엇을 말하고 있고 이로 인해 어떠한 점이 개선되었는지 설명해주고 있다. 예를 들어 확산 모델을 이용하여 복잡한 생성 문제를 간단한 부분 생성 문제로 자동 분해해서 생성이 어려운 데이터를 학습할 수 있는 점을 설명해준다. 이를 활용해 동영상 생성에 성공하여 일반화도 가능해진 부분을 수식으로 알려주고 있다. 즉, 수식을 제대로 이해하는 건 나중으로 넘기고 대충 무슨 말인지 알고 싶은 사람들은 한없이 가볍게 볼 수도 있긴 하다. 그러나 책을 제대로 이해하는 방법은 아니기 때문에 권하고 싶지 않다.

 

 다루는 내용과 범위

제목 그대로 인공지능의 핵심 수학 중 하나인 확산 모델에 대해 다루고 있다.

대충 이런 식으로 전개된다

따라서 이 책을 완벽하게 이해하고 싶다면 미분방정식 등의 수학적 지식도 필요하다. 이 책에서는 확산 모델의 기본적인 개념부터 그 발전 과정과 응용 사례를 설명한다. 따라서 인공지능 수학의 중요한 핵심 중 하나인 딥러닝이나 신경망에 대해서는 자세히 다루지 않는다. 즉, 딥러닝이나 신경망에 대한 기본적인 개념은 이미 알고 있다는 전제로 시작한다. 이 책은 확산 모델을 설명하기 위해 총 5개의 챕터로 이루어져있다.

 

  1. 챕터1 - 생성 모델
    • 생성 모델이 무엇인지 설명하고, 특히 고차원 데이터 생성 모델의 학습과 표본을 추출할 때의 어려움에 관해 설명한다. 여기에 로그 우도의 기술기인 점수를 사용해서 이 문제를 해결하는 것을 살펴본다.
  2. 챕터2 - 확산 모델
    • 확산 모델의 기본 개념을 설명한다. 점수 기반 모델과 디노이징 확산확률 모델이라는 두 개의 모델로부터 도출되며 신호 대 잡음비라는 통일적인 틀을 설명한다. 데이터에 서서히 잡음을 추가하는 확산 과정을 반대로 거슬러 올라가는 역확산 과정을 이용해서 잡음으로부터 데이터를 생성하는 것을 살펴본다.
  3. 챕터3 - 연속 시간 확산 모델
    • 기존 생성 모델에는 없었던 확산 모델의 여러 가지 우수한 특징을 살펴본다. 그 기본에는 확률미분방정식이 있기 때문에 이에 대한 기본 지식이 없다면 이 챕터를 이해하기 어렵다. 확산 모델은 고정된 인식 모델을 사용하고, 복잡한 생성 과정을 간단한 생성 과정의 조합으로 자동 분해하여 이를 독립적으로 학습할 수 있음을 수학적으로 보여준다.
  4. 챕터4 - 확산 모델의 발전
    • 확살 모델의 발전을 소개한다. 조건부 생성, 부분공간 확산 모델, 대칭성을 고려한 확산 모델을 소개한다.
  5. 챕터5 - 응용
    • 확산 모델을 사용한 대표적은 응용 사례를 소개한다. 말 그대로 이 확산 모델을 이용해 지금까지 어떤 결과물이 나왔고 어떤 것을 할 수 있는지 소개한다.
  6. 부록

책 제목에 충실하게 확산 모델을 집중적으로 다루고 있다. 확산 모델을 공부하는 대학원생이나 연구원들에게는 이 보다 좋은 확산 모델 책을 찾기 어려울 것 같다.

 

결론

짐 켈러가 말했듯이 기초 지식이 더 중요해질 시대가 오고 있다. 단순히 근본 기술인 수학만 공부하라고 말하지 않았다. 수학을 필두로 물리학, 화학, 생물학, 예술, 역사 등 기초를 골고루 배워야 한다. 옮긴이의 머리말에도 나왔듯이 확산 모델은 물리학에서 아이디어를 가져왔다. 챕터5 응용에서는 화학 분야에서 화합물의 생성과 회전 배열에도 확산 모델이 사용되고 있다고 소개한다. 즉, 혁신적이고 파멸적인 최신 기술의 근본 원리는 수학에 있으며 다른 분야에서 사용되는 기법을 인용하고 응용해야 더 좋고 더 대단해질 수 있다. 나아가 기존 기술로는 해결하지 못했던 문제들을 다른 관점에서 살펴보고 해결할 수 있다는 의미다.

이 책은 확산 모델에 대해 소개하고 설명해주는 수학책이지만, 단순히 거기에 그치지 않는다고 생각한다. 왜 우리가 수학을 공부해야 하며, 다른 분야에도 관심을 가져야 하는지에 대한 이유를 말해준다. 이 점은 챕터5 응용 파트를 보면 자세히 알 수 있다. 확산 모델에 관심이 갖고 연구원들이라면 이 책을 통해 여러 인사이트를 얻을 수 있을거라 생각한다.

 

조금만 공을 들여서 이 책을 읽으십시오.
인공지능 수학을 정면으로 맞닥뜨려 내 것으로 만들 수 있을 것입니다.
- 정원창, 머신러닝 엔지니어 추천사 中

 

"제이펍 리뷰어 3기 활동을 위해 책을 제공받아 작성된 서평입니다."