심층 신뢰망
1. 개요
1. 개요
심층 신뢰망은 2006년 제프리 힌턴에 의해 제안된 인공신경망의 한 종류이다. 여러 층의 제한된 볼츠만 머신(RBM) 또는 자동 인코더와 같은 비지도 학습 모듈을 쌓아 구성된다. 이는 딥러닝의 초기 성공적인 모델 중 하나로, 특히 비지도 사전 훈련의 중요성을 부각시켰다.
심층 신뢰망의 핵심 아이디어는 입력 데이터의 계층적인 표현을 학습하는 데 있다. 낮은 층은 단순한 특징을, 높은 층은 점점 더 추상적이고 복잡한 특징을 포착하도록 설계된다. 이러한 구조는 당시 기울기 소실 문제로 어려움을 겪던 심층 신경망을 효과적으로 훈련시킬 수 있는 방법을 제시했다.
이 모델의 학습은 주로 두 단계로 이루어진다. 첫 번째는 각 층을 순차적으로 비지도 방식으로 사전 훈련하는 것이고, 두 번째는 전체 네트워크를 지도 학습 방식으로 미세 조정하는 것이다. 이 접근법은 레이블이 없는 대량의 데이터로부터 유용한 특징을 먼저 학습한 후, 비교적 적은 레이블 데이터로 정확도를 높이는 데 유리하다.
심층 신뢰망은 이미지 인식, 음성 인식, 추천 시스템 등 다양한 분야에 응용되었다. 이후 등장한 합성곱 신경망(CNN)이나 재귀 신경망(RNN) 같은 다른 심층 구조에 비해 현재는 상대적으로 덜 사용되지만, 딥러닝 발전사에서 중요한 이정표로 평가받는다.
2. 구조와 원리
2. 구조와 원리
2.1. 제한된 볼츠만 머신(RBM)의 역할
2.1. 제한된 볼츠만 머신(RBM)의 역할
심층 신뢰망의 기본 구성 요소는 제한된 볼츠만 머신(RBM)이다. 심층 신뢰망은 여러 개의 RBM을 층층이 쌓아 올려 구성되며, 각 RBM 층은 신경망의 한 층(은닉층과 가시층)에 해당한다. RBM은 두 층 사이의 연결만 존재하고 동일 층 내의 노드 간 연결은 없는 무방향 그래프 모델로, 에너지 기반 모델의 일종이다.
이 모델의 역할은 입력 데이터(가시층)로부터 특징(은닉층)을 추출하는 확률적 생성 모델로서 동작하는 것이다. 각 RBM은 가시층의 데이터를 받아 은닉층의 표현으로 변환하며, 이 변환 과정에서 데이터의 복잡한 패턴을 점진적으로 학습한다. 심층 신뢰망은 이러한 RBM들을 그리디 방식으로 순차적으로 쌓아 올려, 하위 층의 출력이 상위 층의 입력이 되게 함으로써 계층적 특징 추출을 가능하게 한다.
RBM의 학습은 주로 대비 발산(Contrastive Divergence) 알고리즘을 통해 이루어진다. 이는 모델이 생성한 데이터와 실제 입력 데이터의 분포 차이를 줄이는 방향으로 가중치를 업데이트하는 비지도 학습 방식이다. 이러한 방식으로 각 RBM이 데이터의 통계적 구조를 포착하도록 훈련된다.
결국 심층 신뢰망에서 RBM의 핵심 역할은 초기 가중치를 효과적으로 초기화하는 사전 훈련 단계를 제공하는 것이다. 이는 전체 네트워크가 좋은 시작점에서 지도 학습 미세 조정을 시작할 수 있게 하여, 그 당시에는 깊은 네트워크의 학습을 어렵게 하던 기울기 소실 문제를 완화하는 데 기여했다.
2.2. 계층적 사전 훈련
2.2. 계층적 사전 훈련
심층 신뢰망의 핵심 학습 절차 중 하나는 계층적 사전 훈련이다. 이는 전체 네트워크를 한 번에 학습시키는 것이 어렵기 때문에, 각 층을 순차적으로 비지도 방식으로 먼저 훈련시키는 접근법이다. 구체적으로, 가장 아래층의 가시층과 첫 번째 은닉층으로 구성된 제한된 볼츠만 머신(RBM)을 학습시킨 후, 이 RBM의 은닉층 활성화 값을 다음 층의 가시층 입력으로 사용한다. 이 과정을 네트워크의 최상층에 도달할 때까지 반복하여, 데이터의 계층적 표현을 점진적으로 학습하게 된다.
이러한 계층별 훈련은 그리디(탐욕) 알고리즘의 성격을 띠며, 각 단계에서 해당 층의 매개변수만을 최적화한다. 비지도 방식으로 이루어지기 때문에 레이블이 없는 대량의 데이터를 활용할 수 있으며, 이를 통해 네트워크가 입력 데이터의 통계적 구조와 특징을 효과적으로 추출하도록 한다. 계층적 사전 훈련은 초기 가중치를 무작위로 설정하는 것보다 훨씬 더 유의미한 지점으로 초기화하는 역할을 수행한다.
사전 훈련이 완료된 후에는 일반적으로 지도 학습을 통한 미세 조정 단계가 뒤따른다. 그러나 계층적 사전 훈련 자체만으로도 생성 모델로서 기능할 수 있으며, 이 단계에서 학습된 가중치는 특징 추출기로도 사용될 수 있다. 이 방법은 심층 네트워크의 기울기 소실 문제를 완화하고, 당시에는 효율적인 심층 학습을 가능하게 한 핵심 기여 중 하나로 평가받는다.
2.3. 미세 조정
2.3. 미세 조정
미세 조정은 심층 신뢰망의 학습 과정에서 비지도 사전 훈련 이후에 수행되는 지도 학습 단계이다. 사전 훈련을 통해 얻은 네트워크의 초기 가중치를 출발점으로 삼아, 레이블이 달린 실제 데이터를 사용하여 전체 네트워크의 파라미터를 최종적으로 조정한다.
이 과정에서는 네트워크의 최상위 계층에 분류기를 추가한 후, 역전파 알고리즘과 같은 지도 학습 방법을 적용한다. 사전 훈련 단계에서 이미 특징의 계층적 표현을 학습했기 때문에, 미세 조정은 비교적 적은 양의 레이블 데이터와 적은 학습 시간으로도 전체 모델의 성능을 최적화하는 데 효과적이다.
미세 조정의 핵심 목적은 네트워크가 입력 데이터의 추상적인 특징뿐만 아니라, 최종 목표 작업(예: 이미지 분류)에 직접적으로 관련된 판별 정보도 학습하도록 하는 것이다. 이를 통해 심층 신뢰망은 비지도 학습의 장점(레이블 없는 대량 데이터 활용)과 지도 학습의 장점(높은 작업 정확도)을 결합할 수 있다.
이 단계를 거치면, 심층 신뢰망은 단순한 생성 모델을 넘어 강력한 판별 모델로 변모하게 된다. 이는 딥러닝 초기 심층 구조의 학습 난제를 해결하는 데 기여한 핵심 아이디어 중 하나로 평가받는다.
3. 학습 방법
3. 학습 방법
3.1. 그리디 계층별 학습
3.1. 그리디 계층별 학습
심층 신뢰망의 학습은 그리디 계층별 학습 방식을 핵심으로 한다. 이 방식은 전체 네트워크를 한 번에 학습시키는 것이 아니라, 각 제한된 볼츠만 머신 층을 순차적으로, 그리고 독립적으로 학습하는 접근법이다. 가장 아래쪽의 가시층과 첫 번째 은닉층으로 구성된 RBM을 먼저 학습시킨 후, 이 첫 번째 RBM의 학습이 완료되면 그 은닉층의 활성화 값을 다음 RBM의 가시층 입력으로 사용한다. 이 과정을 네트워크의 최상층에 도달할 때까지 반복한다.
이러한 계층별 학습은 비지도 방식으로 이루어지며, 각 RBM은 해당 층이 입력 데이터의 통계적 구조를 효율적으로 표현하도록 훈련된다. 결과적으로, 하위 층은 단순한 특징(예: 이미지의 에지)을 학습하고, 상위 층으로 갈수록 점점 더 추상적이고 복합적인 특징(예: 얼굴의 구성 요소나 객체 형태)을 학습하게 된다. 이는 전체 학습 문제를 각 층의 상대적으로 단순한 학습 문제로 분해하여 해결하는 효과가 있다.
그리디 방식은 최적해를 보장하지는 않지만, 깊은 네트워크를 효과적으로 초기화할 수 있는 실용적인 방법으로 평가받았다. 이 초기화 단계를 사전 훈련이라고 하며, 이 과정을 통해 얻어진 가중치 값은 이후 미세 조정 단계에서 지도 학습을 위한 좋은 시작점을 제공한다. 이는 기울기 소실 문제를 완화하고 전반적인 학습 성능을 향상시키는 데 기여했다.
3.2. 비지도 사전 훈련
3.2. 비지도 사전 훈련
심층 신뢰망의 핵심 학습 방법 중 하나는 비지도 사전 훈련이다. 이는 레이블이 없는 대량의 데이터만을 사용하여 네트워크의 가중치를 초기화하는 과정이다. 주로 여러 개의 제한된 볼츠만 머신(RBM)을 쌓아 올린 구조에서, 가장 아래층의 RBM부터 순차적으로 비지도 방식으로 학습이 진행된다. 이때 각 RBM은 가시층과 은닉층 사이의 결합 확률 분포를 모델링하며, 데이터의 계층적 특징을 점진적으로 추출해 낸다.
이러한 비지도 사전 훈련의 주요 목적은 모델이 데이터의 내재된 통계적 구조나 잠재 변수를 발견하도록 하는 것이다. 레이블 정보에 의존하지 않고 순수한 입력 데이터의 패턴을 학습함으로써, 모델은 보다 일반화된 특징 표현을 학습할 수 있다. 이 과정은 그리디 계층별 학습 방식으로 수행되어, 각 층의 학습이 완료되면 그 다음 층의 학습으로 이어진다.
비지도 사전 훈련이 성공적인 이유는, 무작위로 초기화된 가중치로 시작하는 것보다 네트워크의 파라미터를 데이터 분포에 더 적합한 영역으로 효과적으로 유도할 수 있기 때문이다. 이는 이후 수행되는 지도 미세 조정 단계의 학습을 안정화시키고, 전반적인 성능을 향상시키는 데 기여한다. 특히 레이블이 붙은 데이터가 부족한 상황에서 유용한 전략으로 평가받는다.
3.3. 지도 미세 조정
3.3. 지도 미세 조정
심층 신뢰망의 지도 미세 조정은 비지도 사전 훈련으로 초기화된 가중치를 대상 태스크에 맞게 최종적으로 조정하는 단계이다. 사전 훈련 단계에서 모델은 입력 데이터의 계층적 특징 표현을 학습하지만, 이는 특정 분류나 회귀 작업을 위한 최적의 상태가 아니다. 따라서 미세 조정 단계에서는 레이블이 지정된 지도 학습 데이터를 사용하여, 일반적으로 역전파 알고리즘을 적용하여 네트워크의 모든 가중치를 함께 조금씩 업데이트한다.
이 과정은 사전 훈련된 가중치가 좋은 초기값을 제공하기 때문에, 무작위 초기화에서 시작하는 전통적인 역전파보다 더 빠르게 수렴하고 전역 최적점에 가까운 좋은 해를 찾을 가능성이 높다. 즉, 미세 조정은 이미 유용한 특징을 추출할 수 있는 네트워크를 출발점으로 삼아, 최종 작업의 정확도를 높이기 위해 파라미터를 세밀하게 튜닝하는 역할을 한다.
4. 특징과 장단점
4. 특징과 장단점
4.1. 장점
4.1. 장점
심층 신뢰망은 2000년대 중후반 심층 학습의 발전을 이끈 핵심 모델 중 하나로, 당시로서는 획기적인 몇 가지 장점을 지녔다. 가장 큰 장점은 그리디 계층별 학습 방식을 통해 심층 구조를 효과적으로 훈련시킬 수 있다는 점이다. 이 방법은 네트워크를 한 번에 훈련시키기 어려운 문제, 즉 기울기 소실 문제를 우회하여 상대적으로 깊은 신경망의 가중치를 안정적으로 초기화할 수 있게 했다. 또한, 비지도 학습 방식으로 대량의 레이블이 없는 데이터를 사전 훈련에 활용할 수 있어, 레이블 데이터가 부족한 상황에서도 유용했다.
또 다른 장점은 생성 모델로서의 성질을 가진다는 것이다. 심층 신뢰망의 기본 구성 요소인 제한된 볼츠만 머신(RBM)은 데이터의 확률 분포를 학습하여, 학습된 데이터와 유사한 새로운 샘플을 생성할 수 있는 능력을 부여한다. 이는 단순히 분류나 회귀만 수행하는 모델과 차별화되는 점이다. 모델의 최상층에 로지스틱 회귀나 신경망 같은 분류기를 추가하면, 생성적 특징 추출과 판별적 작업을 하나의 프레임워크에서 결합하여 수행할 수 있다.
구조적 유연성도 중요한 장점이다. 다양한 유형의 RBM(예: 가시층이 이진 또는 실수 값을 가짐)을 쌓아 이미지, 음성, 텍스트 등 이질적인 데이터 형태에 적용할 수 있었다. 이러한 모듈식 설계는 당시 다양한 분야에 심층 학습을 적용하는 실험을 가능하게 하는 기반이 되었다.
4.2. 단점 및 한계
4.2. 단점 및 한계
심층 신뢰망은 딥러닝의 초기 발전에 중요한 역할을 했지만, 몇 가지 단점과 한계를 지니고 있다. 가장 큰 문제는 학습 과정이 매우 복잡하고 계산 비용이 높다는 점이다. 계층별 사전 학습과 미세 조정이라는 두 단계를 거쳐야 하며, 특히 제한된 볼츠만 머신을 사용한 그리디 계층별 학습은 시간이 많이 소요된다. 이는 대규모 데이터셋을 실시간으로 처리해야 하는 현대 응용 분야에서는 실용적이지 않을 수 있다.
또 다른 한계는 합성곱 신경망과 같은 다른 딥러닝 모델에 비해 공간적 또는 지역적 정보를 효과적으로 추출하는 데 취약하다는 것이다. 따라서 이미지의 픽셀 간 계층적 관계나 지역적 패턴을 학습하는 데는 최적의 구조가 아니었다. 이로 인해 컴퓨터 비전 분야에서는 주로 CNN이 심층 신뢰망을 대체하게 되었다.
심층 신뢰망의 학습은 주로 비지도 방식으로 이루어지지만, 최종 성능을 내기 위해서는 레이블이 붙은 데이터를 사용한 지도적 미세 조정 단계가 필수적이다. 이는 순수한 비지도 학습 모델로서의 장점을 일부 약화시키는 요소로 작용했다. 또한, 모델 구조와 학습 파라미터(학습률, 은닉층 유닛 수 등)에 따라 성능이 크게 좌우되어 튜닝이 쉽지 않다는 점도 실용적인 장벽이었다.
결과적으로, 심층 신뢰망은 딥러닝의 가능성을 증명한 선구적 모델이지만, 학습의 효율성과 특정 작업에 대한 전문성 측면에서 한계를 보였다. 이후 등장한 ReLU 활성화 함수, 드롭아웃, 고급 최적화 기법 등을 활용한 심층 순전파 신경망이나 합성곱 신경망이 더 널리 채택되면서, 그 응용 범위는 상대적으로 축소되었다.
5. 응용 분야
5. 응용 분야
5.1. 이미지 인식
5.1. 이미지 인식
심층 신뢰망은 이미지 인식 분야에서 초기 성공을 거둔 심층 학습 모델 중 하나이다. 특히 MNIST 데이터셋과 같은 손글씨 숫자 인식 문제에서 당시 기준으로 뛰어난 성능을 보여주었다. 이는 계층적으로 구성된 제한된 볼츠만 머신이 이미지의 계층적 특징을 효과적으로 학습할 수 있기 때문이다. 낮은 계층에서는 엣지와 같은 지역적 특징을, 높은 계층에서는 더 추상적인 형태나 객체의 일부를 표현하는 방식으로 작동한다.
심층 신뢰망의 비지도 학습 기반 사전 훈련 방식은 레이블이 없는 대량의 이미지 데이터를 활용하여 유용한 특징 표현을 학습하는 데 유리했다. 이렇게 학습된 초기 가중치는 이후 지도 학습 단계인 미세 조정의 출발점을 더욱 개선시켜, 전체 모델의 수렴 속도와 최종 성능을 높이는 데 기여했다. 당시에는 그레이디언트 소실 문제로 인해 심층 신경망을 효과적으로 훈련시키기 어려웠기 때문에, 이러한 접근법은 중요한 돌파구가 되었다.
그러나 이후 합성곱 신경망이 이미지 인식 분야에서 부상하면서 심층 신뢰망의 사용은 상대적으로 줄어들었다. 합성곱 신경망은 이미지의 공간적 구조를 더 잘 반영하는 합성곱 연산과 풀링 계층을 사용하여, 특히 대규모 자연 이미지 데이터셋에서 더욱 강력한 성능을 입증했다. 오늘날 심층 신뢰망은 이미지 인식의 주류 모델로 널리 사용되지는 않지만, 심층 학습의 발전 역사와 특징 학습의 원리를 이해하는 데 중요한 모델로 자리 잡고 있다.
5.2. 음성 인식
5.2. 음성 인식
심층 신뢰망은 음성 인식 분야에서 중요한 발전을 이끈 초기 심층 학습 모델 중 하나이다. 음성 신호는 시간에 따라 변하는 매우 고차원의 복잡한 데이터이기 때문에, 이를 효과적으로 처리하기 위해서는 데이터의 계층적 표현을 학습할 수 있는 모델이 필요했다. 심층 신뢰망은 제한된 볼츠만 머신을 쌓아 구성되어, 비지도 방식으로 음성 데이터의 내재된 특징을 계층적으로 추출할 수 있다.
음성 인식에 심층 신뢰망을 적용할 때는 일반적으로 멜-주파수 켑스트럴 계수와 같은 음성 특징 벡터 시퀀스를 입력으로 사용한다. 모델은 먼저 비지도 사전 훈련을 통해 각 RBM 계층이 음성 신호의 통계적 구조를 포착하도록 학습한다. 이 과정을 통해 모델은 낮은 수준의 음향 특징에서부터 높은 수준의 음소나 단어 경계와 같은 추상적 표현을 점진적으로 학습하게 된다.
이렇게 학습된 표현은 이후 지도 학습 단계인 미세 조정에 활용된다. 최상위 층에 소프트맥스 함수를 갖는 분류기를 추가하고, 레이블이 붙은 데이터(예: 특정 음소 또는 단어)로 전체 네트워크를 재학습시켜 음성 인식 성능을 최적화한다. 이 접근법은 기존의 은닉 마르코프 모델 기반 방법보다 뛰어난 성능을 보여주며, 심층 학습이 음성 인식의 새로운 패러다임이 되는 데 기여했다.
심층 신뢰망의 성공은 이후 순환 신경망과 심층 순환 신경망, 트랜스포머와 같은 더 발전된 모델들이 음성 인식 분야를 지배하는 기반을 마련했다. 그러나 DBN은 심층 구조의 잠재력을 처음으로 실증적으로 보여주었다는 점에서 역사적 의미가 크다.
5.3. 추천 시스템
5.3. 추천 시스템
심층 신뢰망은 추천 시스템 분야에서 사용자의 복잡한 선호도 패턴과 아이템의 잠재적 특성을 학습하는 데 활용된다. 기존의 협업 필터링 방법이 사용자-아이템 상호작용 행렬의 결측값을 예측하는 데 초점을 맞췄다면, 심층 신뢰망은 사용자 행동 데이터나 아이템 콘텐츠 데이터 자체의 고차원적이고 비선형적인 표현을 학습할 수 있다. 이를 통해 사용자의 암묵적 피드백(예: 클릭, 시청 시간)이나 아이템의 다양한 속성(예: 텍스트, 이미지)을 효과적으로 통합한 추천이 가능해진다.
구체적으로, 심층 신뢰망은 여러 층의 제한된 볼츠만 머신을 쌓아 구성된다. 추천 시스템에서는 주로 사용자 프로필 데이터나 아이템의 특징 벡터를 입력으로 받아, 각 RBM 층을 통해 데이터를 점진적으로 추상화한다. 예를 들어, 넷플릭스의 영화 평점 데이터를 학습할 때, 하위 층은 개별 영화에 대한 선호도를, 상위 층은 장르나 감독 등 더 추상적인 취향 패턴을 학습하게 된다. 이러한 계층적 비지도 사전 훈련은 데이터 내에 숨겨진 구조를 발견하는 데 유리하다.
심층 신뢰망 기반 추천 시스템의 주요 장점은 협업 필터링의 '차원의 저주' 문제를 완화하고 콘텐츠 기반 필터링의 한계를 보완할 수 있다는 점이다. 즉, 희소한 평점 데이터만으로는 파악하기 어려운 사용자 간의 유사성이나 아이템 간의 관계를, 데이터의 풍부한 잠재 표현을 학습함으로써 더 잘 포착할 수 있다. 또한, 학습된 상위 층의 특징은 최종적으로 로지스틱 회귀나 소프트맥스 층을 추가한 지도 학습 방식으로 미세 조정되어, 특정 아이템에 대한 사용자의 선호도를 예측하는 데 직접 사용될 수 있다.
하지만, 딥러닝 기반의 다른 추천 모델(예: 와이드 앤 딥 러닝, 신경 협업 필터링)이 등장하면서, 순수한 심층 신뢰망 구조의 사용은 다소 줄어든 편이다. 이는 대규모 온라인 추천 시스템에서 요구되는 실시간 예측과 확장성 측면에서 상대적인 복잡성과 계산 비용 때문이다. 그럼에도 불구하고, 심층 신뢰망은 딥러닝을 추천 시스템에 성공적으로 적용한 초기 사례 중 하나로, 비정형 데이터로부터 의미 있는 표현을 학습한다는 핵심 아이디어는 이후 모델들에 지속적으로 영향을 미쳤다.
6. 역사와 발전
6. 역사와 발전
심층 신뢰망은 2006년 제프리 힌턴과 그의 동료들에 의해 제안된 심층 학습 모델이다. 이 모델의 등장은 기존의 인공신경망이 겪고 있던 기울기 소실 문제를 효과적으로 해결할 수 있는 방법을 제시했다는 점에서 중요한 전환점이 되었다. 특히, 제한된 볼츠만 머신을 쌓아 올린 계층적 구조와 그리디 방식의 비지도 사전 훈련 방법을 도입함으로써, 다층 신경망의 가중치 초기화 문제를 극복하고 더 깊은 네트워크의 학습을 가능하게 했다.
심층 신뢰망의 발전은 기계 학습 분야, 특히 비지도 특징 학습의 부흥을 이끌었다. 2000년대 중반까지 지도 학습에 편중되던 경향 속에서, 레이블이 없는 대량의 데이터로부터 계층적 표현을 학습할 수 있는 DBN의 접근법은 새로운 패러다임을 제시했다. 이는 이미지 인식과 음성 인식 같은 복잡한 패턴 인식 문제에서 당시 최고 수준의 성능을 달성하는 결과로 이어졌다.
그러나 2010년대 초반부터 합성곱 신경망(CNN)과 ReLU 활성화 함수, 고급 최적화 기법 등의 발전이 본격화되면서, 심층 신뢰망의 위상은 점차 변화하게 된다. CNN은 이미지 데이터의 공간적 구조를 더 잘 포착할 수 있었고, 사전 훈련 없이도 매우 깊은 네트워크를 직접 지도 학습으로 훈련시킬 수 있는 환경이 조성되었다. 이로 인해 DBN은 많은 응용 분야에서 CNN에 주도권을 내주게 되었다.
오늘날 심층 신뢰망은 역사적으로 의미 있는 모델로 평가받으며, 심층 학습의 발전사에서 중요한 이정표로 자리 잡고 있다. 비록 현재 주류 아키텍처는 아니지만, DBN에서 핵심이었던 비지도 사전 훈련과 생성 모델링에 대한 아이디어는 이후 제너레이티브 적대 신경망(GAN)이나 변분 자동 인코더 같은 현대 생성 모델의 발전에 간접적으로 영향을 미쳤다.
7. 관련 개념 및 모델
7. 관련 개념 및 모델
7.1. 볼츠만 머신
7.1. 볼츠만 머신
볼츠만 머신은 이진 상태를 가지는 확률적 인공신경망의 한 종류이다. 이 모델은 통계역학에서 유래한 에너지 기반 모델로, 가시층과 은닉층의 결합 확률 분포를 정의하기 위해 에너지 함수를 사용한다. 볼츠만 머신의 학습 목표는 주어진 가시층 데이터에 대한 확률을 최대화하는 모델 파라미터를 찾는 것이다.
제한된 볼츠만 머신은 볼츠만 머신의 특수한 형태로, 층 내부의 뉴런 간 연결은 허용하지 않고 가시층과 은닉층 사이의 연결만 존재하는 구조를 가진다. 이러한 제약 덕분에 효율적인 학습 알고리즘인 대비 발산을 적용할 수 있게 되었다. RBM은 심층 신뢰망을 구성하는 핵심 빌딩 블록으로, 여러 개의 RBM을 쌓아 올려 심층 구조를 형성한다.
RBM은 비지도 방식으로 데이터의 특징을 추출하는 능력을 가지고 있다. 가시층에 데이터를 입력하면, RBM은 이를 은닉층의 확률적 표현으로 인코딩한다. 학습이 잘된 RBM은 가시층 데이터의 분포를 효과적으로 모델링할 수 있으며, 이렇게 학습된 특징 표현은 상위 계층으로 전달되어 더욱 추상적인 특징 학습의 기초가 된다.
이러한 RBM의 계층적 조합과 그리디 학습 방식은 딥러닝 초기 발전에 중요한 기여를 했다. 특히 기울기 소실 문제로 인해 심층 신경망 학습이 어려웠던 시기에, DBN과 RBM 기반의 사전 훈련은 실용적인 심층 모델 학습을 가능하게 하는 돌파구 역할을 했다.
7.2. 자동 인코더
7.2. 자동 인코더
심층 신뢰망의 구조와 학습 방식은 자동 인코더와 유사점을 가진다. 자동 인코더도 입력 데이터를 압축된 표현으로 인코딩한 후, 이를 다시 원본에 가깝게 재구성하는 디코딩 과정을 통해 비지도 방식으로 특징을 학습하는 신경망이다. 이처럼 데이터의 핵심적인 특징을 추출한다는 점에서 두 모델의 목적이 공통된다.
그러나 심층 신뢰망이 주로 제한된 볼츠만 머신(RBM)을 기본 구성 요소로 사용하는 반면, 자동 인코더는 전통적으로 결정론적인 신경망 구조를 활용한다. 또한 심층 신뢰망의 학습이 계층별 비지도 사전 훈련과 지도 미세 조정의 두 단계로 명확히 구분되는 것과 달리, 자동 인코더는 재구성 오차 최소화라는 단일 목표를 통해 직접 학습이 이루어지는 경우가 많다.
이러한 차이에도 불구하고, 두 접근법 모두 딥러닝 초기 심층 구조의 학습 난제를 해결하기 위한 선구적 방법으로 평가받는다. 특히 라벨이 없는 대량의 데이터로부터 유용한 표현을 학습할 수 있다는 공통된 강점을 지닌다. 이후 등장한 변이형 자동 인코더나 잡음 제거 자동 인코더 등 다양한 자동 인코더 변형들은 심층 신뢰망과 함께 표현 학습 분야의 발전에 기여했다.
7.3. 합성곱 신경망(CNN)과의 비교
7.3. 합성곱 신경망(CNN)과의 비교
심층 신뢰망은 제한된 볼츠만 머신(RBM)을 쌓아 구성된 생성 모델로서, 주로 비지도 방식의 계층적 사전 훈련을 특징으로 한다. 이는 입력 데이터의 계층적인 특징 표현을 학습하는 데 강점을 보인다. 반면 합성곱 신경망(CNN)은 컨볼루션 연산과 풀링 계층을 활용하여 공간적 또는 지역적 구조(예: 이미지의 인접 픽셀 간 관계)를 효율적으로 추출하도록 설계된 판별 모델이다. 따라서 두 모델의 근본적인 목적과 구조가 다르다고 할 수 있다.
심층 신뢰망은 초기 심층 학습의 어려움인 기울기 소실 문제를 비지도 사전 훈련으로 완화하여 심층 구조 학습을 가능하게 한 선구적 모델이다. 하지만 매개변수 수가 많고 컨볼루션의 개념이 없어 이미지와 같은 격자 구조 데이터의 공간적 정보를 명시적으로 효율적으로 활용하지는 못한다. 이에 비해 합성곱 신경망은 공유 가중치와 국부 수용장을 통해 매개변수 효율성이 높고, 변환 불변성을 학습하는 데 매우 효과적이다.
응용 측면에서 심층 신뢰망은 초기 음성 인식이나 추천 시스템 분야에서 성과를 보였지만, 현재는 이미지 인식을 비롯한 컴퓨터 비전 분야에서는 합성곱 신경망이 사실상 표준 아키텍처로 자리 잡았다. 합성곱 신경망의 발전과 GPU 가속, 대규모 레이블된 데이터셋의 등장으로 지도 학습 성능이 비약적으로 향상되면서, 상대적으로 복잡한 학습 과정을 필요로 하는 심층 신뢰망의 활용도는 줄어들었다.
요약하면, 심층 신뢰망은 비지도 특징 학습과 생성 모델링에, 합성곱 신경망은 지도 학습 기반의 공간적 특징 추출과 판별 작업에 각각 특화되어 있다. 심층 신뢰망은 심층 학습의 가능성을 증명한 역사적 의미가 크지만, 현재 실용적인 딥러닝 응용에서는 합성곱 신경망이나 변환기 기반 모델들이 더 널리 사용되고 있다.
