문서의 각 단락이 어느 리비전에서 마지막으로 수정되었는지 확인할 수 있습니다. 왼쪽의 정보 칩을 통해 작성자와 수정 시점을 파악하세요.

마르코프 과정 | |
정의 | 미래 상태가 현재 상태에만 의존하고 과거 상태와는 독립적인 확률 과정 |
유형 | 이산 시간 마르코프 과정 연속 시간 마르코프 과정 |
최초 등장 | 1906년 |
개발자 | 안드레이 마르코프 |
주요 용도 | 확률론 통계 역학 대기열 이론 인공지능 음성 인식 |
상세 정보 | |
마르코프 성질 | 과거 상태의 조건부 확률 분포가 현재 상태에만 의존하는 성질 |
상태 공간 | 마르코프 과정이 취할 수 있는 모든 가능한 상태의 집합 |
전이 확률 | 한 상태에서 다른 상태로 이동할 확률 |
마르코프 체인 | 이산 시간, 이산 상태 공간을 가지는 마르코프 과정 |
관련 개념 | 마르코프 의사결정 과정 히든 마르코프 모델 |

마르코프 과정은 확률 과정의 한 종류로, 미래의 상태가 오직 현재 상태에만 의존하고 과거의 상태와는 독립적인 성질을 가진다. 이 핵심적인 성질을 마르코프 성질이라고 부르며, "기억이 없는" 과정으로 특징지어진다. 이 개념은 1906년 러시아의 수학자 안드레이 마르코프에 의해 처음 연구되었다.
마르코프 과정은 시간과 상태 공간이 이산적인지 연속적인지에 따라 주요 유형으로 구분된다. 시간이 불연속적인 경우를 이산 시간 마르코프 과정 또는 마르코프 연쇄라고 하며, 시간이 연속적으로 변화하는 경우를 연속 시간 마르코프 과정이라고 한다. 이러한 기본 모델을 바탕으로 의사결정과 보상을 포함한 마르코프 결정 과정과 같은 확장 모델도 개발되었다.
이 이론은 확률론과 통계 역학의 기초를 이루며, 실용적으로는 대기열 이론, 음성 인식, 강화 학습을 포함한 인공지능 분야, 생물정보학, 금융 공학 등 매우 다양한 영역에서 폭넓게 응용되고 있다. 마르코프 과정은 복잡한 확률 시스템을 모델링하고 분석하는 데 필수적인 도구로 자리 잡았다.

마르코프 과정은 확률 과정의 한 종류로, 미래의 상태가 오직 현재의 상태에만 의존하고 과거의 상태와는 독립적인 성질을 가진다. 이 핵심 성질을 마르코프 성질이라고 하며, "과거를 기억하지 않는다"는 의미에서 무기억성이라고도 불린다. 즉, 어떤 시스템이나 현상의 시간에 따른 변화를 모델링할 때, 그 다음 단계의 상태를 예측하는 데는 현재 시점의 정보만으로 충분하다는 가정을 기반으로 한다.
이 개념은 1906년 러시아의 수학자 안드레이 마르코프에 의해 처음 제안되었다. 그는 푸시킨의 시 '예브게니 오네긴'에서 모음과 자음의 등장 패턴을 분석하는 데 이 아이디어를 적용했다. 이후 이 이론은 확률론의 핵심 분야로 자리 잡았으며, 통계 역학, 대기열 이론, 인공지능 등 다양한 학문 분야의 기초가 되었다.
마르코프 과정은 시간과 상태 공간이 이산적인지 연속적인지에 따라 크게 두 가지로 구분된다. 시간이 불연속적인 경우를 이산 시간 마르코프 과정이라고 하며, 상태 또한 이산적일 때는 특히 마르코프 연쇄라고 부른다. 반면 시간이 연속적으로 변화하는 과정은 연속 시간 마르코프 과정으로 분류된다. 이러한 모델은 복잡하고 불확실한 동역학을 가진 현상을 수학적으로 간결하게 표현할 수 있는 강력한 도구를 제공한다.

이산 시간 마르코프 과정은 시간이 이산적인 값을 가질 때의 마르코프 과정이다. 즉, 시스템의 상태 변화가 특정한 시간 단계(예: 1초, 1일, 1회 시행)마다 발생하는 경우를 모델링한다. 이 과정은 현재 시점의 상태가 주어지면, 미래의 상태는 오직 현재 상태에만 의존하고 그 이전의 상태 역사와는 독립적이라는 마르코프 성질을 따른다.
이 과정의 핵심은 전이 확률로 표현되는데, 이는 현재 상태에서 다음 상태로 이동할 조건부 확률을 의미한다. 모든 가능한 상태 간의 전이 확률을 행렬 형태로 나타낸 것을 전이 확률 행렬이라고 한다. 이 행렬의 각 행은 현재 상태를, 각 열은 다음 상태를 나타내며, 각 행의 확률 합은 1이 된다. 이 행렬을 통해 과정의 확률적 동역학을 완전히 기술할 수 있다.
이산 시간 마르코프 과정은 마르코프 연쇄와 밀접한 관련이 있으며, 종종 같은 의미로 사용되기도 한다. 이 모델은 시간에 따른 상태 변화를 예측하거나, 장기적으로 과정이 도달하게 될 정상 분포를 계산하는 데 널리 활용된다. 또한, 강화 학습이나 음성 인식과 같은 인공지능 분야의 기초 모델로서도 중요하게 쓰인다.
연속 시간 마르코프 과정은 시간이 연속적으로 변화하는 가운데, 미래의 상태가 현재 상태에만 의존하는 확률 과정이다. 이산 시간 마르코프 과정이 특정한 시간 단계에서 상태를 관찰하는 것과 달리, 이 과정은 임의의 실수 시간 t에서 상태가 정의된다. 이는 시스템의 상태가 불규칙한 시간 간격으로 변화하는 현상을 모델링하는 데 적합하다.
이 과정의 핵심은 전이 확률이며, 이를 표현하는 데 전이 강도 행렬이 사용된다. 이 행렬의 각 요소는 특정 상태에서 다른 상태로 전이하는 순간적인 비율을 나타낸다. 이러한 연속 시간 모델은 대기행렬 이론에서 고객의 도착과 서비스 시간, 통계 역학에서 입자의 확산 현상, 생물정보학에서 DNA 서열의 진화 모델링 등 다양한 분야에서 응용된다.
연속 시간 마르코프 과정의 대표적인 예로는 푸아송 과정이 있다. 푸아송 과정은 사건 발생 시간 간격이 지수 분포를 따르는 특수한 경우로, 전화 교환기에 걸려오는 통화나 방사성 물질의 붕괴와 같은 희소 사건을 설명하는 데 널리 쓰인다. 또한, 생멸 과정은 개체군의 성장과 쇠퇴를 모델링하는 데 자주 활용된다.
마르코프 연쇄는 상태 공간이 이산적이며 시간이 이산적인 마르코프 과정을 가리키는 용어이다. 즉, 시간이 0, 1, 2와 같이 불연속적인 단계로 진행되고, 시스템이 취할 수 있는 상태들도 셀 수 있는 개수로 구분되는 모델이다. 이는 안드레이 마르코프가 처음 연구한 가장 기본적이고 대표적인 마르코프 과정의 형태로, 그의 이름을 딴 마르코프 체인이라고도 불린다.
마르코프 연쇄의 핵심은 마르코프 성질에 있다. 이 성질에 따르면, 과정의 다음 단계 상태는 오직 현재 단계의 상태에만 의존하며, 그 이전의 모든 역사와는 독립적이다. 이러한 '기억이 없는' 특성은 복잡한 확률 시스템을 분석하는 데 있어 계산을 크게 단순화시키는 강력한 장점을 제공한다. 이때 상태 간의 전이 가능성은 전이 확률로 표현되며, 이는 보통 전이 확률 행렬이라는 정방행렬 형태로 정리된다.
마르코프 연쇄는 이론 연구뿐만 아니라 다양한 실용 분야에 널리 응용된다. 대기행렬 이론에서 고객의 도착과 서비스 과정을 모델링하거나, 강화 학습에서 에이전트의 의사결정 과정을 표현하는 데 사용된다. 또한 생물정보학에서는 DNA 서열 분석, 금융 공학에서는 주가 변동이나 신용등급 변동을 모의하는 데에도 활용된다. 이러한 광범위한 적용 가능성은 마르코프 연쇄를 확률론과 응용 수학의 핵심 도구로 자리매김하게 했다.
마르코프 결정 과정은 의사결정자가 포함된 마르코프 과정의 한 유형이다. 이는 확률론과 동적 계획법을 결합한 수학적 모델로, 인공지능 분야, 특히 강화 학습의 이론적 기반을 제공한다. 마르코프 결정 과정은 의사결정자가 어떤 상태에 있을 때, 가능한 여러 행동 중 하나를 선택하고, 그 행동에 따라 보상을 받으며 다음 상태로 확률적으로 전이하는 과정을 모델링한다.
마르코프 결정 과정의 핵심 구성 요소는 상태 집합, 행동 집합, 상태 전이 확률, 보상 함수, 그리고 할인 계수이다. 의사결정자의 목표는 시간에 걸쳐 받을 누적 보상의 기댓값을 최대화하는 최적 정책, 즉 각 상태에서 어떤 행동을 취해야 할지에 대한 규칙을 찾는 것이다. 이 최적 정책은 벨만 방정식을 통해 계산되거나, 가치 반복이나 정책 반복과 같은 알고리즘을 통해 근사적으로 구할 수 있다.
마르코프 결정 과정은 불확실성이 존재하는 환경에서 순차적 의사결정 문제를 푸는 데 광범위하게 응용된다. 로봇의 경로 계획, 자원 할당, 재고 관리, 게임 이론, 그리고 금융 공학에서의 포트폴리오 최적화 등이 대표적인 예시이다. 또한, 마르코프 결정 과정은 부분 관측 마르코프 결정 과정으로 확장되어, 의사결정자가 상태를 완전히 관측하지 못하는 더 복잡한 상황도 다룰 수 있다.

마르코프 성질은 마르코프 과정의 가장 핵심적인 특성으로, 과정의 '기억이 없는' 성질을 의미한다. 정확히 말해, 어떤 확률 과정의 미래 상태는 오직 현재 상태에만 의존하며, 과거의 상태나 경로와는 조건부 독립이라는 성질을 지닌다. 이는 미래를 예측하는 데 있어 현재 시점의 정보만으로 충분하며, 과거의 역사는 더 이상 필요하지 않음을 나타낸다. 이러한 성질은 확률론에서 매우 강력한 단순화 도구로 작용하며, 복잡한 확률적 시스템을 분석 가능한 형태로 모델링하는 데 기초를 제공한다.
마르코프 성질은 수학적으로 조건부 확률을 통해 정의된다. 상태 공간이 이산적인 이산 시간 마르코프 과정을 예로 들면, 현재 시점 n의 상태가 X_n일 때, 다음 시점 n+1의 상태 X_{n+1}이 특정 값 j가 될 확률은 오직 현재 상태 X_n=i의 값에만 의존한다. 즉, 과거 상태 X_0, X_1, ..., X_{n-1}의 값들은 이 조건부 확률에 영향을 주지 않는다. 이 성질은 연속 시간 마르코프 과정에서도 동일하게 적용되며, 미래의 진화는 현재 상태에만 좌우된다.
이 성질 덕분에 마르코프 과정의 동역학은 전이 확률이라는 개념으로 간결하게 기술될 수 있다. 전이 확률은 현재 상태에서 다음 상태로 이동할 확률을 나타내는 행렬 또는 함수로, 마르코프 성질이 없었다면 훨씬 더 복잡한 고차원의 조건부 확률 분포를 고려해야 했을 것이다. 따라서 마르코프 성질은 모델의 복잡도를 현저히 낮추고, 정상 분포 계산이나 상태 분류와 같은 분석을 가능하게 하는 열쇠이다.
마르코프 성질은 현실 세계의 많은 시스템을 근사적으로 모델링하는 데 유용하게 적용된다. 예를 들어, 대기행렬 이론에서 고객의 도착 간격이나 서비스 시간, 금융 공학에서 자산 가격의 변동, 강화 학습에서 에이전트가 상호작용하는 환경 등은 종종 마르코프 성질을 가정하여 분석된다. 물론 완벽한 기억 상실은 현실에서 찾기 어렵지만, 이러한 가정 하에 개발된 이론과 알고리즘은 실제 문제를 해결하는 데 매우 효과적으로 사용되고 있다.
전이 확률은 마르코프 과정에서 현재 상태가 주어졌을 때, 다음 특정 상태로 전이될 조건부 확률을 의미한다. 이는 마르코프 성질의 수학적 표현으로, 과정의 역학을 완전히 결정하는 핵심 요소이다. 상태 공간이 이산적인 경우, 이 확률은 보통 전이 행렬로 표현되며, 행렬의 각 요소는 한 상태에서 다른 상태로 이동할 확률을 나타낸다.
연속 시간 마르코프 과정에서는 전이 확률 대신 전이 강도 행렬이 사용된다. 이 행렬의 요소는 특정 상태에서 다른 상태로의 순간적인 전이율을 나타내며, 이를 통해 임의의 시간 간격에 대한 전이 확률을 계산할 수 있다. 이러한 전이 확률은 시간에 따라 변하지 않는 경우 정상적 또는 시간 동질적이라고 한다.
전이 확률은 마르코프 과정을 분석하는 데 필수적이다. 이를 통해 상태의 점유 확률이 시간에 따라 어떻게 진화하는지 계산할 수 있으며, 장기적으로 과정이 도달할 수 있는 정상 분포를 찾는 데도 사용된다. 또한, 마르코프 결정 과정이나 히든 마르코프 모델과 같은 복잡한 모델의 기초를 구성한다.
응용 분야에 따라 전이 확률의 추정이 중요한 과제가 된다. 예를 들어, 음성 인식에서는 관측된 음성 신호로부터 은닉된 언어 모델의 상태 전이 확률을 학습하며, 생물정보학에서는 DNA 서열 분석을 위해 전이 확률을 활용한다. 금융 공학에서는 주가나 신용 등급의 변동을 모델링할 때 전이 확률 행렬이 핵심 도구로 쓰인다.
정상 분포는 마르코프 과정이 장기적으로 도달하는 균형 상태를 나타내는 확률 분포이다. 이 분포는 과정이 충분히 많은 전이를 거친 후, 시간이 지나도 더 이상 변하지 않는 안정된 상태 확률 분포를 의미한다. 즉, 과정의 상태 확률이 시간에 따라 변하지 않고 일정하게 유지될 때, 그 분포를 정상 분포라고 한다. 이는 마르코프 과정의 장기적 행동을 분석하는 데 핵심적인 개념이다.
정상 분포는 전이 확률 행렬과 밀접한 관계가 있다. 이산 시간 마르코프 연쇄의 경우, 정상 분포 벡터 π는 전이 확률 행렬 P에 대해 πP = π를 만족하는 고유벡터로 구할 수 있다. 이 방정식은 과정이 정상 분포 π에 있을 때, 한 단계 후의 상태 분포도 동일한 π가 됨을 의미한다. 연속 시간 마르코프 과정에서는 전이율 행렬 Q를 사용한 방정식 πQ = 0을 통해 정상 분포를 계산한다.
모든 마르코프 과정이 정상 분포를 가지는 것은 아니다. 정상 분포의 존재와 유일성은 과정의 특성에 달려 있다. 예를 들어, 모든 상태가 서로 도달 가능하고 주기적이지 않은 에르고딕 과정은 유일한 정상 분포를 가진다. 반면, 흡수 상태가 있거나 여러 개의 소통 부류로 나뉘는 과정은 정상 분포가 존재하지 않거나 유일하지 않을 수 있다.
정상 분포는 대기행렬 이론에서 시스템의 장기적 평균 대기 시간이나 서버의 점유율을 계산하는 데, 통계 역학에서 물리 시스템의 평형 상태를 모델링하는 데, 그리고 페이지랭크 알고리즘과 같은 다양한 응용 분야에서 중요한 역할을 한다. 이는 과정의 균형 상태를 수학적으로 정의함으로써 복잡한 확률 시스템의 장기 예측을 가능하게 한다.

대기행렬 이론은 서비스 창구에 도착하는 고객과 서비스 시간을 확률적으로 모델링하는 분야이다. 이 이론에서 마르코프 과정은 시스템의 상태 변화를 분석하는 핵심 도구로 활용된다. 특히, 도착 간격과 서비스 시간이 지수 분포를 따를 때, 시스템은 마르코프 성질을 만족하는 연속 시간 마르코프 과정으로 모델링될 수 있다. 이러한 모델을 M/M/1 대기행렬이나 M/M/c 대기행렬과 같은 표기법으로 나타낸다.
대기행렬 시스템의 상태는 일반적으로 시스템 내에 있는 고객의 수로 정의된다. 마르코프 과정을 적용하면, 현재 시점의 고객 수가 주어졌을 때 미래의 고객 수는 과거의 역사와 무관하게 결정된다. 이를 통해 시스템의 안정 상태 확률, 평균 대기 시간, 평균 시스템 내 고객 수 등 중요한 성능 지표를 계산할 수 있다. 이러한 분석은 통신 네트워크, 콜 센터, 물류 및 병원 운영 등 다양한 서비스 시스템의 설계와 용량 계획에 필수적이다.
강화 학습은 에이전트가 환경과 상호작용하며 보상을 최대화하는 행동을 학습하는 인공지능의 한 분야이다. 이 학습 과정에서 마르코프 결정 과정은 핵심적인 수학적 틀을 제공한다. 마르코프 결정 과정은 마르코프 성질을 따르는 상태, 가능한 행동, 상태 전이에 따른 보상, 그리고 미래 보할인을 결정하는 할인율로 구성된다. 에이전트는 현재 상태에서 어떤 행동을 취했을 때 발생할 다음 상태와 보할인에 대한 기댓값을 바탕으로 최적의 정책을 학습하게 된다.
강화 학습의 대표적인 알고리즘들은 마르코프 결정 과정을 기반으로 한다. 벨만 방정식은 최적 정책이 만족해야 할 조건을 제시하며, 동적 계획법, 몬테카를로 방법, 시간차 학습 등은 이 방정식을 근사적으로 풀기 위한 다양한 방법론이다. 특히 Q-러닝은 상태-행동 쌍의 가치를 직접 학습하는 모델 없는 알고리즘으로, 환경의 모델을 알지 못해도 최적의 행동을 찾을 수 있게 한다. 이러한 접근법은 로봇 공학, 게임 AI, 자율 주행 등 복잡한 의사결정이 요구되는 분야에 널리 응용된다.
음성 인식 분야에서 마르코프 과정은 주로 히든 마르코프 모델의 기반이 되어 핵심적인 역할을 한다. 음성 신호는 시간에 따라 변화하는 연속적인 신호이며, 이는 일련의 음소나 단어와 같은 숨겨진 상태들에 의해 생성된다고 모델링할 수 있다. 이때, 각 음성 프레임의 관측값은 그 순간의 숨겨진 발음 상태에 의존하며, 상태 간의 전이는 마르코프 성질을 따른다고 가정한다. 즉, 다음에 어떤 음소가 올지는 현재 음소 상태에만 영향을 받고, 그 이전의 음소 역사와는 독립적이라는 것이다.
이러한 모델링을 통해 음성 인식 시스템은 주어진 음성 파형(관측열)을 가장 잘 설명하는 단어 열(상태열)을 찾아내는 문제를 풀게 된다. 구체적으로, 히든 마르코프 모델은 세 가지 요소로 구성된다. 첫째는 각 상태(예: 음소)에서 특정 관측값(예: 주파수 스펙트럼)이 생성될 확률인 출력 확률이다. 둘째는 상태가 다른 상태로 전이할 확률이다. 셋째는 초기 상태 분포이다. 다이나믹 프로그래밍 기법인 비터비 알고리즘은 이 모델을 이용해 최적의 상태 열을 효율적으로 탐색하는 데 사용된다.
마르코프 과정 기반의 음성 인식 기술은 자연어 처리와 결합되어 현대의 음성 비서 및 자동 전사 서비스의 토대를 이루었다. 초기 연구 단계부터 상용 시스템에 이르기까지, 음성의 시간적 패턴과 불확실성을 체계적으로 다룰 수 있는 마르코프 모델의 프레임워크는 필수적이었다. 이는 음성 인식을 단순한 패턴 매칭을 넘어 통계적 추론의 영역으로 끌어올리는 계기가 되었다.
마르코프 과정은 생물정보학 분야에서 유전체 서열 분석, 단백질 구조 예측, 진화 모델링 등 다양한 핵심 문제를 모델링하는 데 널리 활용된다. 특히 DNA나 아미노산 서열과 같은 선형 서열 데이터는 마르코프 성질, 즉 다음 위치의 상태가 바로 이전 위치의 상태에만 의존한다는 가정을 자연스럽게 반영하는 경우가 많아 이론적 틀로서 적합하다.
가장 기본적인 응용은 서열 정렬과 유전자 예측이다. 유전자 영역과 비코딩 영역은 뉴클레오타이드 출현 패턴이 다르므로, 이산 시간 마르코프 연쇄를 통해 서열을 생성하는 모델을 구축하면 주어진 게놈 서열 내에서 유전자 위치를 찾아낼 수 있다. 더 복잡한 히든 마르코프 모델은 관측 가능한 DNA 서열 뒤에 숨겨진 상태(예: 프로모터, 엑손, 인트론)를 추정하는 데 사용된다.
또한 마르코프 과정은 분자 진화를 연구하는 도구로도 중요하다. 진화 거리를 추정하거나 계통수를 구성할 때 사용되는 진화 모델(예: Jukes-Cantor 모델, Kimura 모델)은 연속 시간 마르코프 과정에 기반을 둔다. 이 모델들은 공통 조상으로부터 시간에 따라 뉴클레오타이드 또는 아미노산이 치환될 확률을 설명하며, 생물종 간의 계통 발생 관계를 통계적으로 추론하는 근간이 된다.
마르코프 과정은 금융 공학 분야에서 자산 가격의 변동을 모델링하고 위험을 평가하는 데 널리 활용된다. 특히 주가나 이자율과 같은 금융 변수의 미래 움직임을 예측할 때, 그 변화가 과거 전체 경로가 아닌 현재 상태에만 의존한다는 마르코프 성질을 가정하는 모델들이 많이 사용된다. 이는 복잡한 금융 시장을 상대적으로 단순화하여 분석할 수 있게 해준다.
가장 대표적인 예는 주가 변동을 기술하는 기하 브라운 운동 모델이다. 이 모델은 주가의 로그 수익률이 정규 분포를 따른다고 가정하며, 미래 주가는 현재 주가와 무관한 확률적 충격에 의해 결정된다는 점에서 마르코프 성질을 지닌다. 이 모델은 블랙-숄즈 방정식을 비롯한 많은 옵션 가격 결정 모델의 기초가 된다. 또한 이자율의 시간에 따른 변화를 설명하는 다양한 단일 요인 모델들도 대부분 마르코프 과정을 전제로 한다.
금융 위험 관리 측면에서는 신용 등급의 변동을 모델링하는 데 마르코프 과정이 적용된다. 기업의 신용도가 시간에 따라 변화하는 과정을 이산 시간 마르코프 과정으로 간주하고, 현재 등급에서 다른 등급으로 전이할 확률을 나타내는 전이 행렬을 추정한다. 이를 통해 신용 위험을 정량화하고, 신용부도스왑이나 기타 신용 파생상품의 가치를 평가할 수 있다.
또한, 강화 학습과 같은 인공지능 기법이 금융 전략 최적화에 도입되면서, 그 이론적 토대인 마르코프 결정 과정의 중요성도 증가하고 있다. 이는 투자자가 특정 상태(시장 환경)에서 행동(투자 결정)을 취해 보상을 얻고 상태가 전이되는 과정을 체계적으로 최적화하는 프레임워크를 제공한다.

히든 마르코프 모델(HMM)은 관찰 가능한 출력(관측열)을 생성하는, 직접 관찰할 수 없는 내부 상태들이 마르코프 과정을 따르는 통계적 모델이다. 즉, 시스템의 내부 상태는 숨겨져 있고, 그 상태에서 관측 가능한 기호나 신호만을 볼 수 있는 상황을 모델링한다. 이 모델은 관측된 사건들의 시퀀스로부터 그 사건들을 발생시킨 가장 확률이 높은 상태들의 시퀀스를 추론하는 데 사용된다.
히든 마르코프 모델은 일반적으로 세 가지 기본 문제를 해결한다. 첫째, 평가 문제는 주어진 모델 매개변수와 관측 시퀀스가 주어졌을 때, 그 관측 시퀀스가 발생할 확률을 계산한다. 둘째, 디코딩 문제는 주어진 관측 시퀀스와 모델에 대해 가장 가능성 높은 숨겨진 상태 시퀀스를 찾는 것이다. 셋째, 학습 문제는 관측 시퀀스들로부터 모델의 매개변수(상태 전이 확률, 관측 확률, 초기 상태 분포)를 추정하는 것이다.
이 모델은 특히 시계열 데이터 분석에 강력하게 적용된다. 대표적인 응용 분야로는 음성 인식이 있으며, 여기서 관측열은 음성 신호의 특징 벡터 시퀀스이고, 숨겨진 상태는 단어나 음소를 구성하는 서브 단위가 된다. 또한 생물정보학에서 DNA 서열 분석이나 단백질 구조 예측, 자연어 처리에서의 품사 태깅, 그리고 금융 공학에서의 시계열 예측 등 다양한 분야에서 활용된다.
히든 마르코프 모델의 학습에는 주로 바움-웰치 알고리즘이 사용되며, 디코딩에는 비터비 알고리즘이 표준적으로 사용된다. 이 모델은 관측 데이터를 생성하는 내부의 동적인 구조를 추론할 수 있게 해주는 강력한 도구로서, 기계 학습과 패턴 인식의 핵심 모델 중 하나로 자리 잡았다.
마르코프 랜덤 필드는 마르코프 과정의 개념을 다차원 공간으로 확장한 확률 모델이다. 마르코프 과정이 시간적 순서에 따른 의존성을 다룬다면, 마르코프 랜덤 필드는 공간적으로 배열된 변수들 간의 상호작용과 지역적 의존성을 모델링한다. 이는 그래프 이론을 바탕으로 하며, 변수들은 그래프의 노드로, 변수들 간의 의존 관계는 에지로 표현된다.
마르코프 랜덤 필드의 핵심 성질은 마르코프 성질의 공간적 버전인 지역적 마르코프 성질이다. 이는 어떤 노드의 상태가 주변 이웃 노드들의 상태가 주어졌을 때, 그래프 상에서 더 멀리 떨어진 다른 모든 노드들과 조건부 독립이라는 것을 의미한다. 즉, 각 변수의 확률 분포는 오직 그 변수와 직접적으로 연결된 이웃 변수들에만 영향을 받는다. 이러한 성질은 조건부 독립과 그래피컬 모델의 중요한 기초가 된다.
마르코프 랜덤 필드는 주로 컴퓨터 비전, 영상 처리, 통계 물리학 분야에서 널리 응용된다. 예를 들어, 디지털 이미지에서 각 픽셀의 값을 노드로, 인접한 픽셀들 간의 관계를 에지로 표현하여 이미지 분할, 노이즈 제거, 스테레오 비전 등의 문제를 해결하는 데 사용된다. 또한, 이징 모델과 같은 통계 물리학의 모델도 마르코프 랜덤 필드의 한 형태로 설명될 수 있다.
마르코프 랜덤 필드와 밀접한 관련이 있는 모델로는 조건부 무작위장이 있다. 두 모델 모두 그래프 구조를 사용하지만, 마르코프 랜덤 필드는 결합 확률 분포를 모델링하는 반면, 조건부 무작위장은 관측값이 주어졌을 때의 조건부 확률 분포를 직접 모델링한다는 차이점이 있다. 이는 기계 학습과 패턴 인식 작업에서 유용한 특성이다.
마르코프 부등식은 확률론에서 중요한 부등식 중 하나로, 확률 변수가 특정 값을 초과할 확률에 대한 상한을 제공한다. 이는 체비쇼프 부등식과 같은 다른 확률 부등식의 기초가 되는 기본적인 도구이다. 마르코프 부등식은 음이 아닌 확률 변수에 대해서만 성립하며, 확률 변수의 기댓값만을 사용하여 그 분포의 꼬리 부분에 대한 정보를 추정할 수 있게 해준다.
구체적으로, 음이 아닌 확률 변수 X와 임의의 양수 a에 대해, X가 a 이상일 확률은 X의 기댓값을 a로 나눈 값보다 크지 않다는 것을 보여준다. 이는 확률 변수의 분포에 대한 추가 정보 없이도, 단순히 평균값만 알면 극단적인 값이 나타날 가능성에 대해 간단한 한계를 설정할 수 있음을 의미한다. 따라서 이 부등식은 통계학적 추정이나 알고리즘 분석에서 최악의 경우를 간편하게 평가할 때 유용하게 활용된다.
마르코프 부등식은 그 증명이 간단하고 직관적이어서 확률론 입문 과정에서 자주 소개된다. 이 부등식은 확률 분포의 형태에 구애받지 않는 일반성을 가지지만, 그 상한이 비교적 느슨할 수 있다는 한계도 있다. 보다 정확한 상한을 얻기 위해서는 분산과 같은 추가적인 모멘트 정보를 활용하는 체비쇼프 부등식이나, 모멘트 생성 함수를 사용하는 체르노프 부등식과 같은 다른 부등식들이 사용된다.
이 부등식은 알고리즘 복잡도 분석, 특히 기대 수행 시간 분석에서 알고리즘이 특정 시간을 초과하여 실행될 확률을 제한하는 데 자주 사용된다. 또한 정보 이론이나 통계적 학습 이론에서도 다양한 증명의 기본 도구로 등장한다. 마르코프 부등식은 그 이름과 달리 마르코프 과정의 성질을 직접적으로 사용하여 유도되지는 않지만, 확률론의 기초를 이루는 중요한 정리로서 확률적 현상을 이해하는 데 기여한다.

마르코프 과정은 러시아 수학자 안드레이 마르코프가 1906년에 처음 소개한 개념이다. 그는 알렉산드르 푸시킨의 시 '예브게니 오네긴'에 나오는 모음과 자음의 연속을 분석하는 과정에서 이 아이디어를 발전시켰다. 이 연구는 문헌의 통계적 특성을 조사하는 초기 사례로, 순수 수학 이론이 실제 언어 데이터 분석에 적용된 선구적인 예가 되었다.
마르코프의 초기 연구는 주로 이산 시간 마르코프 연쇄에 국한되었으나, 이후 그의 아이디어는 폴 랑주뱅과 앙드레 콜모고로프 같은 수학자들에 의해 연속 시간 과정으로 확장되었다. 이 과정은 확률론의 핵심 도구로 자리 잡았을 뿐만 아니라, 통계 역학, 정보 이론, 그리고 현대의 인공지능 및 데이터 과학에 이르기까지 광범위한 분야의 이론적 기초를 제공한다.
특히 강화 학습과 음성 인식 분야에서 마르코프 과정의 개념은 마르코프 결정 과정과 히든 마르코프 모델 같은 고급 모델의 토대가 되었다. 이러한 모델들은 기계가 순차적 의사결정을 하거나 시계열 데이터의 패턴을 인식하는 방식을 근본적으로 바꾸어 놓았다.