계산 언어학 (r1)

1. 개요

계산 언어학은 자연어를 계산적으로 모델링하고 처리하는 학문 분야이다. 컴퓨터 과학, 언어학, 인공지능의 경계에 위치한 학제간 연구 영역으로, 인간의 언어를 형식화하고 알고리즘을 통해 분석 및 생성하는 방법을 탐구한다.

이 분야의 주요 목표는 언어 현상을 수학적 또는 논리적 모델로 표현하고, 이를 바탕으로 컴퓨터가 언어를 이해하고 처리할 수 있는 시스템을 구축하는 것이다. 이를 위해 형태소 분석, 구문 분석, 의미 분석, 담화 분석 등 언어의 다양한 층위에 대한 계산 모델을 개발한다.

계산 언어학의 연구 성과는 기계 번역, 정보 검색, 음성 인식, 텍스트 마이닝, 질의 응답 시스템 등 다양한 실제 응용 분야에 직접적으로 기여한다. 이는 단순한 이론 연구를 넘어 실용적인 자연어 처리 기술의 기반을 제공한다는 점에서 그 중요성이 크다.

2. 역사

계산 언어학의 역사는 1950년대 초기 컴퓨터의 등장과 함께 시작된다. 이 시기 인공지능 연구의 일환으로 자연어를 기계가 처리할 수 있는 형태로 모델링하려는 시도가 본격화되었다. 초기 연구는 주로 기계 번역에 집중되었으며, 특히 냉전 시대에 러시아어와 영어 간의 자동 번역에 대한 군사적, 학술적 수요가 큰 동력이 되었다. 1960년대에는 노엄 촘스키의 생성 문법 이론이 큰 영향을 미치며, 언어의 규칙 기반 모델링에 대한 연구가 활발히 진행되었다.

1970년대와 1980년대에는 규칙 기반 접근법이 한계에 부딪히면서, 대규모 말뭉치를 활용한 경험적, 통계적 방법론이 대두되기 시작했다. 이 시기 통계적 언어 모델과 정보 검색 시스템의 기초가 마련되었다. 1990년대에는 컴퓨터 성능의 비약적 발전과 디지털 텍스트 데이터의 폭발적 증가로 인해, 빅데이터를 기반으로 한 통계적 방법론이 계산 언어학의 주류를 이루게 되었다. 이는 기계 번역 분야에서 규칙 기반 시스템에서 통계적 기계 번역 시스템으로의 패러다임 전환을 가져왔다.

2000년대 후반부터는 딥러닝과 신경망 기술의 혁신적 발전이 계산 언어학에 새로운 전기를 마련했다. 순환 신경망과 어텐션 메커니즘을 기반으로 한 신경망 언어 모델은 언어 이해 및 생성 과제에서 이전의 통계적 방법들을 크게 능가하는 성능을 보여주었다. 특히 트랜스포머 아키텍처의 등장은 BERT나 GPT와 같은 초대규모 사전 훈련 언어 모델의 개발로 이어져, 질의응답 시스템, 텍스트 요약, 감정 분석 등 다양한 응용 분야의 성능을 혁신적으로 향상시켰다.

이러한 역사적 흐름을 통해 계산 언어학은 순수 언어학 이론과 컴퓨터 과학의 실용적 기법이 융합된 학제간 연구 분야로 성장했다. 초기의 단순한 규칙 기반 처리에서 오늘날의 맥락을 이해하고 생성하는 복잡한 인공지능 시스템에 이르기까지, 그 발전은 지속적인 기술적 도전과 이를 해결하기 위한 방법론의 진화를 보여준다.

3. 주요 연구 분야

3.1. 자연어 처리

자연어 처리는 계산 언어학의 핵심적인 연구 분야로, 인간이 일상적으로 사용하는 언어를 컴퓨터가 이해하고, 생성하며, 조작할 수 있도록 하는 기술과 방법론을 다룬다. 이 분야는 인공지능과 컴퓨터 과학의 중요한 하위 영역으로, 언어학의 이론적 기반 위에 수학적 모델과 알고리즘을 적용한다.

주요 연구 목표는 텍스트나 음성과 같은 자연어 데이터로부터 의미 있는 정보를 추출하고, 이를 기반으로 다양한 작업을 자동화하는 것이다. 이를 위해 형태소 분석, 구문 분석, 의미 분석, 담화 분석 등 언어의 여러 층위를 체계적으로 처리하는 기술이 개발되어 왔다. 이러한 기초 기술들은 더 복잡한 응용 시스템의 구성 요소로 활용된다.

자연어 처리의 성과는 다양한 실용적인 응용 분야에서 확인할 수 있다. 대표적으로 기계 번역, 정보 검색, 음성 인식, 텍스트 마이닝, 질의 응답 시스템 등이 있으며, 최근에는 챗봇과 가상 비서와 같은 대화형 인터페이스의 핵심 기술로도 주목받고 있다. 초기에는 규칙 기반 방법이 주를 이루었으나, 현재는 대규모 말뭉치를 활용한 통계적 방법과 딥러닝 기반의 신경망 모델이 주류를 이루고 있다.

3.2. 계산 사전학

계산 사전학은 사전의 구조와 내용을 체계적으로 분석하고, 이를 컴퓨터가 처리할 수 있는 형태로 구축하는 계산 언어학의 하위 분야이다. 전통적인 종이 사전의 편찬 및 분석 과정에 계산 방법론을 도입하여, 사전 데이터의 효율적인 관리, 검색, 확장을 목표로 한다. 이 분야는 전자 사전이나 머신 리더블 사전과 같은 디지털 사전 자원의 개발과 밀접한 관련이 있다.

주요 연구 내용으로는 사전 항목의 자동 추출, 어휘 정보의 구조화, 동의어 및 상하의어 관계와 같은 의미 관계 네트워크 구축 등이 포함된다. 또한, 대규모 말뭉치로부터 단어의 용례와 결합 정보를 자동으로 수집하여 사전 정보를 보강하는 방법도 중요한 연구 주제이다. 이를 통해 기존 사전의 한계를 넘어 지속적으로 진화하는 언어 현상을 반영할 수 있다.

계산 사전학의 성과는 자연어 처리 시스템의 핵심 구성 요소로 활용된다. 예를 들어, 형태소 분석이나 의미 분석을 수행할 때 정확한 단어 정보와 의미 관계 데이터가 필요하며, 계산 사전학을 통해 구축된 고품질의 어휘 자원은 기계 번역, 정보 검색, 질의응답 시스템 등의 성능 향상에 기여한다.

3.3. 말뭉치 언어학

말뭉치 언어학은 대규모의 실제 언어 데이터 집합인 말뭉치를 수집하고 분석하여 언어의 사용 양상을 경험적으로 연구하는 분야이다. 이는 전통적인 언어학이 내재된 언어 능력이나 직관에 의존하는 것과는 대조적으로, 실제 사용된 언어 데이터를 기반으로 언어 현상을 관찰하고 규칙을 도출한다는 점에서 특징을 가진다. 디지털 기술의 발전과 함께 방대한 양의 텍스트 데이터를 전산적으로 처리하고 분석할 수 있게 되면서, 말뭉치 언어학은 계산 언어학과 자연어 처리 연구의 핵심적인 기초 방법론으로 자리 잡았다.

말뭉치 언어학의 주요 작업은 말뭉치의 구축과 주석 첨가이다. 원시 텍스트를 수집한 원시 말뭉치에 더해, 품사 태깅, 구문 분석, 의미 역할 표시 등 다양한 층위의 언어 정보를 기계가 읽을 수 있는 형태로 부가하여 주석 말뭉치를 만든다. 이러한 주석 작업은 자동화 도구를 활용하지만, 정확성을 높이기 위해 수작업 검증이 병행되기도 한다. 대표적인 말뭉치로는 영어의 브라운 코퍼스나 영국국립코퍼스, 한국어의 세종 말뭉치와 한국어 용례 말뭉치 등이 있다.

이 분야의 연구는 언어 현상에 대한 통계적 정보를 제공한다. 특정 단어의 출현 빈도, 단어 동시 출현, N-gram 패턴, 문법 구조의 분포 등을 정량적으로 분석함으로써, 언어 모델의 개발이나 사전 편찬에 실증적인 근거를 제시한다. 예를 들어, 통계적 기계 번역이나 초기의 언어 모델은 말뭉치로부터 추출된 빈도 통계에 크게 의존했다. 또한, 어휘 의미론 연구에서 단어의 의미와 용법을 말뭉치 내 맥락을 통해 분석하는 분포 의미론이 중요한 패러다임으로 부상했다.

말뭉치 언어학은 기계 학습 기반 자연어 처리 모델의 발전에 지속적으로 기여하고 있다. 현대의 딥러닝 모델은 엄청난 규모의 말뭉치 데이터를 학습하여 언어 표현을 습득한다. 이 과정에서 말뭉치의 질과 양, 주석의 정확성은 모델 성능에 직접적인 영향을 미친다. 따라서 효율적인 말뭉치 구축 방법론, 주석 체계의 표준화, 데이터 균형 문제 등은 말뭉치 언어학의 지속적인 연구 과제로 남아 있다.

3.4. 기계 번역

기계 번역은 한 언어로 작성된 텍스트나 음성을 다른 언어로 자동 변환하는 기술이다. 이는 계산 언어학의 가장 오래되고 대표적인 응용 분야 중 하나로, 인공지능과 자연어 처리 기술의 발전과 밀접하게 연관되어 있다. 초기에는 규칙 기반 방식이 주를 이루었으나, 현재는 통계적 언어 모델과 신경망 언어 모델을 활용한 데이터 중심의 접근법이 표준이 되었다.

기계 번역 시스템의 핵심은 원문의 의미를 정확히 이해하고, 목표 언어로 자연스럽게 재구성하는 것이다. 이를 위해 형태소 분석, 구문 분석, 의미 분석 등 다양한 단계의 언어 처리 기술이 통합적으로 적용된다. 특히 딥러닝과 어텐션 메커니즘을 기반으로 한 신경망 기계 번역은 번역 품질을 획기적으로 향상시켰다.

기계 번역의 주요 접근법은 다음과 같다.

접근법	설명	주요 특징
규칙 기반 번역	언어학적 규칙과 사전에 의존	전문가의 지식 필요, 유지보수 어려움
통계 기반 번역	대규모 병렬 말뭉치에서 통계 패턴 학습	데이터 의존성 높음
신경망 기계 번역	심층 신경망을 이용해 번역 모델 구축	현재 가장 널리 사용되는 방식

이 기술은 구글 번역, 파파고 등의 상용 서비스는 물론, 글로벌 비즈니스, 학술 교류, 실시간 통역 등 다양한 분야에서 필수적인 도구로 자리 잡았다. 그러나 문화적 맥락, 관용구, 문학적 표현 등을 처리하는 데는 여전히 한계가 존재하며, 이는 계산 언어학의 지속적인 연구 과제로 남아 있다.

4. 핵심 기법 및 모델

4.1. 통계적 언어 모델

통계적 언어 모델은 주어진 단어 시퀀스의 확률을 계산하거나, 다음에 올 단어를 예측하는 데 사용되는 모델이다. 이 모델의 핵심 아이디어는 언어 현상을 확률론적으로 접근하여, 대규모 말뭉치 데이터에서 단어들의 출현 빈도와 결합 패턴을 통계적으로 학습하는 데 있다. 초기 기계 번역과 음성 인식 시스템의 성능 향상에 기여한 핵심 기술 중 하나로, 자연어 처리의 기초를 마련했다.

가장 기본적인 모델인 N-gram 모델은 마르코프 가정을 바탕으로, 특정 단어의 등장 확률을 바로 앞의 (N-1)개의 단어에만 의존시켜 근사한다. 예를 들어, 바이그램 모델(N=2)은 한 단어의 확률을 바로 앞의 한 단어에만 기반하여 계산한다. 이러한 모델은 계산이 간단하고 직관적이라는 장점이 있지만, 문맥의 길이가 제한되고 데이터 희소 문제에 취약하다는 한계를 지닌다.

모델 유형	설명	주요 한계
유니그램	각 단어가 독립적으로 등장한다고 가정	문맥 정보 전혀 고려 불가
바이그램	바로 앞의 한 단어만 문맥으로 고려	장기 의존성 모델링 불가
트라이그램	바로 앞의 두 단어를 문맥으로 고려	데이터 희소성 문제 심화

이러한 한계를 완화하기 위해 다양한 평활화 기법이 개발되었다. 가법 평활이나 케이츠-네이 추정과 같은 방법들은 관찰되지 않은 N-gram에 작은 확률 값을 할당하여 모델의 일반화 성능을 높이려 했다. 통계적 언어 모델은 이후 신경망 언어 모델의 등장으로 그 주류 위치를 내주었지만, 여전히 자원이 제한된 환경이나 모델의 해석 가능성이 중요한 분야에서 기초적인 접근법으로 활용되고 있다.

4.2. 신경망 언어 모델

신경망 언어 모델은 인공 신경망을 기반으로 단어 시퀀스의 확률 분포를 학습하고 예측하는 모델이다. 기존의 통계적 언어 모델이 n-gram과 같은 국소적인 통계 정보에 의존하는 데 비해, 신경망 언어 모델은 분산 표현을 통해 단어의 의미적, 문법적 정보를 저차원의 실수 벡터로 압축하여 표현한다. 이를 통해 단어 간의 유사도를 계산할 수 있고, 훈련 데이터에 등장하지 않은 단어 조합에 대한 일반화 능력이 향상된다는 장점을 가진다.

초기 신경망 언어 모델은 피드포워드 신경망 구조를 사용하여 고정된 길이의 이전 단어들을 입력으로 받아 다음 단어를 예측했다. 이후 순환 신경망과 장단기 메모리 네트워크가 도입되면서 가변 길이의 시퀀스 정보를 효과적으로 처리할 수 있게 되었다. 이러한 발전은 기계 번역, 음성 인식, 텍스트 생성 등 다양한 자연어 처리 과제의 성능을 크게 끌어올리는 계기가 되었다.

최근에는 어텐션 메커니즘과 트랜스포머 아키텍처가 등장하며 신경망 언어 모델의 패러다임이 전환되었다. 트랜스포머는 순환 구조 없이 어텐션 메커니즘만으로 문장 내 모든 단어 간의 관계를 병렬적으로 계산할 수 있어, BERT나 GPT와 같은 대규모 사전 훈련 언어 모델의 개발을 가능하게 했다. 이러한 모델들은 방대한 말뭉치에서 언어의 일반적인 패턴을 학습한 후, 특정 과제에 맞춰 미세 조정하는 방식으로 활용된다.

신경망 언어 모델의 발전은 계산 언어학의 연구 경향을 통계 기반에서 심층 학습 기반으로 급격히 이동시켰다. 이는 모델의 표현력과 성능을 비약적으로 높였지만, 동시에 막대한 계산 자원과 데이터를 요구하며 모델의 결정 과정을 해석하기 어려운 블랙박스 문제를 야기하는 새로운 도전 과제를 제시하기도 했다.

5. 주요 응용 분야

5.1. 정보 검색 및 추출

정보 검색 및 추출은 계산 언어학의 핵심 응용 분야 중 하나로, 방대한 양의 비정형 텍스트 데이터에서 사용자가 필요로 하는 정보를 효율적으로 찾아내고 구조화된 형태로 가공하는 기술을 다룬다. 이 분야는 인터넷 검색 엔진, 기업 지식 관리 시스템, 학술 문헌 검색 도구 등 다양한 분야에서 실용적으로 활용된다.

정보 검색은 사용자의 쿼리나 질문에 가장 관련성이 높은 문서나 텍스트 조각을 찾아 순위를 매겨 제공하는 과정이다. 여기에는 형태소 분석을 통한 검색어 정규화, 동의어 확장, 문서와 쿼리 간의 유사도 계산 등 계산 언어학 기법이 광범위하게 적용된다. 반면, 정보 추출은 문서 집합에서 사전에 정의된 특정 유형의 사실이나 관계를 자동으로 식별하고 추출하는 작업으로, 예를 들어 뉴스 기사에서 인명, 기관명, 날짜 같은 개체명을 인식하거나 특정 사건의 구조를 추출하는 것을 목표로 한다.

정보 추출 시스템은 일반적으로 개체명 인식, 관계 추출, 사건 추출 등의 하위 작업으로 구성된다. 이러한 작업들은 자연어 처리의 기초 기술인 구문 분석과 의미 분석에 크게 의존하며, 최근에는 딥러닝과 신경망 기반의 모델이 높은 성능을 보이고 있다. 추출된 정보는 데이터베이스에 저장되거나 지식 그래프를 구축하는 데 사용되어, 보다 정교한 질의응답 시스템이나 의사결정 지원 시스템의 기반이 된다.

이러한 기술은 디지털 인문학 연구에서 역사 문서를 분석하거나, 바이오메디컬 분야에서 논문에서 유전자와 질병의 관계를 추출하는 등 학문 연구에도 활발히 적용된다. 정보 검색 및 추출 기술의 발전은 단순한 키워드 매칭을 넘어 문서의 의미와 맥락을 이해하는 방향으로 진화하고 있으며, 이는 인공지능과 계산 언어학의 지속적인 협력과 연구 성과에 기반한다.

5.2. 감정 분석

감정 분석은 텍스트나 음성 데이터에 표현된 감정, 의견, 태도, 평가를 계산적으로 식별하고 추출하는 계산 언어학의 주요 응용 분야이다. 이는 텍스트 마이닝과 자연어 처리 기술을 활용하여, 사용자가 생산한 대량의 텍스트 데이터에서 긍정, 부정, 중립 등의 감정 극성을 분류하거나, 더 나아가 분노, 기쁨, 슬픔과 같은 구체적인 감정을 탐지하는 것을 목표로 한다. 초기 연구는 주로 사전 기반의 규칙 방법에 의존했으나, 머신 러닝과 딥러닝 기술의 발전으로 정확도와 복잡한 감정 인식 능력이 크게 향상되었다.

감정 분석의 접근 방식은 크게 사전 기반 방법, 기계 학습 기반 방법, 딥러닝 기반 방법으로 나눌 수 있다. 사전 기반 방법은 긍정/부정 어휘 사전을 구축하고, 텍스트 내 단어 출현 빈도나 문맥 규칙을 적용한다. 기계 학습 기반 방법은 지도 학습을 통해 레이블이 붙은 훈련 데이터로 분류 모델을 학습시킨다. 최근에는 순환 신경망이나 트랜스포머 아키텍처와 같은 딥러닝 모델이 문맥 의존적인 감정 표현을 효과적으로 포착하여 성능을 주도하고 있다.

이 기술은 소셜 미디어 모니터링, 고객 관계 관리, 브랜드 관리, 시장 조사, 영화나 제품 리뷰 분석 등 다양한 분야에 활용된다. 예를 들어, 기업은 소비자의 제품 평가를 실시간으로 분석하여 마케팅 전략을 수립하거나, 정치 여론 분석가는 선거 유권자의 감정을 파악하는 데 사용할 수 있다. 또한 의료 분야에서는 환자의 수기 기록을 분석하여 정신 건강 상태를 보조적으로 평가하는 연구도 진행되고 있다.

감정 분석의 주요 과제는 반어, 비유, 문맥 의존성, 도메인 적응 문제를 해결하는 것이다. 같은 단어라도 분야나 상황에 따라 감정이 달라질 수 있으며, 문화적 차이도 고려해야 한다. 이러한 한계를 극복하기 위해 다중 양상 분석 (텍스트, 음성, 영상 정보 통합)이나 설명 가능한 인공지능 기법을 접목하는 등 연구가 진화하고 있다.

5.3. 질의응답 시스템

질의응답 시스템은 사용자가 자연어로 질문을 입력하면 시스템이 자동으로 적절한 답변을 찾아 제공하는 인공지능 응용 분야이다. 이는 정보 검색이나 문서 검색과 달리, 단순히 관련 문서를 나열하는 것이 아니라 질문의 의도를 이해하고 구체적인 사실이나 데이터를 직접 추출하여 답변으로 제시하는 것을 목표로 한다. 초기 시스템은 제한된 도메인의 지식을 규칙 기반으로 처리했으나, 빅데이터와 머신 러닝 기술의 발전으로 개방형 도메인에서도 복잡한 질문에 답할 수 있는 수준으로 진화했다.

현대의 질의응답 시스템은 일반적으로 자연어 처리 파이프라인을 기반으로 구축된다. 질문 텍스트는 형태소 분석과 구문 분석을 거쳐 구조화되고, 의미 분석을 통해 질문의 유형(예: 사실 질문, 정의 질문, 방법 질문 등)과 핵심 개체를 파악한다. 이후 대규모 지식 베이스나 문서 집합에서 관련 정보를 검색하고, 정보 추출 기술을 통해 잠재적 답변 후보를 선정한다. 최종적으로 답변의 정확성을 평가하고 가장 가능성 높은 답변을 생성하거나 선택하여 사용자에게 전달한다.

주요 접근 방식에는 구조화된 지식 그래프를 활용하는 방법과 비정형 텍스트 문서에서 답변을 찾는 방법이 있다. 지식 그래프 기반 시스템은 DBpedia나 Freebase와 같은 대형 지식 베이스를 쿼리하여 정확한 사실을 답변하는 데 강점이 있다. 반면, 딥러닝과 신경망 언어 모델을 이용한 시스템은 위키피디아나 뉴스 기사와 같은 방대한 텍스트 말뭉치를 직접 학습하여, 문서 내에서 답변 구절을 찾아내거나 생성하는 방식으로 작동한다.

이 기술은 검색 엔진, 스마트 어시스턴트, 고객 서비스 챗봇, 교육 지원 도구 등 다양한 분야에 응용되고 있다. 특히 오픈도메인 질의응답은 여전히 맥락 이해와 논리적 추론에서 한계를 보이지만, 트랜스포머 아키텍처와 사전 학습 언어 모델의 등장으로 성능이 비약적으로 향상되며 활발한 연구가 진행 중인 분야이다.

6. 관련 학회 및 학술지

계산 언어학 분야의 학술 활동은 여러 국제 학회와 학술지를 중심으로 활발히 이루어진다. 대표적인 국제 학회로는 ACL(Association for Computational Linguistics)이 있으며, 이 학회는 매년 열리는 ACL 연례 학회를 주최한다. 또한 EMNLP(Empirical Methods in Natural Language Processing)과 NAACL(North American Chapter of the ACL)도 주요 학회로 꼽힌다. 아시아 지역에서는 AACL(Asia-Pacific Chapter of the ACL)과 COLING(International Conference on Computational Linguistics)이 중요한 학술 교류의 장을 제공한다.

이 분야의 주요 학술지로는 ACL에서 발행하는 *Computational Linguistics*와 Springer Nature에서 출판하는 *Natural Language Engineering*이 있다. 또한 Elsevier의 *Computer Speech & Language*와 MIT Press의 *Transactions of the Association for Computational Linguistics*도 핵심 저널로 인정받는다. 이러한 학회와 학술지는 자연어 처리와 기계 번역을 비롯한 계산 언어학의 최신 연구 성과를 공유하고 발전시키는 데 기여한다.

7. 관련 교육 및 연구 기관

계산 언어학은 학제간 성격이 강한 분야로, 전 세계 여러 대학과 연구 기관에서 관련 교육 및 연구가 활발히 이루어진다. 주로 컴퓨터 과학 학과, 언어학 학과, 또는 인공지능 연구소 내에서 전공이나 세부 전공으로 개설된다. 교육 과정에서는 자연어 처리의 기초 이론과 함께 기계 학습 및 딥러닝을 활용한 실용적 기법을 중점적으로 가르친다.

대표적인 교육 기관으로는 스탠퍼드 대학교, 매사추세츠 공과대학교(MIT), 카네기 멜론 대학교 등이 있으며, 이들 기관은 자연어 처리 연구의 선도적 역할을 해왔다. 국내에서는 KAIST, 서울대학교, 포항공과대학교 등이 컴퓨터 과학 또는 인공지능 대학원에서 관련 강의와 연구를 진행하고 있다. 또한 구글, 마이크로소프트, 메타와 같은 글로벌 기술 기업들도 자체 연구소를 운영하며 최첨단 연구와 인재 양성에 기여하고 있다.

연구 기관으로는 앨런 인공지능 연구소(AI2)와 같은 비영리 연구소와, 각국 정부가 지원하는 연구 센터도 중요하다. 이들 기관은 말뭉치 언어학을 위한 대규모 데이터 구축, 기계 번역 및 질의응답 시스템의 핵심 알고리즘 개발 등 기초 및 응용 연구를 수행한다. 이러한 교육 및 연구 생태계는 계산 언어학의 지속적인 발전과 산업 적용을 뒷받침하는 핵심 동력이다.

계산 언어학

정식 명칭	계산 언어학
정의	자연어를 계산적으로 모델링하고 처리하는 학문 분야
관련 분야	컴퓨터 과학 언어학 인공지능
주요 용도	기계 번역 정보 검색 음성 인식 텍스트 마이닝 질의 응답 시스템
핵심 기술	형태소 분석 구문 분석 의미 분석 담화 분석
상세 정보
하위 분야	통계적 언어 모델링 계산 의미론 계량 언어학 컴퓨터 음성학
응용 분야	자연어 처리 언어 공학 코퍼스 언어학