반응형

자연어 처리(Natural Language Processing)


인공지능 분야의 하위 분야로 주로 분류되는 분야로써 사람이 사용하는 언어를 기계가 인식할 수 있는 형태로 입력 형식을 바꿔주거나 또는 바뀐 형식을 다시 인간이 이해 할 수 있는 언어로 표현하는 기술을 개발하는 분야이다.

자연어 처리 분야 내에서도 세부 카테고리가 많다.

예를 들면 형태소 분석, 개체명 분석, 구문 분석, 감성 분석, 관계 추출 등 여러가지의 세부 카테고리들이 존재한다.

이러한 작업들을 합쳐서 기계가 사람이 사용하는 언어를 이해할 수 있는 형식으로 입출력 결과는 바꿔주는 작업을 주로 진행한다.


사람이 사용하는 언어가 다양하고 각 언어마다 가지는 특성들이 다르기 때문에 언어별로 주로 자연어 처리를 실행한다.

영어와 한글은 문자도 다르고 사용되는 문장 구조도 가지각색이기 때문에 같은 알고리즘으로 자연어 처리를 하기에는 매우 어렵다.

그래서 각 언어에 맞는 특성을 이용하여 작업을 진행하는데 영어의 경우는 대명사라는 영어에서 사용되는 특성을 이용하고 한글에서는 대명사라는 자질이 없기 때문에 한글에서 나타나는 특성을 가지고 작업을 진행한다.


반응형

'NLP' 카테고리의 다른 글

개체명이란?  (0) 2015.12.27

+ Recent posts