반응형

자연어 처리(Natural Language Processing)


인공지능 분야의 하위 분야로 주로 분류되는 분야로써 사람이 사용하는 언어를 기계가 인식할 수 있는 형태로 입력 형식을 바꿔주거나 또는 바뀐 형식을 다시 인간이 이해 할 수 있는 언어로 표현하는 기술을 개발하는 분야이다.

자연어 처리 분야 내에서도 세부 카테고리가 많다.

예를 들면 형태소 분석, 개체명 분석, 구문 분석, 감성 분석, 관계 추출 등 여러가지의 세부 카테고리들이 존재한다.

이러한 작업들을 합쳐서 기계가 사람이 사용하는 언어를 이해할 수 있는 형식으로 입출력 결과는 바꿔주는 작업을 주로 진행한다.


사람이 사용하는 언어가 다양하고 각 언어마다 가지는 특성들이 다르기 때문에 언어별로 주로 자연어 처리를 실행한다.

영어와 한글은 문자도 다르고 사용되는 문장 구조도 가지각색이기 때문에 같은 알고리즘으로 자연어 처리를 하기에는 매우 어렵다.

그래서 각 언어에 맞는 특성을 이용하여 작업을 진행하는데 영어의 경우는 대명사라는 영어에서 사용되는 특성을 이용하고 한글에서는 대명사라는 자질이 없기 때문에 한글에서 나타나는 특성을 가지고 작업을 진행한다.


반응형

'NLP' 카테고리의 다른 글

개체명이란?  (0) 2015.12.27
반응형

자연어 처리 분야 내에는 개체명이라는 소분류가 있다.


개체명 또는 NER로 불리우는 이 분야는 고유명사를 찾아 Tag를 붙착하는 작업을 뜻한다.


현재 한국에서 사용되는 개체명은 한국전자통신연구원(ETRI)에서 정한 대분류 15태그로 분류되고 각 대분류 태그에 있는 소분류 태그들로 Tag를 부착한다.


개체명의 정의를 나 스스로 내리자면 일반명사를 제외한 고유명사에 한해 그 의미를 알 수 있게하는 Tag를 부착하는 작업이라고 생각되어진다.


개체명을 적용할 수 있는 분야는 키워드 검색쪽이 있을 수 있다. 


예를 들어 길동이가 학교에 갔다. 이 문장에서 길동이가 개체명이 되고 PER이라는 태그를 부착된다. 길동이라는 개체명을 키워드로 사용할 수 있다.


아직은 개체명에 대해 많은 지식이 없어 공부하는 중이라 이정도 밖에 못적지만 앞으로 계속 공부를 해가면서 개체명에대해 자세히 서술할 것이다.

반응형

'NLP' 카테고리의 다른 글

자연어 처리란?  (0) 2015.12.29

+ Recent posts