자연언어에서 언급된 개체(인물, 장소, 기관 등)를 정확히 식별하고 지식 베이스의 특정 개체로 연결하는 기술. 텍스트에서 “파리”라고 나왔을 때 이것이 도시인지 인물명인지 구분하여 정확한 개체로 연결.

중요성:

  • 자연언어 이해의 근본 과제
  • 정보 추출과 지식 그래프 구축의 필수 요소
  • 검색 엔진, 질의응답 시스템의 핵심 기능

도전 요소:

  • 동음이의 (Homonymy): 같은 이름, 다른 의미
  • 변칭 (Synonymy): 다른 이름, 같은 의미
  • 문맥 의존성: 주변 정보에 따라 달라지는 의미

응용:

  • 정보 검색 및 검색 엔진 최적화
  • 질의응답 시스템
  • 지식 그래프 자동 구축

관련: Disambiguation, Context-Understanding, NLP

소스