행(Row)과 열(Column)로 명확하게 조직된 데이터. 스프레드시트, 데이터베이스 테이블, CSV 파일 등의 형태로 각 요소가 정확한 위치와 의미를 가짐.

특징:

  • 명확한 스키마 (구조 정의)
  • 행과 열의 관계가 명확
  • 각 셀의 의미가 정의됨
  • 형식이 엄격함

vs 비정형 데이터:

  • 정형: 스프레드시트, 데이터베이스
  • 비정형: 자유로운 텍스트, 이미지

처리의 어려움:

  • LLM에게는 자연스럽지 않은 형식
  • 구조 이해가 선행되어야 함
  • 관계 파악 필요

응용:

  • 데이터 분석
  • 정보 검색
  • 의사결정 지원

관련: Data-Understanding, Schema-Understanding, Knowledge-Representation