Search

워드 문서 파일 형식: DOCX 포맷의 구조와 이해 (1)

URL
생성 일시
2026/02/09 00:07
최종 편집 일시
2026/02/09 00:07
태그
한컴테크
파일과 미디어
이 글은 국제 표준 OOXML 기반의 DOCX 포맷 구조를 중심으로, 워드 문서가 다양한 편집 프로그램에서 동일하게 열리고 수정될 수 있는 원리를 설명합니다. DOCX 파일을 ZIP 기반의 XML 묶음으로 바라보고, document.xml·styles.xml·numbering.xml·media 등 핵심 구성 요소와 역할을 체계적으로 정리합니다. 특히 WordprocessingML의 설계 철학인 스트림 기반 문서 구조, p–r–t 텍스트 계층, Twip·EMU 단위 체계, Story·Section·Style·Drawing·Table·Numbering 구조를 예시 XML과 함께 상세히 다룹니다. 이를 통해 DOCX 문서의 내부 데이터를 해석하고, 문서 자동화·대량 처리·커스텀 문서 생성 등 실무 활용에 필요한 포맷 이해 방법을 소개합니다. || 요약 이 글은 국제 표준 OOXML 기반의 DOCX 포맷 구조를 중심으로, 워드 문서가 다양한 편집 프로그램에서 동일하게 열리고 수정될 수 있는 원리를 설명합니다. DOCX 파일을 ZIP 기반의 XML 묶음으로 바라보고, document.xml·styles.xml·numbering.xml·media 등 핵심 구성 요소와 역할을 체계적으로 정리합니다. 특히 WordprocessingML의 설계 철학인 스트림 기반 문서 구조, p–r–t 텍스트 계층, Twip·EMU 단위 체계, Story·Section·Style·Drawing·Table·Numbering 구조를 예시 XML과 함께 상세히 다룹니다. 이를 통해 DOCX 문서의 내부 데이터를 해석하고, 문서 자동화·대량 처리·커스텀 문서 생성 등 실무 활용에 필요한 포맷 이해 방법을 소개합니다. 서론 Microsoft Word로 작성한 DOCX(.docx) 포맷의 문서를 한컴오피스 한워드에서 변환 없이 그대로 열고 수정할 수 있습니다. 또한 Google Docs, LibreOffice Writer 같은 다양한 문서 편집 프로그램에서도 동일한 문서를 다룰 수 있습니다. 어떻게 이런 일이 가능할까요? 그 비밀은 바로 DOCX 포맷의 구조가 국제 표준으로 정의되어 있고, 누구에게나 열려 있기 때문입니다. 표준화된 DOCX 포맷의 스펙 문서에 따라 DOCX 내부의 데이터를 해석하면, 우리가 화면에서 보는 완성된 문서의 형태로 만들 수 있습니다! 이렇게 MS 워드뿐만 아니라 다른 프로그램에서도 문서를 열고 수정할 수 있게 됩니다. 하지만 스펙 문서를 처음부터 확인한다면 방대한 양의 자료에 이해가 어려울 수 있는데요. 그 구조와 주요 구성 요소를 알아보기 쉽게 정리했습니다. DOCX 내부의 XML 파일 DOCX의 특징 DOCX 포맷 이전에 사용했던 doc 포맷의 경우 0과 1로만 이루어진 바이너리 파일로 이루어져, 사람이 해석하기 매우 어려웠습니다. 이뿐만 아니라 1 바이트만 깨져도 파일 전체를 읽을 수 없는 경우도 있었습니다. 이를 XML 파일 형식으로 구조화해 저장한 것이 DOCX 포맷입니다. XML 형식을 활용하여 사람이 더 읽기 쉬울 뿐만 아니라, 웹 서비스나 다른 프로그램에서도 쉽게 데이터를 추출할 수 있고 문서 손상에 대한 안정성도 올라갔습니다. Microsoft Office 2007 이후로 기본 포맷으로 사용되었으며, 국제 표준(ISO/IEC 29500)으로 채택된 OOXML(Office Open XML) 파일 형식을 따릅니다. “사실은 압축 파일(ZIP)입니다” .docx 파일의 확장자를 .zip으로 바꾸고 압축을 풀면, 그 안에 수많은 XML 파일과 이미지 폴더가 들어있는 것을 볼 수 있습니다. 문서의 본문, 이미지, 스타일 등을 각각 별도의 파일로 나눈 뒤, 하나로 압축(ZIP)한 것이 바로 OOXML 파일입니다. DOCX 파일 구조 DOCX 파일의 압축을 해제하면, 아래와 같은 파일 구조를 확인하실 수 있습니다. 내 문서.docx/ ├── [Content_Types].xml ├── _rels/ │ └── .rels ├── word/ │ ├── document.xml │ ├──