Document Utility

PDF Excel表格提取器

从PDF文档中提取表格数据并保存为CSV或Excel文件。分析基于文本的PDF表格,预览提取结果后下载。

PDF表格提取 分析PDF中的文本位置,将其整理为表格并导出为CSV或XLSX。
分页预览 可按页面查看提取候选结果,仅保存需要的数据。
数据整理选项 支持首行作为表头、删除空行和空列,使结果更适合Excel。
文件 未选择
页数 全部
候选数 0
状态 Ready

PDF上传与提取设置

上传PDF文件后设置页码范围和表格识别灵敏度。对于文本型PDF效果最佳。

上传PDF

拖放文件或

上传PDF / 分析页面 / 提取表格 / 导出CSV与XLSX

说明 本工具根据PDF中文字坐标推测表格结构。扫描件、图片PDF或复杂表格可能影响准确度。

留空时分析所有页面。

列被拆分过多时请选择“宽松”。

行被拆分过多时请选择“宽松”。

下载CSV和XLSX时使用的文件名。

提取前检查

文本型PDF且表格对齐越整齐,提取准确率越高。

对于复杂表格,建议先查看预览再导出。

尚未上传PDF文件。

推荐提取预设

根据PDF表格布局快速应用推荐设置。

提取状态

查看已选页面、候选数量和当前状态。

待机
选择页面 -
候选结果 -
当前状态 待机
上传PDF后将在此显示提取结果。

帮助

PDF 엑셀 표 추출은 언제 사용하나요?

PDF 보고서, 명세서, 견적서, 통계표, 정산표처럼 표 형태의 데이터를 엑셀에서 다시 활용해야 할 때 사용할 수 있습니다. 추출된 데이터를 CSV 또는 XLSX로 저장하면 엑셀, 구글 스프레드시트 등에서 편집하기 쉽습니다.

텍스트 기반 PDF와 스캔본 PDF의 차이

이 유틸리티는 PDF 안에 포함된 텍스트와 위치 정보를 읽어 표 구조를 추정합니다. 따라서 텍스트 선택이 가능한 PDF에서 더 잘 동작하며, 이미지로 스캔된 PDF는 OCR 기능이 아니기 때문에 정확도가 낮을 수 있습니다.

열 간격 민감도는 어떻게 조정하나요?

열이 너무 많이 나뉘어 보이면 넓게 옵션을 선택하세요. 반대로 서로 다른 열이 하나로 합쳐진다면 촘촘하게 옵션을 선택하면 결과가 나아질 수 있습니다.

행 간격 민감도는 어떻게 조정하나요?

한 행이 여러 줄로 쪼개진다면 넓게 옵션을 선택하고, 여러 행이 하나로 합쳐진다면 촘촘하게 옵션을 선택해 보세요. PDF의 줄 간격과 글자 배치에 따라 적절한 값이 달라질 수 있습니다.

CSV와 XLSX 중 무엇을 선택하면 좋나요?

CSV는 대부분의 프로그램에서 열 수 있는 범용 형식이고, XLSX는 엑셀에서 바로 사용하기 편한 형식입니다. 엑셀 작업이 목적이라면 XLSX를, 다른 시스템으로 가져오기 위한 데이터라면 CSV를 선택하는 것이 좋습니다.

常见问题

스캔된 PDF에서도 표를 추출할 수 있나요?

정확도가 낮을 수 있습니다. 이 도구는 OCR이 아니라 PDF 내부 텍스트 정보를 분석하는 방식입니다. 스캔본처럼 이미지로만 구성된 PDF는 먼저 OCR 처리가 필요할 수 있습니다.

표가 이상하게 여러 열로 쪼개져요.

열 간격 민감도를 넓게 조정한 뒤 다시 추출해 보세요. 글자 간격이 좁거나 숫자가 촘촘하게 배치된 PDF에서는 기본값보다 넓은 설정이 더 안정적일 수 있습니다.

여러 행이 하나로 합쳐져 보여요.

행 간격 민감도를 촘촘하게 변경해 보세요. 행 사이 간격이 좁은 표는 기본값에서 행 구분이 약하게 처리될 수 있습니다.

첫 행을 헤더로 사용 옵션은 무엇인가요?

추출된 첫 번째 행을 컬럼명처럼 사용하는 옵션입니다. 표의 첫 줄이 제목 행이라면 켜두는 것이 좋고, 첫 줄부터 실제 데이터라면 해제하는 것이 좋습니다.

업로드한 PDF는 서버에 저장되나요?

이 유틸리티는 브라우저에서 PDF를 분석하는 구조로 사용할 수 있습니다. 일반적인 사용 과정에서 선택한 PDF 파일은 서버에 저장하지 않는 방식으로 구성할 수 있습니다.