Document Utility
PDF Excel表格提取器
从PDF文档中提取表格数据并保存为CSV或Excel文件。分析基于文本的PDF表格,预览提取结果后下载。
PDF上传与提取设置
上传PDF文件后设置页码范围和表格识别灵敏度。对于文本型PDF效果最佳。
上传PDF
拖放文件或
上传PDF / 分析页面 / 提取表格 / 导出CSV与XLSX
留空时分析所有页面。
列被拆分过多时请选择“宽松”。
行被拆分过多时请选择“宽松”。
下载CSV和XLSX时使用的文件名。
文本型PDF且表格对齐越整齐,提取准确率越高。
对于复杂表格,建议先查看预览再导出。
推荐提取预设
根据PDF表格布局快速应用推荐设置。
提取状态
查看已选页面、候选数量和当前状态。
提取预览
确认结果后可导出CSV或XLSX文件。
帮助
PDF 엑셀 표 추출은 언제 사용하나요?
PDF 보고서, 명세서, 견적서, 통계표, 정산표처럼 표 형태의 데이터를 엑셀에서 다시 활용해야 할 때 사용할 수 있습니다. 추출된 데이터를 CSV 또는 XLSX로 저장하면 엑셀, 구글 스프레드시트 등에서 편집하기 쉽습니다.
텍스트 기반 PDF와 스캔본 PDF의 차이
이 유틸리티는 PDF 안에 포함된 텍스트와 위치 정보를 읽어 표 구조를 추정합니다. 따라서 텍스트 선택이 가능한 PDF에서 더 잘 동작하며, 이미지로 스캔된 PDF는 OCR 기능이 아니기 때문에 정확도가 낮을 수 있습니다.
열 간격 민감도는 어떻게 조정하나요?
열이 너무 많이 나뉘어 보이면 넓게 옵션을 선택하세요. 반대로 서로 다른 열이 하나로 합쳐진다면 촘촘하게 옵션을 선택하면 결과가 나아질 수 있습니다.
행 간격 민감도는 어떻게 조정하나요?
한 행이 여러 줄로 쪼개진다면 넓게 옵션을 선택하고, 여러 행이 하나로 합쳐진다면 촘촘하게 옵션을 선택해 보세요. PDF의 줄 간격과 글자 배치에 따라 적절한 값이 달라질 수 있습니다.
CSV와 XLSX 중 무엇을 선택하면 좋나요?
CSV는 대부분의 프로그램에서 열 수 있는 범용 형식이고, XLSX는 엑셀에서 바로 사용하기 편한 형식입니다. 엑셀 작업이 목적이라면 XLSX를, 다른 시스템으로 가져오기 위한 데이터라면 CSV를 선택하는 것이 좋습니다.
常见问题
스캔된 PDF에서도 표를 추출할 수 있나요?
정확도가 낮을 수 있습니다. 이 도구는 OCR이 아니라 PDF 내부 텍스트 정보를 분석하는 방식입니다. 스캔본처럼 이미지로만 구성된 PDF는 먼저 OCR 처리가 필요할 수 있습니다.
표가 이상하게 여러 열로 쪼개져요.
열 간격 민감도를 넓게 조정한 뒤 다시 추출해 보세요. 글자 간격이 좁거나 숫자가 촘촘하게 배치된 PDF에서는 기본값보다 넓은 설정이 더 안정적일 수 있습니다.
여러 행이 하나로 합쳐져 보여요.
행 간격 민감도를 촘촘하게 변경해 보세요. 행 사이 간격이 좁은 표는 기본값에서 행 구분이 약하게 처리될 수 있습니다.
첫 행을 헤더로 사용 옵션은 무엇인가요?
추출된 첫 번째 행을 컬럼명처럼 사용하는 옵션입니다. 표의 첫 줄이 제목 행이라면 켜두는 것이 좋고, 첫 줄부터 실제 데이터라면 해제하는 것이 좋습니다.
업로드한 PDF는 서버에 저장되나요?
이 유틸리티는 브라우저에서 PDF를 분석하는 구조로 사용할 수 있습니다. 일반적인 사용 과정에서 선택한 PDF 파일은 서버에 저장하지 않는 방식으로 구성할 수 있습니다.