使い方

PDF2CSV Localは、文字を選択できるPDF内の表をCSV/Excel向けに抽出する補助ツールです。

Usage

PDF2CSV Local helps extract tables from selectable-text PDFs for CSV/Excel export.

/

このツールでできること

  • テキスト情報を含むPDFから、明細表・請求書表・一覧表を抽出する
  • Autoで自動抽出し、崩れる場合はManualで表エリアだけを指定して再抽出する
  • 抽出結果をCSVまたはXLSX形式で保存する
画像スキャンPDF・写真PDF・文字を選択できないPDFは対象外です。このツールはOCRを行いません。

手順

  1. PDFを読み込みます。文字を選択できるPDFを使ってください。
  2. 必要に応じてページ範囲を指定します。空欄なら全ページを対象にします。
  3. まずAutoで抽出します。
  4. 列や行が崩れる場合はManualに切り替え、プレビュー上で表エリアだけを囲んで再抽出します。
  5. 結果プレビューを確認し、CSVまたはExcelで保存します。

対応 / 非対応

対応

  • 文字を選択できるPDF
  • 銀行明細、請求書、一覧表など、行と列がある程度そろった表
  • 複数ページにまたがる明細PDF

非対応

  • 画像スキャンPDF、写真PDF、OCRが必要なPDF
  • パスワード付きPDF、強く暗号化されたPDF
  • 斜めの表、複数段の表、装飾が多く列位置が崩れているPDF

出力形式

  • CSV: 会計ソフト、表計算、テキスト処理向け。Excelで開く場合はBOM ONを推奨します。
  • Excel: 抽出結果をXLSX形式で保存します。PDFの見た目を完全再現するものではありません。
  • タブ区切り: カンマを含むデータで崩れる場合の回避策として使えます。

注意点

抽出結果は必ず確認してください。PDFのレイアウトによって、列ズレ・行ズレ・空欄・重複が起きる場合があります。

PDF内容は外部送信されません。ただし、PDF解析ライブラリの読み込みに外部CDNを使用する場合があります。

What this tool can do

  • Extract tables from PDFs that contain selectable text.
  • Use Auto extraction first, then Manual selection when the layout breaks.
  • Save the extracted result as CSV or XLSX.
Scanned image PDFs, photo PDFs, and PDFs without selectable text are not supported. This tool does not run OCR.

Steps

  1. Load a PDF with selectable text.
  2. Set a page range if needed. Leave it blank to process all pages.
  3. Run Auto extraction first.
  4. If rows or columns break, switch to Manual and select only the table area in the preview.
  5. Review the preview, then save as CSV or Excel.

Supported / Not supported

Supported

  • PDFs with selectable text.
  • Statements, invoices, and lists with reasonably aligned rows and columns.
  • Multi-page statement PDFs.

Not supported

  • Scanned image PDFs, photo PDFs, or PDFs that require OCR.
  • Password-protected or strongly encrypted PDFs.
  • Rotated, multi-column, or heavily decorated layouts.

Output formats

  • CSV: for spreadsheets, accounting tools, and text processing. Use BOM when opening in Excel.
  • Excel: saves the extracted table as XLSX. It does not recreate the original PDF layout.
  • Tab delimiter: useful when comma-separated CSV breaks because values contain commas.

Notes

Always review the extracted result. PDF layout can cause shifted columns, shifted rows, blanks, or duplicates.

PDF contents are not uploaded. The PDF parsing library may be loaded from an external CDN.

← ツール本体へ戻る / Back to the tool