從 PDF 檔案中擷取資料

使用 PDFelement 使用者指南更智能地工作

從 PDF 檔案中擷取資料。

PDFelement 可助您從可填寫表單欄位和其他類型的 PDF 檔案中擷取資料,並轉換為 CSV 格式的檔案,您可在其中對收集的資料進行管理。

1.從 PDF 檔案表單欄位中擷取資料。

  • 如果您的 PDF 檔案含可填寫表單,您可點擊「表單」 > 「擷取資料」按鈕,然後選擇「從 PDF 檔案表單欄位中擷取資料」選項並點擊「套用」按鈕。如果您的 PDF 檔案不包含可填寫表單,請參考「如何將 PDF 檔案自動轉換為可填寫表單」或「如何手動製作可填寫 PDF 表單」章節,首先建立可填寫表單。(如果您尚未安裝 OCR 外掛程式,那麼當您點擊「擷取資料」按鈕時,系統會提示您先下載 OCR 外掛程式。)
從表單欄位中擷取資料
從表單欄位中擷取資料

2.從選定的 PDF 檔案文字中擷取資料。

  • 如果您的 PDF 檔案不包含任何表單欄位,您仍可使用我們的程式從標記區段擷取資料,不受檔案性質影響(無論為 PDF 掃描檔案還是常規 PDF 檔案)。
  • 在程式中開啟 PDF 檔案後,您可點擊「表單」 > 「擷取資料」按鈕並選擇「根據選擇擷取資料」。
根據選擇擷取資料
根據選擇擷取資料
  • 點擊「套用」按鈕,然後使用滑鼠選擇頁面中要擷取的區段,並在「語言識別」分頁中選擇檔案語言。

選擇要擷取的文字
選擇要擷取的文字
  • 選擇要擷取的所有區段後,請在「語言識別」選項中設定所選文字的語言。接下來,點擊「套用」按鈕,然後將 .csv 檔案儲存在本地資料夾中。

3.批量擷取資料。

如果表單需要多次操作才可完整收集各種資料,或者您需要從 PDF 同一區段擷取資料,不必憂心,批量擷取功能可助您輕鬆搞定。

  • 開啟程式後,請點擊「工具」 > 「批處理」 > 「擷取資料」按鈕。
批量擷取資料
批量擷取資料

  • 在「擷取資料」視窗中,新增要收集其資料的多個檔案。請注意,僅含有表單欄位的檔案支援資料擷取。如果您新增非互動式表單,檔案狀態中將顯示「 」標記。點擊「...」按鈕,選擇匯出資料夾。接下來,點擊「套用」開始擷取過程。完成後,您可在匯出資料夾中開啟已擷取的 .csv 檔案。

套用批量擷取的資料
套用批量擷取的資料