首頁>Program>source

我想使用任何可能的命令列工具删除/删除PDF中的所有圖像,只保留PDF中的文字/字型。

我尝試使用 -dGraphicsAlphaBits=1   在Ghostscript命令中,但是圖像存在但像一个大畫素。

最新回復
  • 4天前
    1 #

    否,AFAIK,無法使用命令列工具删除PDF中的所有圖像。< / p>

    您的請求的目的是什麼? 节省檔案大小? 删除圖像中包含的資訊? 還是...?

    解決方法

    無論您要瞄準什麼,這裏都有一條命令会將所有圖像降采樣為2 ppi的分辨率( Update:   1 ppi無效).一次可以實現两个目標:

    威兹威兹

    仅针對

      reduce filesize

      make all images basically un-comprehendable

    第33頁中的圖像,這是有選擇地執行操作的方法 :

    original.pdf
    

    如果要對all頁上的all圖片執行此操作,只需跳過 gs \ -o images-uncomprehendable.pdf \ -sDEVICE=pdfwrite \ -dDownsampleColorImages=true \ -dDownsampleGrayImages=true \ -dDownsampleMonoImages=true \ -dColorImageResolution=2 \ -dGrayImageResolution=2 \ -dMonoImageResolution=2 \ -dFirstPage=33 \ -dLastPage=33 \ original.pdf   和 -dFirstPage   引數。

    如果要从圖像中删除所有颜色資訊,請在同一命令中將它们轉換為灰度(在Stackoverflow上搜尋其他答案,其中將對此进行详细讨論)。


    -dLastPage   最初,我建議使用1 PPI的分辨率.看来這不適用於Ghostscript.我現在使用2 PPI进行了測試.這行得通。


    Update:   另請參见以下(新)問题及其答案:

    威兹威兹 威兹威兹

    它提供了一些示例PostScript代碼,该代碼完全从PDF中删除了所有(光栅)圖像,而其餘頁面佈局保持不變。

    它還反映了Ghostscript的擴充套件新功能,该功能現在可以有選擇地从PDF中删除所有文字或所有光栅圖像或所有矢量物件,或這三種型別的任意組合。

  • 4天前
    2 #

    您可以使用cpdf的草稿選項:

    Update 2:
    

    這在大多數情况下應该可行,但是如果對您没有正確的帮助,請提交錯誤報告。

    披露:我是cpdf的作者。

  • 4天前
    3 #

    時間已经過去,並且Ghostscript的開發正在进行中...

    最新版本具有以下新的命令列引數.這些可以添加到命令列:

      威兹威兹 :生成一个輸出,其中所有栅格圖形均已删除。

      How can I remove all images from a PDF? 威兹威兹 :产生一个輸出,其中所有文字元素均被删除。

      cpdf -draft in.pdf -o out.pdf 威兹威兹 :产生一个輸出,其中所有矢量圖形均被删除。

      這些選項中的任何两个都可以組合。

      -dFILTERIMAGE
      

      更多详细資訊(包括一些說明性的螢幕截圖)可以在我對 的迴答中找到

  • 4天前
    4 #

    不幸的是,為了將圖像和文字分离到不同的圖層,有 -dFILTERTEXT .也不是像啤酒一樣自由的人...

    只能使用 来完成此任務 .由於您並未在問题中排除此問题,而是詢問了"可能的命令列工具",因此,我將告诉您我最類似的一个:

    威兹威兹

    提供了一个用於CLI的版本(其中包括一个功能強大的SDK,可以进行许多低級PDF操作),並且所有主要的OS平臺(包括Linux)都支援该版本。

    callas為您提供了功能齐全的免费測試许可證,该许可證有效期為14天(我相信)。

    -dFILTERVECTOR

  • node.js:在Q中鏈接任意數量的Promise
  • 如何打開NuGet包的自述URL?