Linux grep 命令用於在文件中搜索特定的文本字符串。這是一個非常強大的工具,可以以多種方式使用,例如查找新行、不帶大寫的行等。但是,grep 命令不適用於 PDF 文件。
這是 pdfgrep 命令發揮作用的地方。基本上是“grep”,但用於 PDF 文件。本教程將指導您完成此命令的使用和安裝過程。
安裝 pdfgrep
此命令並非隨所有 Linux 發行版一起提供,但在所有包管理器的官方存儲庫中都可用。要安裝,您可以使用以下命令,具體取決於您的 Linux 發行版:
# On Debian and Ubuntu-based distributions sudo apt update && sudo apt install pdfgrep # On Fedora Workstation sudo dnf install pdfgrep # On Arch Linux sudo pacman -S pdfgrep
使用 pdfgrep
如果您以前使用過 grep 命令,這個實用程序看起來會很熟悉。該命令的基本用法是:
pdfgrep Search_String FILENAME.pdf
文檔中的搜索字符串可以是大寫的,因此您可能希望執行不區分大小寫的搜索。你可以使用它 --ignore-case
用命令標記。
pdfgrep --ignore-case Search_Strng FILENAME.pdf

您還可以通過在 full 命令中使用 -c 選項直接在終端中獲取搜索結果的總數。
pdfgrep --ignore-case Search_Strng FILENAME.pdf --count
由於PDF文檔是有頁碼的,所以我們也可以得到搜索字符串所在的頁碼。你可以使用它 --page-number
選項和整個命令:
pdfgrep --page-number --ignore-case Search_String FILENAME.pdf

還有一種方法可以在受密碼保護的 PDF 文件中進行搜索。保留命令的其餘部分不變並添加 --password
用於鎖定文檔的選項和密碼。
pdfgrep --password YOUR-PASSWORD Search_String FILENAME.pdf
總結
在我看來,pdfgrep 的美妙之處在於它與 grep 命令的相似性。因此,用戶無需記住本質上執行相同操作的新命令或選項,這對用戶來說會更容易。
參考
pdfgrep 的 Arch Linux 手冊頁