Vil du vite hvordan du kan fange en webside og lagre den som et PDF-dokument eller et bilde ved hjelp av terminalen? Heldigvis har Linux en mengde verktøy som du kan bruke til å automatisere oppgaven med å konvertere HTML-dokumenter til PDF-filer og bilder.

Denne artikkelen vil introdusere deg til wkhtmltopdf og wkhtmltoimage, verktøy som du trenger for å gjøre arbeidet lettere.

Hvordan konvertere HTML til PDF

Hvis du ønsker å fange websider og konvertere dem til en PDF-fil, vil wkhtmltopdf-verktøyet hjelpe deg. Wkhtmltopdf er et kommandolinjeverktøy med åpen kildekode som brukes til å gjengi websider til PDF-dokumenter.

Siden verktøyet fungerer hodeløst inne i Linux-terminalen, trenger du ikke noen nettdriver eller et nettverksautomatiseringsrammeverk som Selenium.

Installer wkhtmltopdf på Linux

Wkhtmltopdf er ikke en av standardpakker som er forhåndsinstallert på Linux. Du må installere den manuelt ved hjelp av systemets pakkebehandling.

Slik installerer du wkhtmltopdf på Ubuntu og Debian-baserte distribusjoner:

sudo apt installer wkhtmltopdf

På Arch-baserte distroer som Manjaro Linux:

sudo pacman -S wkhtmltopdf

Det er også enkelt å installere wkhtmltopdf på RHEL-baserte distroer som Fedora og CentOS.

sudo dnf installer wkhtmltopdf

Grunnleggende syntaks

Den grunnleggende syntaksen til kommandoen er:

wkhtmltopdf nettsidens filnavn

...hvor nettside er nettadressen til websiden du vil konvertere og filnavn er navnet på den utgående PDF-filen.

Slik konverterer du Google-hjemmesiden til et PDF-dokument:

wkhtmltopdf https://google.com google.pdf

Produksjon:

Når du åpner PDF-filen, vil du legge merke til at wkhtmltopdf nettopp har gjengitt websiden til et dokument.

Skriv ut flere kopier av websiden

De - kopier flagg er en livredder hvis du vil at utdatafilen din skal ha flere kopier av websiden. Merk at når du skriver ut flere kopier, genererer wkhtmltopdf ikke flere PDF-filer, men legger til flere sider i et enkelt dokument i stedet.

Slik oppretter du tre eksemplarer av Googles hjemmeside:

wkhtmltopdf - kopier 3 https://google.com google.pdf

Den utgående PDF-filen vil inneholde tre sider som spesifisert i den nevnte kommandoen.

Legg til et gråtonefilter i utgangen

For å legge til et gråtonefilter i PDF-filen, bruk -g eller - gråtoner flagg med kommandoen:

wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf - gråtoner https://google.com google.pdf

Output-fil:

Endre retningen på PDF-filen

Som standard genererer wkhtmltopdf PDF-filen i vertikal oppsett, dvs. stående. For å endre denne standardadferden og fange websider i liggende i stedet, bruk --orientering flagg med kommandoen:

wkhtmltopdf - orienteringslandskap https://google.com google.pdf

Produksjon:

Vær oppmerksom på at landskapsversjonen av dokumentet har et større område for hvite mellomrom sammenlignet med portretten.

Ikke inkluder bilder mens du konverterer

Når du genererer utdata, bruker du. Hvis du ikke vil at wkhtmltopdf skal gjengi bilder som er tilstede på en webside - ingen bilder flagg:

wkhtmltopdf --no-bilder https://google.com google.pdf

Produksjon:

I slekt: Beste verktøy for å redigere en PDF-fil hvor som helst

Hvordan konvertere en webside til bilder

Verktøyet wkhtmltoimage er en del av wkhtmltopdf-pakken. Hvis du jobber med en rapport og vil inkludere bilder av et nettsted, vil dette verktøyet fungere til din fordel. Linux-terminalen gjør det ikke bare enklere for deg å ta bilder, men gir deg også en rekke alternativer som lar deg tilpasse utdataene dine.

Grunnleggende syntaks

Wkhtmltoimage har en syntaks som ligner på wkhtmltopdf:

wkhtmltil bildesiden filnavn

...hvor nettside er nettadressen til et nettsted og filnavn er navnet på utgangsbildet.

Konverter en webside til et bilde

Fortsetter vi med det nevnte eksemplet, la oss konvertere Googles hjemmeside til bilder.

wkhtml til bilde https://google.com google.png

Produksjon:

Du kan også spesifisere et tilpasset filformat som du vil at utgangsbildet skal ha. Wkhtmltoimage støtter følgende filtyper:

  • JPEG / JPG
  • PNG
  • SVG

Hvis du for eksempel vil generere et JPG-bilde, er det bare å erstatte filtypen med JPG i kommandoen:

wkhtml til bilde https://google.com google.jpg

I slekt: JPG vs. JPEG: Hva er forskjellen mellom disse bildefilformatene?

Fange websider ved hjelp av Linux-terminalen

Du må ha en PDF-visning installert på Linux-systemet ditt hvis du vil se PDF-filene generert av wkhtmltopdf. Mens de fleste Linux-distribusjonene er forhåndsinstallert en PDF-editor, kan du manuelt velge og installere en PDF-editor som passer dine behov.

E-post
De 5 beste Linux PDF-redigererne du bør prøve

Trenger du å redigere en PDF-fil i Linux? Disse Linux PDF-redigererne er gratis å installere og enkle å bruke.

Les Neste

Relaterte temaer
  • Linux
  • PDF
  • Linux
Om forfatteren
Deepesh Sharma (67 artikler publisert)

Deepesh er Junior Editor for Linux på MUO. Han har skrevet informasjonsinnhold på internett i over 3 år. På fritiden liker han å skrive, høre på musikk og spille gitaren.

Mer fra Deepesh Sharma

Abonner på vårt nyhetsbrev

Bli med på nyhetsbrevet vårt for tekniske tips, anmeldelser, gratis e-bøker og eksklusive tilbud!

Ett steg til…!

Bekreft e-postadressen din i e-posten vi nettopp sendte deg.

.