Vil du vite hvordan du kan fange en webside og lagre den som et PDF-dokument eller et bilde ved hjelp av terminalen? Heldigvis har Linux en mengde verktøy som du kan bruke til å automatisere oppgaven med å konvertere HTML-dokumenter til PDF-filer og bilder.
Denne artikkelen vil introdusere deg til wkhtmltopdf og wkhtmltoimage, verktøy som du trenger for å gjøre arbeidet lettere.
Hvordan konvertere HTML til PDF
Hvis du ønsker å fange websider og konvertere dem til en PDF-fil, vil wkhtmltopdf-verktøyet hjelpe deg. Wkhtmltopdf er et kommandolinjeverktøy med åpen kildekode som brukes til å gjengi websider til PDF-dokumenter.
Siden verktøyet fungerer hodeløst inne i Linux-terminalen, trenger du ikke noen nettdriver eller et nettverksautomatiseringsrammeverk som Selenium.
Installer wkhtmltopdf på Linux
Wkhtmltopdf er ikke en av standardpakker som er forhåndsinstallert på Linux. Du må installere den manuelt ved hjelp av systemets pakkebehandling.
Slik installerer du wkhtmltopdf på Ubuntu og Debian-baserte distribusjoner:
sudo apt installer wkhtmltopdf
På Arch-baserte distroer som Manjaro Linux:
sudo pacman -S wkhtmltopdf
Det er også enkelt å installere wkhtmltopdf på RHEL-baserte distroer som Fedora og CentOS.
sudo dnf installer wkhtmltopdf
Grunnleggende syntaks
Den grunnleggende syntaksen til kommandoen er:
wkhtmltopdf nettsidens filnavn
...hvor nettside er nettadressen til websiden du vil konvertere og filnavn er navnet på den utgående PDF-filen.
Slik konverterer du Google-hjemmesiden til et PDF-dokument:
wkhtmltopdf https://google.com google.pdf
Produksjon:
Når du åpner PDF-filen, vil du legge merke til at wkhtmltopdf nettopp har gjengitt websiden til et dokument.
Skriv ut flere kopier av websiden
De - kopier flagg er en livredder hvis du vil at utdatafilen din skal ha flere kopier av websiden. Merk at når du skriver ut flere kopier, genererer wkhtmltopdf ikke flere PDF-filer, men legger til flere sider i et enkelt dokument i stedet.
Slik oppretter du tre eksemplarer av Googles hjemmeside:
wkhtmltopdf - kopier 3 https://google.com google.pdf
Den utgående PDF-filen vil inneholde tre sider som spesifisert i den nevnte kommandoen.
Legg til et gråtonefilter i utgangen
For å legge til et gråtonefilter i PDF-filen, bruk -g eller - gråtoner flagg med kommandoen:
wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf - gråtoner https://google.com google.pdf
Output-fil:
Endre retningen på PDF-filen
Som standard genererer wkhtmltopdf PDF-filen i vertikal oppsett, dvs. stående. For å endre denne standardadferden og fange websider i liggende i stedet, bruk --orientering flagg med kommandoen:
wkhtmltopdf - orienteringslandskap https://google.com google.pdf
Produksjon:
Vær oppmerksom på at landskapsversjonen av dokumentet har et større område for hvite mellomrom sammenlignet med portretten.
Ikke inkluder bilder mens du konverterer
Når du genererer utdata, bruker du. Hvis du ikke vil at wkhtmltopdf skal gjengi bilder som er tilstede på en webside - ingen bilder flagg:
wkhtmltopdf --no-bilder https://google.com google.pdf
Produksjon:
I slekt: Beste verktøy for å redigere en PDF-fil hvor som helst
Hvordan konvertere en webside til bilder
Verktøyet wkhtmltoimage er en del av wkhtmltopdf-pakken. Hvis du jobber med en rapport og vil inkludere bilder av et nettsted, vil dette verktøyet fungere til din fordel. Linux-terminalen gjør det ikke bare enklere for deg å ta bilder, men gir deg også en rekke alternativer som lar deg tilpasse utdataene dine.
Grunnleggende syntaks
Wkhtmltoimage har en syntaks som ligner på wkhtmltopdf:
wkhtmltil bildesiden filnavn
...hvor nettside er nettadressen til et nettsted og filnavn er navnet på utgangsbildet.
Konverter en webside til et bilde
Fortsetter vi med det nevnte eksemplet, la oss konvertere Googles hjemmeside til bilder.
wkhtml til bilde https://google.com google.png
Produksjon:
Du kan også spesifisere et tilpasset filformat som du vil at utgangsbildet skal ha. Wkhtmltoimage støtter følgende filtyper:
- JPEG / JPG
- PNG
- SVG
Hvis du for eksempel vil generere et JPG-bilde, er det bare å erstatte filtypen med JPG i kommandoen:
wkhtml til bilde https://google.com google.jpg
I slekt: JPG vs. JPEG: Hva er forskjellen mellom disse bildefilformatene?
Fange websider ved hjelp av Linux-terminalen
Du må ha en PDF-visning installert på Linux-systemet ditt hvis du vil se PDF-filene generert av wkhtmltopdf. Mens de fleste Linux-distribusjonene er forhåndsinstallert en PDF-editor, kan du manuelt velge og installere en PDF-editor som passer dine behov.
Trenger du å redigere en PDF-fil i Linux? Disse Linux PDF-redigererne er gratis å installere og enkle å bruke.
Les Neste
- Linux
- Linux

Deepesh er Junior Editor for Linux på MUO. Han har skrevet informasjonsinnhold på internett i over 3 år. På fritiden liker han å skrive, høre på musikk og spille gitaren.
Abonner på vårt nyhetsbrev
Bli med på nyhetsbrevet vårt for tekniske tips, anmeldelser, gratis e-bøker og eksklusive tilbud!
Ett steg til…!
Bekreft e-postadressen din i e-posten vi nettopp sendte deg.