Lydbøker blir mer og mer populært i forhold til tradisjonelle e-bøker. De er mer praktiske ettersom du kan lytte til dem når som helst og hvor som helst.

Du kan konvertere en eBook PDF til en lydbok med et enkelt Python-skript. Ved å bruke noen enkle biblioteker kan du utvikle et prosjekt som leser opp en PDF og lagrer lydboken som en ny fil.

Installere nødvendige pakker

Du må installere PyPDF3, pyttsx3, og pdf rørlegger pakker for å komme i gang. Du kan installere disse pakkene ved å bruke pip-pakkebehandlingen. Sørg for at du allerede har gjort det installert pip på systemet ditt. Kjør følgende kommando i ledeteksten for å installere pakkene:

pip installere PyPDF3 pyttsx3 pdfrørlegger
  • Du kan bruke PyPDF3 bibliotek for å lese og redigere PDF-filer i Python.
  • De pyttsx3 bibliotek gir tekst-til-tale konvertering.
  • pdf rørlegger er et bibliotek som lar deg trekke ut tekst og tabeller fra PDF-filer.

Koden som brukes i dette prosjektet er tilgjengelig i en GitHub-depot og er gratis for deg å bruke under MIT-lisensen.

instagram viewer

Konvertere en PDF til en lydbok ved hjelp av Python

Når du har installert pakkene ovenfor, er du klar til å importere dem til python-filen din:

import PyPDF3
import pyttsx3
import pdf rørlegger

Du må oppgi navnet og plasseringen til PDF-filen du vil konvertere. For enkelhets skyld kan du bruke hvilken som helst eksempel PDF-fil. Kopier det til samme katalog som skriptet ditt og lagre navnet i en variabel; hvis det heter Lorem.pdf, for eksempel:

fil = 'Lorem.pdf'

Deretter oppretter du et filobjekt for PDF-filen og et PDF-leserobjekt:

bok = åpen (fil, 'rb')
pdfReader = PyPDF3.PdfFileReader (bok)

Senere vil du gå gjennom alle sidene i PDF-filen. For å finne totalt antall sider, bruk antall sider eiendom:

sider = pdfReader.numPages

Nå er du klar til å trekke ut teksten fra PDF-filen:

finalText = ""

med pdfplumber.open(fil) som pdf:
for i innen rekkevidde (0, sider):
side = pdf.sider[i]
tekst = side.ekstrakt_tekst()
finalText += tekst

Bruk en for-løkke for å iterere gjennom alle sidene og trekke ut teksten fra PDF-en. Du kan bruke pdfplumber-pakken til å åpne pdf-filen og extract_text metode for å hente tekst fra en side.

Med hele teksten lagret i en variabel, kan du behandle den videre, avhengig av dine behov. Hvis du vil konvertere teksten til lyd og lagre den i en ny fil, bruk følgende kode:

motor = pyttsx3.init()
engine.save_to_file (finalText, 'lorem.mp3')
motor.runAndWait()

Når du kjør denne Python-koden, vil den opprette en lydbokfil i katalogen.

Hvis du ikke ønsker å lagre lydboken og for eksempel vil resitere PDF-filen, kan du bruke følgende kode i stedet:

motor = pyttsx3.init()
motor.si(siste tekst)
motor.runAndWait()

Når du kjører dette skriptet, vil det resitere PDF-filen.

Utvikle prosjekter ved hjelp av Python

Python er kjent for sin allsidighet. Du kan enkelt lage prosjekter med praktiske applikasjoner ved hjelp av Python.

Hvis du ønsker å skitne til hendene med Python-kode, kan du begynne med å utvikle miniprosjekter. Noen gode startideer er en quiz-app, chatbot, slangespill, URL-forkorter, nettskraper eller enhetsomformer.