Annonse
Hvis du vil konvertere utskrevet tekst til digital tekst som du kan kopiere, lime inn, redigere og søke, må du bruke OCR-skannere (Optical Character Recognition).
Når du velger å skanne eller ta et bilde av et dokument, vil dette lagres i et format som JPEG eller PDF. OCR-programvare kan deretter gjenkjenne bokstavene og tallene i disse dokumentene, og konvertere dem til en søkbar PDF 4 metoder for å lage og redigere PDF-filer gratisAv alle de vanlige filtypene som finnes i vår databehandlingsverden, er PDF sannsynligvis en av de mest restriktive, samtidig som den er tilgjengelig for alle å bruke (først og fremst å lese) ... Les mer , eller til en fil som du kan redigere i programmer som Microsoft Word.
Problemet er at noen OCR-skannere fungerer mye bedre enn andre, med at de aller beste er ganske tunge på lommeboken.
Omnipage18 koster for eksempel $ 150, men er spesielt flink til å gjenkjenne forskjellige språk. Adobe Acrobat Pro DC koster en øye-vanning $ 400, men har utrolig nøyaktighet.
ABBYY FineReader koster 150 dollar, men er fantastisk ved å konvertere dokumenter som magasiner og brosjyrer til søkbar tekst. Vi vil teste ABBYYs nettbaserte tilbud senere i denne artikkelen.Imidlertid, hvis du leter etter gratis alternativer som du kan nedlasting og bruk på Windows eller OS X, bør du gjøre det prøv ut disse OCR-verktøyene De 5 beste OCR-verktøyene for å trekke ut tekst fra bilderHvordan får du all den trykte teksten konvertert til noe som et digitalt program vil kunne gjenkjenne og indeksere når du har papirrester? Hold en god OCR-programvare i nærheten. Les mer . Men hvis du heller vil bruke en gratis, på nett OCR-verktøy, fortsett å lese, slik vi har prøvd de beste, med resultatene nedenfor.
Testen
Synes de fleste nå bruker sine smarttelefoner for å søke etter dem Skann og administrer kvitteringene dine, spar plass, papir og tidPapirkvitteringer går lett tapt og vanskelig å finne når du trenger dem mest. Heldigvis løser digital disse begge problemene. Les mer , Bestemte jeg meg for å bruke Evernotes skannbare app (Gratis på iOS og Android). Jeg skannet den første siden til Richard Dawkins Klatrefjell usannsynlig, for å se hvilke resultater vi kan få med veldig grunnleggende formatering. Jeg skannet også en side med Tim Ferriss ' Den 4-timers kokken å prøve ut skannerne med litt mer komplisert formatering. Jeg lagret hver av disse filene som en PDF.
Disse dokumentene ble deretter kjørt gjennom noen av de antatt beste OCR-verktøyene for å se hvor bra de klarte seg.
Gratis online OCR [ikke lenger tilgjengelig]
Heldigvis er det ingen registrering som kreves for å bruke gratis online OCR. Og jeg ble dobbelt imponert da jeg så påstanden deres om å beholde formateringen og utformingen av dokumentet mitt.
Nettstedet hevder å kunne støtte PDF, GIF, BMP, JPEG, TIFF og PNG som input. Utganger kan enten være DOC, et PDF-tekstdokument, RTF og TXT. Dessverre kunne jeg ikke finne ut om de hadde en filstørrelsesgrense.
Grunnleggende dokument til PDF
Konverterte helt perfekt. Det er ikke mye mer å si! Vi er på vei til a veldig god start.
Grunnleggende dokument til DOC
De virkelige ordene ser ut til å ha konvertert feilfritt, bortsett fra "ount" fra "Mount Rushmore" på en eller annen måte går AWOL. Formateringen er imidlertid en annen historie. Mange komma ble erstattet med understrekinger, og tilfeldige mellomrom ble satt inn på punkter i hele dokumentet. Når du senere ser hvordan premiumprogramvaren gikk ut i denne testen, er dette ikke en dårlig anstrengelse i det hele tatt.
Kompleks dokument til PDF
Det tok 120 sekunder å konvertere dokumentet! Når den var fullført, var all teksten blitt konvertert med omtrent 95% nøyaktighet, selv om teksten i den separate boksen øverst til høyre på siden ikke var undersøkbar. Noen få andre tegn i PDF-filen var også feil.
Kompleks dokument til DOC
Denne gangen tok konverteringen bare 10 sekunder, med teksten igjen konvertert med omtrent 95% nøyaktighet. Det var noen merkelige avstandsproblemer, og programvaren hadde problemer med å konvertere skrifttypen øverst til høyre i dokumentet, og savnet noen få tegn her og der.
Kjennelse
Hvis du vil konvertere enkeltformaterte dokumenter til PDF, er dette et fantastisk verktøy. Når det gjelder konvertering til DOC var ikke resultatene noe å skrive hjem om.
i2OCR fremsetter noen imponerende påstander. Verktøyet gjenkjenner over 60 språk, kan håndtere layout med flere kolonner (ved å fjerne formateringen), har ingen filstørrelsesgrenser, kan konvertere opplastede filer og fra nettadresser. Og du trenger ikke registrere deg for å bruke dette verktøyet heller.
Tjenesten fungerer ved bare å trekke ut teksten fra bildet ditt og deretter sende ut uformatert tekst. Du kan raskt rette eventuelle feil i siden-ved-side-visning, før du kopierer teksten til andre programmer, eller laster ned som DOC, PDF eller HTML.
Merk: Da jeg prøvde å laste opp mine PDF-dokumenter, ble disse avvist av i2OCR, så jeg trengte å konvertere disse til JPEG (ved å ta et skjermbilde av dem og deretter laste opp filene).
Grunnleggende dokument til vanlig tekst
På grunn av måten dette verktøyet fungerer på, går all formatering tapt, selv om konverteringen fra bilde til tekst var nesten perfekt. Det var noen små feil, for eksempel avsnittavstand, og noen komma ble erstattet med perioder, men dette er små knebler.
Kompleks dokument til vanlig tekst
Flertallet av teksten ble konvertert uten for mange feil, bortsett fra tittelen og oppskriften øverst til høyre, noe som var uleselig for dette verktøyet. Måten kolonnene ble konvertert til ren tekst på var langt fra ideell. Hvis du vil gjøre denne konverteringen brukbar, vil det trenge mye tid for å omorganisere linjene til sammenhengende setninger.
Kjennelse
For grunnleggende dokumenter fungerer i2OCR bra. Muligheten til å redigere teksten før nedlasting er også en veldig fin touch. For mer komplekse dokumenter er imidlertid konverteringen fremdeles ganske nøyaktig, men måten teksten blir sendt ut vil ikke gjøre livet ditt mye enklere.
Online OCR støtter for tiden 46 forskjellige språk, og kan konvertere PDF, JPG, BMP, TIFF og GIF til Word, Excel eller Plain Text-format. Nettstedet hevder at "konverterte dokumenter ser nøyaktig ut som originalen - tabeller, kolonner og grafikk".
Versjonen du kan bruke uten å registrere deg lar deg konvertere opptil 15 bilder per time (5 MB grense). Hvis du registrerer deg for en konto, kan du kjøpe flere sider øverst på denne grensen, samtidig som du også kan konvertere dokumenter på flere sider og ZIP-arkiver.
Grunnleggende dokument til DOC
Grunndokumentet konverteres feilfritt bortsett fra det romerske tallet Jeg ikke blir hentet. Som nettstedet lovet, var formateringen nøyaktig som i boken. Kudos til dette verktøyet.
Kompleks dokument til DOC
Etter å ha blitt skuffet over de tidligere OCR-verktøyene når jeg konverterte det kompliserte dokumentet, ble jeg massivt imponert av Online OCR. Oppsettet var nær perfekt, som du kan se ovenfor. Nok en gang ble oppskriften ikke plukket opp for godt, men andre mindre feil var ubetydelige.
Kjennelse
Helt fantastiske resultater fra Online OCR. Den eneste ulempen jeg ser er at det ikke er noen måte å laste ned de konverterte dokumentene som PDF-er, ettersom utdataformatene som er nevnt inkluderer bare DOCX, XLSX og TXT.
Som nevnt tidligere, er ABBYY en av markedslederne innen OCR-programvare, og koster rundt $ 150 for deres fulle, nedlastbare program. De tilbyr en 10-siders gratis prøveversjon for deres online verktøy, men (registrering kreves). For et abonnement på $ 5 vil deres online verktøy gjøre det mulig å konvertere 200 sider hver måned.
Godkjente filer kan være opptil 100 MB i alle disse formatene: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP og PNG. ABBYY gjenkjenner også nesten 200 språk. Utgangene er spesielt imponerende, med et valg mellom DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 og EPUB.
Du kan til og med prøve ut et par BETA-funksjoner under prøveperioden. Det første er alternativet å oversette dokumentet til et annet språk. Det andre er å eksportere det konverterte dokumentet til din skylagringskonto, enten det er Dropbox, Google Drive, Evernote, Microsoft OneDrive eller Box.
Grunnleggende dokument til DOCX
De samlede resultatene var gode, men ikke utrolig med tanke på at dette er et premiumprodukt. Flere kommaer og perioder ble byttet rundt, flere inverterte komma ble erstattet med en asterix, et par store bokstaver manglet og ett ord (bokstavelig) ble stavet feil.
Kompleks dokument til DOCX
Når den ble konvertert var det svært få feil i teksten i dokumentet (bortsett fra at OCR slet med fontens oppskrift igjen!), Men formateringen etterlot mye å være ønsket.
De tre kolonnene tok på en eller annen måte to sider, med den sentrale kolonnen kun vises på andre side. Hvis du ville det gjøre hva som helst med dette konverterte dokumentet, vil du ende opp med å trekke håret ut.
Grunnleggende dokument til PDF
Mens jeg vurderte den konverterte PDF-filen, kunne jeg ikke finne noen feil i det hele tatt. Kanskje har vi funnet hvor ABBYY utmerker seg. Fantastiske resultater.
Kompleks dokument til PDF
Igjen, jeg kunne ikke finne noen feil i denne konverterte filen. ABBYY vet tydeligvis hvordan man konverterer til PDF eksepsjonelt godt.
Kjennelse
Hvis du er fornøyd med å betale noen dollar, ser det ut til at konvertering til PDF fungerer fenomenalt bra med denne tjenesten i stand til å synkronisere konverterte filer til skylagring er spesielt nyttig hvis du skanner et stort volum dokumenter. Som med de andre alternativene, har ABBYY fremdeles ikke funnet ut hvordan du feilfritt kan konvertere dokumenter til DOC for enkel redigering.
Det endelige utfallet
Hvis du, som de fleste, bare vil skanne noen få magasinartikler og noen husholdningsregninger, trenger du ikke å redigere disse dokumentene. Derfor vil konvertering direkte til en PDF være passende for deg, fordi du fremdeles kan søke i disse dokumentene. For dette var Free Online OCR definitivt det beste gratis verktøyet vi testet. Når det er sagt, hvis du er villig til å betale $ 5 per måned for nær perfeksjon, ABBYYs FineReader Online var litt mer nøyaktig.
Når det gjelder konvertering av dokumenter til DOC, klarte vi ikke å finne noen løsning som var perfekt, men de desidert beste resultatene kom fra Online OCR. Konverteringen var ikke perfekt, men formateringens integritet ble stort sett holdt intakt, og feil var ubetydelige. Når vi sammenligner disse resultatene med premium-tilbudet fra ABBYY, kan du ikke la være å bli imponert massivt.
Vi inkluderte ikke Google Disks OCR-funksjoner i dette innlegget; litt for Googles allverdighet, men mer for det faktum at vi ønsket å teste noen få andre gratis OCR-tjenester der ute.
Over til deg: Hvilke andre online OCR-verktøy vil du anbefale våre lesere? Og som har du prøvd at du aldri ville brukt igjen?
Rob Nightingale har en grad i filosofi fra University of York, UK. Han har jobbet som sosial mediesjef og konsulent i over fem år, mens han holdt workshops i flere land. De siste to årene har Rob også vært teknologiforfatter, og er MakeUseOfs sosiale mediesjef og nyhetsbrevredaktør. Du finner ham vanligvis på reise...