Den kompletta guiden till säker OCR

Varför metoden spelar roll för känsliga dokument

OCR förvandlar text som är instängd i bilder — skannade kontrakt, kvitton, foton av whiteboards — till sökbar, redigerbar text. Haken: de flesta gratis OCR-tjänster online laddar upp ditt dokument till en server för att göra det, vilket är precis vad du inte vill för journaler, deklarationer eller ID-handlingar. Den här guiden gör det säkert, helt och hållet i din webbläsare. (För varför moln-OCR är riskabelt och vilka dokument som är mest känsliga att ladda upp, se Learn-artikeln om OCR-integritetsrisker.)

Den enda risken att undvika: uppladdningen

Varje moln-OCR-tjänst delar samma grundläggande risk — ditt dokument lämnar din enhet. Utlovad ”omedelbar radering” kan inte verifieras oberoende, överföring kan avlyssnas, och vissa gratistjänster återanvänder öppet uppladdade dokument som AI-träningsdata. Lösningen är inte en bättre integritetspolicy; den är att aldrig ladda upp över huvud taget.

Hur du extraherar text säkert — steg för steg

1. Öppna SafeOCR — Tesseract.js-motorn laddas in i din webbläsarflik; inget laddas upp. 2. Lägg till din bild, eller upp till 10 åt gången, genom att dra in den. 3. Välj dokumentets huvudspråk och ett kvalitetsläge — Fast för rent tryck, Precise för handskrift eller dåliga skanningar. 4. Låt den förbehandla (gråskala, kontrast, räta upp) och känna igen texten i fliken. 5. Granska och åtgärda eventuella feltolkade tecken i redigeraren. 6. Exportera som sökbar PDF, Excel eller vanlig text — eller kopiera direkt till urklipp. Du kan bevisa att inget lämnade din enhet genom att öppna webbläsarens utvecklarverktyg och titta på fliken Nätverk: noll filuppladdningsförfrågningar visas under hela processen.

5 tips för bättre OCR-noggrannhet

Använd högupplösta bilder. Vi rekommenderar en minsta skanningsupplösning på 300 DPI. En högre upplösning innebär att även mycket liten text känns igen korrekt.
Håll dokumenten raka. SafeOCRs automatiska skevhetskorrigering hjälper till, men att börja med ett välriktat och rakt original ger alltid ett betydligt bättre slutresultat.
Säkerställ jämn belysning. Skuggor och bländning minskar igenkänningsnoggrannheten avsevärt. Använd en flatbäddsskanner eller fotografera dokumentet under naturligt, diffust ljus.
Välj rätt kvalitetsläge. Rena tryckta dokument fungerar utmärkt med läget "Snabb", men för handskrift eller dokument av låg kvalitet bör du använda läget "Exakt" för bättre resultat.
Välj rätt språk. Att specificera dokumentets primära språk gör att igenkänningsmotorn kan använda en optimerad språkmodell, vilket avsevärt förbättrar slutnoggrannheten.

Stödda format och exportalternativ

SafeOCR stöder bildformaten JPEG, PNG, BMP, TIFF och WebP. Du kan bearbeta upp till 10 bilder åt gången, med en maximal filstorlek på 20 MB vardera. Fyra olika exportformat finns tillgängliga: sökbar PDF (med textsökning via Ctrl+F), Excel XLSX (med automatisk tabellidentifiering och konvertering), ren text TXT samt kopiering direkt till urklipp. Över 100 språk stöds, med hög noggrannhet för viktiga språk inklusive svenska, engelska, koreanska, japanska, kinesiska och arabiska.