الدليل الشامل للتعرف الضوئي على الحروف الآمن

لماذا تهمّ الطريقة في المستندات الحساسة

يحوّل OCR النصَّ المحبوس في الصور — العقود الممسوحة ضوئيًا والإيصالات وصور اللوح الأبيض — إلى نص قابل للبحث والتحرير. لكن المشكلة: معظم خدمات OCR المجانية على الإنترنت ترفع مستندك إلى خادم لإنجاز ذلك، وهو بالضبط ما لا تريده لسجلاتك الطبية أو نماذج الضرائب أو وثائق الهوية. يفعل هذا الدليل الأمر بأمان، بالكامل داخل متصفحك. (لمعرفة لماذا يكون OCR السحابي محفوفًا بالمخاطر وأي المستندات أكثر حساسية للرفع، راجع مقال Learn حول مخاطر خصوصية OCR.)

الخطر الوحيد الذي يجب تجنّبه: الرفع

كل خدمة OCR سحابية تتشارك الخطر الجذري نفسه — مستندك يغادر جهازك. لا يمكن التحقق باستقلالية من «الحذف الفوري» الموعود، ويمكن اعتراض الإرسال، وتعيد بعض الخدمات المجانية صراحةً استخدام المستندات المرفوعة كبيانات لتدريب الذكاء الاصطناعي. الحل ليس سياسة خصوصية أفضل؛ بل عدم الرفع من الأساس.

كيف تستخرج النص بأمان — خطوة بخطوة

1. افتح SafeOCR — يُحمَّل محرك Tesseract.js داخل تبويب متصفحك؛ ولا يُرفع شيء. 2. أضِف صورتك، أو ما يصل إلى 10 صور دفعةً واحدة، بسحبها إلى الداخل. 3. اختر اللغة الأساسية للمستند ووضع جودة — Fast للطباعة النظيفة، وPrecise للكتابة اليدوية أو عمليات المسح الرديئة. 4. دعه يجري المعالجة المسبقة (تدرّج رمادي، تباين، تصحيح الميل) ويتعرّف على النص داخل التبويب. 5. راجع وأصلِح أي أحرف قُرئت خطأً في المحرر. 6. صدّر بصيغة PDF قابل للبحث أو Excel أو نص عادي — أو انسخ مباشرةً إلى الحافظة. يمكنك إثبات أن لا شيء غادر جهازك بفتح أدوات المطوّر في متصفحك ومراقبة علامة تبويب الشبكة: لا تظهر أي طلبات رفع ملفات طوال العملية كاملةً.

5 نصائح لدقة أفضل في التعرف الضوئي على الحروف

استخدم صوراً عالية الدقة للحصول على أفضل النتائج. ننصح بدقة مسح لا تقل عن 300 نقطة لكل بوصة (DPI). فالدقة الأعلى تعني تعرفاً أدق وأوضح حتى على النصوص الصغيرة الحجم.
حافظ على استقامة المستندات قدر الإمكان. فميزة تصحيح الانحراف التلقائي في SafeOCR مفيدة جداً، لكن البدء بنسخة أصلية جيدة التوجيه والاستقامة يعطي دائماً نتائج أفضل وأدق في النهاية.
تأكد من وجود إضاءة متساوية ومنتظمة. فالظلال والوهج اللامع يقللان من دقة التعرف بشكل ملحوظ. لذا استخدم ماسحاً ضوئياً مسطحاً، أو التقط صور المستندات تحت ضوء طبيعي منتشر وموزّع بالتساوي.
اختر وضع الجودة المناسب لطبيعة مستندك. فالمستندات المطبوعة النظيفة تعمل بشكل جيد مع وضع "السريع"، لكن بالنسبة للكتابة اليدوية أو المستندات منخفضة الجودة، استخدم وضع "الدقيق" للحصول على نتائج أفضل بكثير.
حدد اللغة الصحيحة للمستند. فتحديد اللغة الأساسية للمستند يتيح لمحرك التعرف استخدام نموذج لغوي محسّن ومخصص، مما يُحسّن دقة النتائج بشكل ملحوظ ويقلل الأخطاء.

الصيغ المدعومة وخيارات التصدير

يدعم SafeOCR صيغ الصور الشائعة JPEG وPNG وBMP وTIFF وWebP. ويمكنك معالجة ما يصل إلى 10 صور في وقت واحد، بحجم ملف أقصاه 20 ميجابايت لكل صورة على حدة. وتتوفر أربع صيغ تصدير مختلفة: ملف PDF قابل للبحث (مع إمكانية البحث النصي عبر Ctrl+F)، وملف إكسل XLSX (مع اكتشاف الجداول وتحويلها تلقائياً)، ونص عادي بصيغة TXT، إضافة إلى النسخ المباشر إلى الحافظة. ويدعم المحرك أكثر من 100 لغة، مع دقة عالية للغات الرئيسية، بما في ذلك العربية والإنجليزية والكورية واليابانية والصينية.