الأربعاء، 18 يونيو 2014

موقع لتحويل ملفات PDF إلى نصوص واستخراج الصور والخطوط


عندما نتحدث عن تحويل ملف نصي إلى ملف PDF يكون الأمر في غاية السهولة والبساطة، لأن الأمر يكون شبيه بتصوير صفحات المستند وإدخالها إلى ملف PDF بغض النظر عن طبيعة اللغة التي كتب بها المستند، لكن عندما نعكس الأمر أي تحويل ملف PDF إلى نص فهنا تكون الإشكالية كبيرة لأن العملية تعتمد على دعم اللغة، لهذا نجد أن هذه الميزة قل ما يمكن العثور عليها في برامج أجنبية بالنسبة للغة العربية، وحتى إن وجدت فقد يكون الدعم جد محدود وضيق إلى درجة كبيرة، ويعد موقع extractpdf واحد من تلك الخدمات القليلة التي تدعم تحويل ملفات PDF إلى نص عن طريق تقنية OCR

يقدم موقع extractpdf خدمة مجانية على الأنترنت تستطيع من خلالها تحويل ملفات PDF إلى نص واستخراج الصور والخطوط ومعلومات الملف، المهم هنا أن الموقع يدعم اللغة العربية ليس لكل الملفات لكن على الأقل لبعض منها.

رابط الموقع extractpdf


بعد زيارة الموقع حدد ملف PDF من جهازك لا يتعدى حجمه 10 ميغابايت، أو عبر رابط مباشر لملف PDF ثم إضغط على Send file لبدء رفع الملف ثم التحويل.


بعد انتهاء عملية التحويل سوف تحصل على النتيجة فإذا كان الملف يحتوي على صور سوف تجدها في تبويب Images وللحصول على النص سوف تجده في تبويب Text، لا حظ أن الدعم غير كامل لكنه معقول إلى حد ما، يتم تحويل 100 سطر الأول فقط، إنسخه أو إضغط على Download result as file لتحميله على شكل ملف نصي بصيغة txt.

كذلك إذا اكتشف التطبيق أي خطوط مستخدمة في الملف سوف تجدها في تبويب Fonts وفي التبويب الاخير Metadata تجد معلومات حول الملف المرفوع


ليست هناك تعليقات:

إرسال تعليق