Semalt: خمسة تطبيقات رائعة لكشط النصوص للصحفيين

الصحفي يجمع ويكتب ويوزع المحتوى بشكل منتظم. يركز / تركز بشكل أساسي على القضايا العامة أو القضايا السياسية أو الكوارث الطبيعية. يغطي معظم الصحفيين الأخبار في عالم الترفيه ، بينما يتحدث الآخرون عن الألعاب والرياضة. يجب على الصحفي القيام بمهام متعددة لكشط النصوص في نفس الوقت ؛ فهو / هي لا يستخرج البيانات فحسب ، بل يضمن أيضًا دقتها وشرعيتها إلى حد ما. يعرض الصحفيون أنفسهم أحيانًا للخطر ويكتبون مقالات إخبارية لإشراك المزيد والمزيد من القراء. إذا كنت تريد أن تصبح صحفيًا وتفتقر إلى مهارات البرمجة الأساسية ، فيمكنك استخدام التطبيقات التالية لإنجاز عملك.
1. مكشطة:
Scraper هي واحدة من أفضل خدمات النصوص والصور وقشطها وأكثرها فائدة. إنه سهل الاستخدام ويأتي بواجهة سهلة الاستخدام. باستخدام Scraper ، يمكن للصحفيين استهداف صفحات ويب متعددة في نفس الوقت واستخراج البيانات من مواقع كاملة أو جزئية. تشتهر Scraper بتقنية التعلم الآلي وتستخرج نصًا عاديًا من CNN و BBC ومواقع إخبارية أخرى مماثلة. يمكنك بعد ذلك تصدير هذه البيانات إلى ملفات مستندات Google أو CSV أو JSON. يستخدم XPath لتقييم جودة النصوص.
2. Outwit Hub:
Outwit Hub مناسب لكل من الصحفيين وغير المبرمجين. لست بحاجة إلى تعلم Python أو C ++ أو Ruby للاستفادة من هذا التطبيق. وهو في الأساس ملحق Firefox ويزيل الملفات النصية وملفات PDF ومستندات HTML والصور لك. يعطي Outwit Hub نتائج دقيقة ويمكن استخدامه لفهرسة مواقع الويب المختلفة بشكل ملائم.
3. Scraperwiki:

يمكنك استخدام Scraperwiki لاستخراج البيانات من صفحات ويكيبيديا والمجلات الإلكترونية ومواقع الأخبار ومواقع التجارة الإلكترونية. وهو تطبيق قائم على المتصفح يوفر نتائج خالية من الأخطاء على الفور. إذا لم يكن لديك أي معرفة بالتشفير ، فإن Scraperwiki هو الخيار المناسب لك. من خلال هذه الخدمة ، يمكن للصحفيين اكتشاف الموقع بالكامل وتنزيل البيانات على محركات الأقراص الثابتة الخاصة بهم في غضون ثوان. الإصدار الكلاسيكي من Scraperwiki مناسب لمطوري التطبيقات والمستقلين وأصحاب المواقع.
4. Import.io:
Import.io هي واحدة من أفضل خدمات إلغاء النص وأكثرها فائدة على الإنترنت. يساعد الصحفيين على البحث عن الموضوعات الشائعة واستخراج البيانات بدقة ونشرها على مواقع الأخبار الخاصة بهم في غضون دقائق. باستخدام Import.io ، يمكنك مسح كل من الملفات النصية وملفات JPG. بمجرد تثبيتها وتنشيطها ، ستقوم هذه الأداة بما يصل إلى ألفي مشروع كشط نص في نفس الوقت. إنه يقوم بعمل جيد جدًا لجلب المحتوى من عناوين URL المعينة ويتيح لك تحليل البيانات دون أي مشكلة.
5. مختبرات Kimono:
تمامًا مثل Import.io ، تستهدف Kimono Labs عددًا كبيرًا من المواقع. وهي تعمل ككاشطة نصية كاملة الحجم وزاحف ويب على الإنترنت. عليك فقط ذكر عنوان URL الذي تريد استخراج المعلومات منه ، وستحصل Kimono Labs على النتائج المرجوة في بضع دقائق. تشتهر بتكنولوجيا التعلم الآلي والحفريات حول الإنترنت للعثور على مواضيع مناسبة للصحفيين. يمكنك حفظ الصور والملفات النصية في محرر مستندات Google أو تنزيلها مباشرة على جهاز الكمبيوتر الخاص بك.