ياسر جلال: السيسي شجاع ولا يخشى إلا على مصلحة الوطن    المستشار عصام فريد رئيسا للشيوخ والعوضي وسعد وكيلين    «قناة السويس» تتابع جودة الخدمات الغذائية المقدمة لطلاب المدينة الجامعية    عاشور: الذكاء الاصطناعي ضرورة استراتيجية لدعم اقتصاد المعرفة    الري: مستمرون في إدارة إيراد نهر النيل بمرونة واستعدادات مكثفة لموسم السيول    إنشاء 3 كليات جديدة بجامعة بنها الأهلية    المنوفي بعد تحريك أسعار الوقود.. الأسواق تحت السيطرة ولا زيادات بأسعار السلع    شعبة الأدوات الكهربائية: استمرار مبادرة دعم الأنشطة الإنتاجية ينعش القطاع الصناعي    صحيفة إسبانية: قمة بوتين – ترامب في المجر «كابوس سياسي» للاتحاد الأوروبي    إيران تعلن انتهاء القيود النووية    الجنائية الدولية ترفض استئناف إسرائيل في قضية غزة    تفاصيل اجتماع وزير الرياضة مع رئيس كاف    محافظ أسوان في جولة مفاجئة على المخابز والأسواق: هدفنا ضبط الأسعار    موجة صيف متأخرة.. تحذير هام من «الأرصاد» للمواطنين    تحرير 1090 مخالفة مرورية لعدم ارتداء الخوذة    لليوم الثاني على التوالي.. إطلاق طائرات الباراموتور بمشاركة 100 مغامر أجنبي من 15 دولة بالأقصر    قبل إغلاق قاعة توت عنخ آمون.. إقبال كبير على زيارة المتحف المصري بالتحرير    بين الجرأة والكلاسيكية.. حضور لافت لنجمات ونجوم الفن في ثاني أيام مهرجان الجونة    الصحة: ارتفاع معدلات الولادات القيصرية إلى 88% بالإسكندرية    المستشفيات التعليمية تتوسع في خدمات كهرباء القلب إلى بنها ودمنهور لتخفيف العبء عن المرضى    «الصحة» تواصل برنامج «درّب فريقك» لتعزيز مهارات فرق الجودة بالمنشآت الصحية    محافظ أسوان يفاجئ مخابز ومحلات جزارة بكوم إمبو    مصرع 3 أشخاص وإصابة 15 شخصا فى حادثى سير بالطريق الصحراوى بالبحيرة    تعرف على موعد تأخير الساعة في مصر 2025 وسبب اختيار يوم الجمعة لتطبيق التوقيت الشتوي    أعضاء مجلس الشيوخ يؤدون اليمين الدستورية.. اليوم    بعد نجاتها من حادث سير.. نجوى إبراهيم تكشف تطورات حالتها الصحية (فيديو)    مواقيت الصلاة اليوم السبت 18 أكتوبر 2025 في محافظة المنيا    تعرف على عقوبة عدم التصويت في الانتخابات البرلمانية    استقرار نسبي في أسعار الفراخ اليوم السبت 18 اكتوبر 2025فى المنيا    السبت 18 أكتوبر 2025.. نشرة أسعار الحديد والأسمنت بالمصانع اليوم    جولة لمدير الرعاية الصحية بالأقصر بوحدة طب أسرة طيبة لمتابعة خدمات المواطنين    ترامب يدعو كييف وموسكو إلى التوقف عند هذا الحد وإنهاء الحرب    «الحوض والظهر».. المعد البدني السابق للأهلي يكشف سبب إصابات أشرف داري    رئيس صريبا: قمة بوتين وترامب في المجر أهم قمة في القرن 21    ترامب يدعو أوكرانيا وروسيا إلى وقف الحرب فورا    طريقة عمل البطاطا الحلوة بالبشاميل، تحلية مغذية ولذيذة    ذات يوم.. 18 أكتوبر 2006.. وفاة الكاتب المفكر محمد عودة.. «الفقير» الذى اغتنى بلمة المريدين ومؤلفات ومواقف تحمل أمانة الكلمة وضميرا يقظا لم تخترقه أى إغراءات    أسعار العملات الأجنبية في بداية تعاملات اليوم 18 أكتوبر 2025    الدفاع الروسية: تدمير 41 مسيرة أوكرانية فوق عدة مناطق    الأهلى يضع «عبدالمنعم» ضمن المرشحين لدعم الدفاع فى يناير    عبد البصير: موقع المتحف الكبير سيحوّل المنطقة إلى مقصد ثقافي عالمي    لا ترهق نفسك بالتفاصيل غير الضرورية.. خظ برج الجدي اليوم 18 أكتوبر    أنغام تُشعل أجواء قطر بأمسية غنائية استثنائية (فيديو)    استقرار أسعار اللحوم في المنيا اليوم السبت 18 أكتوبر 2025    مواعيد مباريات اليوم السبت 18 أكتوبر والقنوات الناقلة    الزمالك يواجه ديكيداها الصومالي في مستهل مشواره بالكونفدرالية الأفريقية    اليوم.. الحكم على 37 متهما بقضية "خلية التجمع"    تعرف على مواقيت الصلاة اليوم السبت 18-10-2025 في محافظة قنا    تعادل مثير بين سان جيرمان وستراسبورج في الدوري الفرنسي    رسميا.. فوز أسامة أبو زيد برئاسة نادى الشمس للمرة الثالثة على التوالى    المصري هيثم حسن يقود تشكيل ريال أوفييدو أمام إسبانيول في الليجا    انخفاض كبير في عيار 21 الآن بالمصنعية.. سعر الذهب والسبائك اليوم السبت بالصاغة    حكم التعصب لأحد الأندية الرياضية والسخرية منه.. الإفتاء تُجيب    هل يجوز للمريض ترك الصلاة؟.. الإفتاء تُجيب    القطط فى مصر القديمة.. الرفاق الذين أصبحوا آلهة    سقوط 3 متهمين بالنصب على راغبي شراء الشقق السكنية    ترامب يوقع أوامر بفرض رسوم جمركية جديدة ودعم إنتاج السيارات داخل الولايات المتحدة    العلماء يؤكدون: أحاديث فضل سورة الكهف يوم الجمعة منها الصحيح ومنها الضعيف    







شكرا على الإبلاغ!
سيتم حجب هذه الصورة تلقائيا عندما يتم الإبلاغ عنها من طرف عدة أشخاص.



بدون كتابة أي أكواد.. استخراج البيانات من الإنترنت باستخدام أداة ParseHub

الإنترنت في الأصل هو مجموعة كبيرة من البيانات، والبيانات هي نفط القرن الواحد والعشرين. ولذلك نشهد حاليا ارتفاعا كبيرا في الطلب على علوم البيانات ومحللي البيانات. ويعد استخراج البيانات من الإنترنت أو ما يعرف ب Web Scraping أو استخلاص المواقع حجر الأساس الذي تبني عليه الشركات كل الأمور المتعلقة بكل تحليل وتصوير البيانات وبناء النماذج والتوقعات. وتعتمد الكثير من الشركات على تقنيات استخراج البيانات لجعل أعمالها أكثر ربحية من خلال بناء أدوات لاستخلاص المواقع بالاعتماد على مطورين متخصصين.
لكن مع النمو الكبير في منصات التطوير دون استخدام كود التي توفر الوقت والمال والموارد لكل من الشركات والأفراد، أصبح من الممكن لأي شخص ليس لديه خبرة في البرمجة استخراج البيانات من الإنترنت باستخدام أدوات تعتمد على واجهة رسومية بسيطة مثل:ParseHub التي تتيح للمستخدم إنشاء مهام استخراج بيانات من خلال تحديد الخطوات التي سيقوم بها مستخرج الويب مع كل عنصر داخل الصفحة على حدة، وأى البيانات التي سيتم استخراجها من هذه العناصر دون الحاجة لكتابة أي كود.
ما الأمور التي يمكن استخدام ParseHub بها؟
- عمل الأبحاث بواسطة علماء البيانات.
- استخلاص الأخبار وتسعير المنتجات والمراجعات والملفات التعريفية والوظائف وما إلى ذلك.
- استخراج بيانات عدة مواقع على الإنترنت إلى مكان واحد.
- تحليل المنافسين والتسويق واتجاهات الصناعة.
كيفية التثبيت
بداية تحتاج إلى إنشاء حساب على منصة ParseHub بشكل مجاني، حيث تتيح الخطة المجانية إنشاء حتى 5 مشروعات، واستخراج البيانات حتى 200 صفحة في كل مرة.
https://www.parsehub.com/register
بعد التسجيل يمكنك تحميل البرنامج الخاص بالمنصة من خلال صفحة التحميل: https://www.parsehub.com/quickstart ويعمل البرنامج على أنظمة ويندوز ولينكس وماك.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
طريقة الاستخدام
بعد تثبيت البرنامج وتسجيل الدخول ستتمكن من القيام بمختلف الأمور من داخل واجهة البرنامج، حيث يأتي مع متصفحه المدمج الذي سنستخدمه للدخول إلى صفحات الويب واستخراج المعلومات أيضا.
- تحتاج في البداية إلى الضغط على مشروع جديد لبدء مشروع استخراج فارغ.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- داخل علامة تبويب المتصفح قم بالبحث عن الموقع الذي تود استخراج المعلومات منه، أو يمكنك ببساطة إدخال عنوان URL في المربع العلوي الأيسر كما هو موضح في الصورة.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- اضغط على Start project on this URL وستظهر نافذة جديدة.
- تنقسم الواجهة الرئيسية لاستخراج المعلومات إلى 3 أجزاء:
- على الجانب الأيسر يمكنك التحكم في كيفية سير العمل، وإضافة وتعديل العناصر التي سيتم استخراجها من الصفحة وإعادة تسميتها.
- بينما تبويب المتصفح على الجهة اليمنى يمكنك من خلاله التفاعل وتحديد العناصر في أي صفحة ويب لاستخدامها.
- أما الجزء السفلي فيتم عرض جميع المخرجات به، حتى تتمكن من معرفة البيانات التي سيتم استخراجها بشكل مباشر والقيام بأي تحسينات لازمة.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- ولبدء الاستخراج، تحتاج إلى الضغط على أي نص أو صورة بصفحة الويب. فمثلا يمكنك تحديد عنوان مقال ما. ستقترح الأداة عليك بعض العناصر الأخرى وبجانبها علامة الصواب، بالضغط على هذه المقترحات يمكنك جعل عملية الاستخراج أكثر دقة. يمكنك أيضا تغيير اسم العنصر الذي قمت بتحديده من خلال لوحة العناصر أيسر الشاشة إلى title مثلا.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- بعد أن أصبح لديك بعض البيانات يمكنك رؤية معاينة لما ستكون عليه من خلال علامة تبويب النتائج أسفل الشاشة.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- يمكنك أيضا استخراج معلومات متعلقة بالعنصر الذي اختره من خلال الضغط على زر + الموجود يمين كل عنصر في لوحة العناصر يسار الشاشة.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- فمثلا باستخدام أمر التحديد النسبي Relative Select، اضغط على المقالة الأولى ثم اسم المؤلف لاستخراج أسماء المؤلفين الخاصة بكل مقال.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- ويمكنك تكرار الخطوتين 7 و8 لاستخراج المزيد من المعلومات مثل تاريخ النشر ووقت القراءة باستخدام أمر التحديد النسبي.
- الآن لتصدير البيانات يمكنك الضغط على زر Get Data.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- ستمنحك الأداة ثلاث اختيارات: Test Run للتشغيل الاختباري لمعرفة ما إذا كان كل شيء يسير على ما يرام، والجدولة Scheduleلجدولة عملية استخراج البيانات، وأخيراRunللتشغيل العادي.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- سيبدأ ParseHub عملية جمع البيانات وفي غضون دقيقة ستحصل على البيانات.
- بعد الانتهاء، يمكنك تنزيل البيانات في العديد من التنسيقات مثل CSV / ExcelوJSON حسبما ترغب.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- وأخيرا ستجد البيانات منظمة ونظيفة لاستخدمها بالطريقة التي تريد.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
إذن.. يمكنك البدء في استخراج البيانات من على الإنترنت واستخدامها في علوم البيانات باستخدام أداة ParseHub دون الحاجة لكتابة أي أكواد. وعلى الرغم من سهولة أداة ParseHubإلا أنها قوية للغاية وتغنيك عن كتابة برامجك الخاصة لاستخراج الملفات، كما أنها توفر واجهة تحكم برمجية تتيح لك دمج الأداة وتكاملها مع التطبيقات والخدمات الأخرى بصورة سهلة وفعالة مما يوفر وقتك وجهدك ويمنحك إمكانيات كبيرة للبدء في استخراج البيانات.


انقر هنا لقراءة الخبر من مصدره.