المدرسة الثانوية الفنية لمياه الشرب والصرف الصحي.. الشروط والمستندات المطلوبة للتقديم    رئيس المحطات النووية : الضبعة من أضخم مشروعات إنتاج الطاقة الكهربائية في أفريقيا    هل قطع الأشجار وراء موجات ارتفاع الحرارة؟ رد غير متوقع من البيئة    عاجل | الضرائب تحذر كل من أجر شقة يمتلكها ولم يخطر المصلحة    أكسيوس: بلينكن ضغط على نتنياهو بشأن أموال السلطة الفلسطينية    كيف تأثرت دفاعات أوكرانيا بعد سيطرة روسيا على أفدييفكا؟    روبرتسون: اسكتلندا لا تتعرض لضغوط قبل مواجهة ألمانيا فى افتتاح يورو 2024    رسالة مدرب ألمانيا للجماهير قبل افتتاح يورو 2024    وزير الرياضة: «كابيتانو مصر» يواصل تسويق لاعبيه لأندية الدوري الممتاز    إصابة 9 أشخاص في انقلاب ميكروباص ب"صحراوي أطفيح"    ويزو عن انتقادات "السوشيال ميديا" للفنانين: "مفيش معايير ومش فاهماهم"    آسر ياسين ينشر صورًا جديدة من كواليس فيلم "ولاد رزق 3"    متحدث التنمية المحلية: نفذنا 7.6 مليون شجرة بتكلفة 200 مليون جنيه    الثقافة البصرية والذوق العام في نقاشات قصور الثقافة بمنتدى تنمية الذات    دعاء يوم «عرفة» أفضل أيام السنة.. «اللهم لا ينقضي هذا اليوم إلا وقد عفوت عنا»    قبل عيد الأضحى 2024.. شروط الأضحية وكيفية تقسيمها    تحرك برلماني عاجل لمحاسبة الشركات الوهمية المسؤولة عن سفر الحجاج المصريين    حزب الحركة الوطنية يفتتح ثلاثة مقرات في الشرقية ويعقد مؤتمر جماهيري (صور)    إليك الرابط.. كيف تفتح حسابا بنكيا من الهاتف المحمول وأنت في منزلك؟    افتتاح معمل تحاليل بمستشفى القلب والصدر الجامعي في المنيا    طريقة عمل المكرونة بالصلصة، أسرع أكلة وعلى أد الإيد    أوبك: لا نتوقع بلوغ الطلب على النفط ذروته على المدى الطويل    محافظ شمال سيناء يعتمد الخطة التنفيذية للسكان والتنمية    تحرش بسيدة ولامس جسدها.. الحبس 6 أشهر لسائق «أوبر» في الإسكندرية    رئيس هيئة الدواء: دستور الأدوية الأمريكي يحدد معايير الرقابة ويضمن سلامة المرضى    بعد لقائهما بيوم واحد.. وزير الخارجية السعودي يتلقى اتصالا من نظيره الإيراني    سفاح التجمع يشعل مواجهة بين صناع الأعمال الدرامية    "تموين الدقهلية": ضبط 124 مخالفة في حملات على المخابز والأسواق    شواطئ ودور سينما، أبرز الأماكن فى الإسكندرية لقضاء إجازة عيد الأضحى    الأنبا تيموثاوس يدشن معمودية كنيسة الصليب بأرض الفرح    حظك اليوم وتوقعات الأبراج الجمعة 14-6-2024، السرطان والأسد والعذراء    الكويت: حبس مواطن ومقيمين احتياطا لاتهامهم بالقتل الخطأ فى حريق المنقف    وكيل الصحة بمطروح يتابع سير العمل بمستشفى مارينا وغرفة إدارة الأزمات والطوارئ    محاولة اختطاف خطيبة مطرب المهرجانات مسلم.. والفنان يعلق " عملت إلى فيه المصيب ومشيته عشان راجل كبير "    النيابة أمام محكمة «الطفلة ريتاج»: «الأم انتُزّعت من قلبها الرحمة»    نقيب الأشراف مهنئًا بالعيد: مناسبة لاستلهام معاني الوحدة والمحبة والسلام    انتشال جثة شاب لقى مصرعه غرقا بعد إنقاذه 3 أطفال من الموت فى ترعة بالشرقية    تجديد حبس شقيق كهربا 15 يوما في واقعة التعدي على رضا البحراوي    في وقفة عرفات.. 5 نصائح ضرورية للصائمين الذاهبين للعمل في الطقس الحار    مجانًا.. فحص 1716 شخصًا خلال قافلة طبية بقرية حلوة بالمنيا    آداب عين شمس تعلن نتائج الفصل الدراسي الثاني    قبول دفعة جديدة من المجندين بالقوات المسلحة مرحلة أكتوبر 2024    لبيك اللهم لبيك.. الصور الأولى لمخيمات عرفات استعدادا لاستقبال الجاج    رئيس جامعة حلوان: المعمل المركزي يوفر بيئة محفزة للبحث العلمي    الصور الأولى لمخيمات عرفات استعدادا لاستقبال حجاجنا    الإسماعيلى يستأنف تدريباته اليوم استعدادا لمواجهة إنبى فى الدورى    ضياء السيد: طلب كولر بشأن تمديد عقد موديست منطقي    «الإسكان»: تنفيذ إزالات فورية لمخالفات بناء وغلق أنشطة مخالفة بمدينة العبور    الحماية المدنية تنقذ طفلا عالقا خارج سور مدرسة في الوادي الجديد    صعود جماعي لمؤشرات البورصة في مستهل تعاملات الخميس    أجواء مضطربة في فرنسا.. و«ماكرون» يدعو لانتخابات برلمانية وتشريعية    قيادي ب«مستقبل وطن»: جهود مصرية لا تتوقف لسرعة وقف الحرب بقطاع غزة    حريق هائل في مصفاة نفط ببلدة الكوير جنوب غرب أربيل بالعراق | فيديو    عبد الوهاب: أخفيت حسني عبد ربه في الساحل الشمالي ومشهد «الكفن» أنهى الصفقة    مدرب بروكسيي: اتحاد الكرة تجاهل طلباتنا لأننا لسنا الأهلي أو الزمالك    الأهلي يكشف حقيقة طلب «كولر» تعديل عقده    ناقد رياضي ينتقد اتحاد الكرة بعد قرار تجميد عقوبة الشيبي    هشام عاشور: "درست الفن في منهاتن.. والمخرج طارق العريان أشاد بتمثيلي"    







شكرا على الإبلاغ!
سيتم حجب هذه الصورة تلقائيا عندما يتم الإبلاغ عنها من طرف عدة أشخاص.



بدون كتابة أي أكواد.. استخراج البيانات من الإنترنت باستخدام أداة ParseHub

الإنترنت في الأصل هو مجموعة كبيرة من البيانات، والبيانات هي نفط القرن الواحد والعشرين. ولذلك نشهد حاليا ارتفاعا كبيرا في الطلب على علوم البيانات ومحللي البيانات. ويعد استخراج البيانات من الإنترنت أو ما يعرف ب Web Scraping أو استخلاص المواقع حجر الأساس الذي تبني عليه الشركات كل الأمور المتعلقة بكل تحليل وتصوير البيانات وبناء النماذج والتوقعات. وتعتمد الكثير من الشركات على تقنيات استخراج البيانات لجعل أعمالها أكثر ربحية من خلال بناء أدوات لاستخلاص المواقع بالاعتماد على مطورين متخصصين.
لكن مع النمو الكبير في منصات التطوير دون استخدام كود التي توفر الوقت والمال والموارد لكل من الشركات والأفراد، أصبح من الممكن لأي شخص ليس لديه خبرة في البرمجة استخراج البيانات من الإنترنت باستخدام أدوات تعتمد على واجهة رسومية بسيطة مثل:ParseHub التي تتيح للمستخدم إنشاء مهام استخراج بيانات من خلال تحديد الخطوات التي سيقوم بها مستخرج الويب مع كل عنصر داخل الصفحة على حدة، وأى البيانات التي سيتم استخراجها من هذه العناصر دون الحاجة لكتابة أي كود.
ما الأمور التي يمكن استخدام ParseHub بها؟
- عمل الأبحاث بواسطة علماء البيانات.
- استخلاص الأخبار وتسعير المنتجات والمراجعات والملفات التعريفية والوظائف وما إلى ذلك.
- استخراج بيانات عدة مواقع على الإنترنت إلى مكان واحد.
- تحليل المنافسين والتسويق واتجاهات الصناعة.
كيفية التثبيت
بداية تحتاج إلى إنشاء حساب على منصة ParseHub بشكل مجاني، حيث تتيح الخطة المجانية إنشاء حتى 5 مشروعات، واستخراج البيانات حتى 200 صفحة في كل مرة.
https://www.parsehub.com/register
بعد التسجيل يمكنك تحميل البرنامج الخاص بالمنصة من خلال صفحة التحميل: https://www.parsehub.com/quickstart ويعمل البرنامج على أنظمة ويندوز ولينكس وماك.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
طريقة الاستخدام
بعد تثبيت البرنامج وتسجيل الدخول ستتمكن من القيام بمختلف الأمور من داخل واجهة البرنامج، حيث يأتي مع متصفحه المدمج الذي سنستخدمه للدخول إلى صفحات الويب واستخراج المعلومات أيضا.
- تحتاج في البداية إلى الضغط على مشروع جديد لبدء مشروع استخراج فارغ.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- داخل علامة تبويب المتصفح قم بالبحث عن الموقع الذي تود استخراج المعلومات منه، أو يمكنك ببساطة إدخال عنوان URL في المربع العلوي الأيسر كما هو موضح في الصورة.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- اضغط على Start project on this URL وستظهر نافذة جديدة.
- تنقسم الواجهة الرئيسية لاستخراج المعلومات إلى 3 أجزاء:
- على الجانب الأيسر يمكنك التحكم في كيفية سير العمل، وإضافة وتعديل العناصر التي سيتم استخراجها من الصفحة وإعادة تسميتها.
- بينما تبويب المتصفح على الجهة اليمنى يمكنك من خلاله التفاعل وتحديد العناصر في أي صفحة ويب لاستخدامها.
- أما الجزء السفلي فيتم عرض جميع المخرجات به، حتى تتمكن من معرفة البيانات التي سيتم استخراجها بشكل مباشر والقيام بأي تحسينات لازمة.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- ولبدء الاستخراج، تحتاج إلى الضغط على أي نص أو صورة بصفحة الويب. فمثلا يمكنك تحديد عنوان مقال ما. ستقترح الأداة عليك بعض العناصر الأخرى وبجانبها علامة الصواب، بالضغط على هذه المقترحات يمكنك جعل عملية الاستخراج أكثر دقة. يمكنك أيضا تغيير اسم العنصر الذي قمت بتحديده من خلال لوحة العناصر أيسر الشاشة إلى title مثلا.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- بعد أن أصبح لديك بعض البيانات يمكنك رؤية معاينة لما ستكون عليه من خلال علامة تبويب النتائج أسفل الشاشة.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- يمكنك أيضا استخراج معلومات متعلقة بالعنصر الذي اختره من خلال الضغط على زر + الموجود يمين كل عنصر في لوحة العناصر يسار الشاشة.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- فمثلا باستخدام أمر التحديد النسبي Relative Select، اضغط على المقالة الأولى ثم اسم المؤلف لاستخراج أسماء المؤلفين الخاصة بكل مقال.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- ويمكنك تكرار الخطوتين 7 و8 لاستخراج المزيد من المعلومات مثل تاريخ النشر ووقت القراءة باستخدام أمر التحديد النسبي.
- الآن لتصدير البيانات يمكنك الضغط على زر Get Data.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- ستمنحك الأداة ثلاث اختيارات: Test Run للتشغيل الاختباري لمعرفة ما إذا كان كل شيء يسير على ما يرام، والجدولة Scheduleلجدولة عملية استخراج البيانات، وأخيراRunللتشغيل العادي.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- سيبدأ ParseHub عملية جمع البيانات وفي غضون دقيقة ستحصل على البيانات.
- بعد الانتهاء، يمكنك تنزيل البيانات في العديد من التنسيقات مثل CSV / ExcelوJSON حسبما ترغب.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- وأخيرا ستجد البيانات منظمة ونظيفة لاستخدمها بالطريقة التي تريد.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
إذن.. يمكنك البدء في استخراج البيانات من على الإنترنت واستخدامها في علوم البيانات باستخدام أداة ParseHub دون الحاجة لكتابة أي أكواد. وعلى الرغم من سهولة أداة ParseHubإلا أنها قوية للغاية وتغنيك عن كتابة برامجك الخاصة لاستخراج الملفات، كما أنها توفر واجهة تحكم برمجية تتيح لك دمج الأداة وتكاملها مع التطبيقات والخدمات الأخرى بصورة سهلة وفعالة مما يوفر وقتك وجهدك ويمنحك إمكانيات كبيرة للبدء في استخراج البيانات.


انقر هنا لقراءة الخبر من مصدره.