الأوقاف عن رفع إيجار أراضي الوزارة: قرار بالتعامل الرحيم مع أصحاب الملكيات المفتتة    محافظ القليوبية يناقش الانتهاء من إعداد المخطط التفصيلي لمنطقتي العكرشة الصناعية وأرض جمعية    أخبار كفر الشيخ اليوم.. ضبط 519 كجم سلع ولحوم غير صالحة في حملات رقابية مكثفة    خبير سياسي: لقاء السيسي وحفتر يعكس دعم مصر الكامل لسيادة ليبيا وشعبها    س & ج.. كل ما قاله سلوت عن أزمة محمد صلاح قبل قمة الإنتر ضد ليفربول    هل تتأثر مصر بزلزال أنطاليا التركية ؟.. البحوث الفلكية توضح    فيفا يمنح لاعبى المونديال راحة 3 دقائق فى كل شوط بكأس العالم 2026    قائمة شباب بيراميدز في مواجهة البنك الأهلي بكأس العاصمة    الأرصاد تحذر: أمطار رعدية تضرب مطروح وتمتد للإسكندرية والوجه البحري    إحالة المتهم بقتل زوجين فى المنوفية إلى المفتى    ضبط 2 طن سكر معاد تعبئته ناقص الوزن و420 علبة سجائر مجهولة المصدر بالقليوبية    رد صادم من إيمي سمير غانم على منتقدي إطلالتها الأخيرة    الكاتبة سناء البيسي، 65 عاما في محراب الصحافة والنسخة الأولى من جائزة التميز تحمل اسمها    كارمن سليمان تقدم دويتو جميل مع متسابق ببرنامج كاستنج.. فيديو    علاج ألم المعدة بالأعشاب والخلطات الطبيعية في زمن قياسي    ختام معسكر منتخب مصر الأول بمشروع الهدف استعدادا لأمم أفريقيا.. صور    تدشين مبادرة «ازرع نخلة» بمدارس الخارجة لتعزيز الوعى البيئى للطلاب    التحقيق مع مسن تحرش بطفلة علي سلم عقار في أوسيم    المستشارة أمل عمار تشارك في فعاليات المساهمة في بناء المستقبل للفتيات والنساء    استقالات بالجملة داخل جهاز الزمالك للكرة النسائية    افتتاح فيلم «الست» في الرياض بحضور نخبة من نجوم السينما| صور    وزير الزراعة: نقل الحيوانات أحد تحديات عملية تطوير حديقة الحيوان بالجيزة    وزير الاستثمار يبحث مع مجموعة أبو غالي موتورز خطط توطين صناعة الدراجات    تضامن الإسماعيلية يشارك في الاحتفال باليوم العالمي لذوي الإعاقة    رجعت الشتوية.. شاهد فيديوهات الأمطار فى شوارع القاهرة وأجواء الشتاء    أسرة عبدالحليم حافظ تفجر مفاجأة سارة لجمهوره    54 فيلما و6 مسابقات رسمية.. تعرف على تفاصيل الدورة السابعة لمهرجان القاهرة للفيلم القصير    إعلان أول نموذج قياسي للقرى الخضراء الذكية بجهود مشتركة بين جامعة طنطا ومحافظة الغربية    نيجيريا تتحرك عسكريا لدعم حكومة بنين بعد محاولة انقلاب فاشلة    ارتفاع مؤشرات بورصة الدار البيضاء لدى إغلاق تعاملات اليوم    الجمعية العمومية لاتحاد الدراجات تعتمد خطة تطوير شاملة    مصدر أمني ينفي مزاعم الإخوان بشأن وفاة ضابط شرطة بسبب مادة سامة    كيف تحمي الباقيات الصالحات القلب من وساوس الشيطان؟.. دينا أبو الخير تجيب    ظريف يتلاسن مع الأمين العام لمجلس التعاون الخليجي    إمام الجامع الأزهر محكمًا.. بورسعيد الدولية تختبر 73 متسابقة في حفظ القرآن للإناث الكبار    سفير اليونان يشارك احتفالات عيد سانت كاترين بمدينة جنوب سيناء    محافظ الجيزة يتابع انتظام العمل داخل مستشفى الصف المركزي ووحدة طب أسرة الفهميين    23 طالبًا وطالبة بتعليم مكة يتأهلون للمعرض المركزي إبداع 2026    إنجاز أممي جديد لمصر.. وأمل مبدي: اختيار مستحق للدكتور أشرف صبحي    لليوم الثالث على التوالي.. استمرار فعاليات التصفيات النهائية للمسابقة العالمية للقرآن الكريم    عضو مجلس الزمالك يتبرع ب400 ألف دولار لسداد مستحقات اللاعبين الأجانب    إعلان توصيات المنتدى الخامس لاتحاد رؤساء الجامعات الروسية والعربية    بعد ساعتين فقط.. عودة الخط الساخن ل «الإسعاف» وانتظام الخدمة بالمحافظات    السيدة زينب مشاركة بمسابقة بورسعيد لحفظ القرآن: سأموت خادمة لكتاب الله    حدث في بريطانيا .. إغلاق مدارس لمنع انتشار سلالة متحولة من الإنفلونزا    تعرف على طاقم حكام مباراة برشلونة وفرانكفورت في دوري أبطال أوروبا    فرقة القاهرة للعرائس المصرية تكتسح جوائز مهرجان مصر الدولي لمسرح الطفل والعرائس    إقبال الناخبين المصريين في الرياض على لجان التصويت بانتخابات الدوائر الملغاة    عاجل- الاحتلال الإسرائيلى يواصل خروقاته لوقف إطلاق النار لليوم ال59 وقصف مكثف يطال غزة    المقاولون عن أزمة محمد صلاح : أرني سلوت هو الخسران من استبعاد محمد صلاح ونرشح له الدوري السعودي    متحدث الصحة ل الشروق: الإنفلونزا تمثل 60% من الفيروسات التنفسية المنتشرة    أزمة سد النهضة.. السيسي فشل فى مواجهة إثيوبيا وضيع حقوق مصر التاريخية فى نهر النيل    الرئيس السيسي يؤكد دعم مصر الكامل لسيادة واستقرار ليبيا    رئيس الوزراء: مصر تتوسع في البرامج التي تستهدف تحقيق الأمن الغذائي    الإفتاء تؤكد جواز اقتناء التماثيل للزينة مالم يُقصد بها العبادة    ضمن مبادرة «صحّح مفاهيمك».. أوقاف الغربية تعقد ندوات علمية بالمدارس حول "نبذ التشاؤم والتحلّي بالتفاؤل"    وزير الصحة يترأس اجتماعا لمتابعة مشروع «النيل» أول مركز محاكاة طبي للتميز في مصر    هشم رأسها.. شاب يقتل والدته العجوز بآلة حادة في الشيخ زايد    







شكرا على الإبلاغ!
سيتم حجب هذه الصورة تلقائيا عندما يتم الإبلاغ عنها من طرف عدة أشخاص.



بدون كتابة أي أكواد.. استخراج البيانات من الإنترنت باستخدام أداة ParseHub

الإنترنت في الأصل هو مجموعة كبيرة من البيانات، والبيانات هي نفط القرن الواحد والعشرين. ولذلك نشهد حاليا ارتفاعا كبيرا في الطلب على علوم البيانات ومحللي البيانات. ويعد استخراج البيانات من الإنترنت أو ما يعرف ب Web Scraping أو استخلاص المواقع حجر الأساس الذي تبني عليه الشركات كل الأمور المتعلقة بكل تحليل وتصوير البيانات وبناء النماذج والتوقعات. وتعتمد الكثير من الشركات على تقنيات استخراج البيانات لجعل أعمالها أكثر ربحية من خلال بناء أدوات لاستخلاص المواقع بالاعتماد على مطورين متخصصين.
لكن مع النمو الكبير في منصات التطوير دون استخدام كود التي توفر الوقت والمال والموارد لكل من الشركات والأفراد، أصبح من الممكن لأي شخص ليس لديه خبرة في البرمجة استخراج البيانات من الإنترنت باستخدام أدوات تعتمد على واجهة رسومية بسيطة مثل:ParseHub التي تتيح للمستخدم إنشاء مهام استخراج بيانات من خلال تحديد الخطوات التي سيقوم بها مستخرج الويب مع كل عنصر داخل الصفحة على حدة، وأى البيانات التي سيتم استخراجها من هذه العناصر دون الحاجة لكتابة أي كود.
ما الأمور التي يمكن استخدام ParseHub بها؟
- عمل الأبحاث بواسطة علماء البيانات.
- استخلاص الأخبار وتسعير المنتجات والمراجعات والملفات التعريفية والوظائف وما إلى ذلك.
- استخراج بيانات عدة مواقع على الإنترنت إلى مكان واحد.
- تحليل المنافسين والتسويق واتجاهات الصناعة.
كيفية التثبيت
بداية تحتاج إلى إنشاء حساب على منصة ParseHub بشكل مجاني، حيث تتيح الخطة المجانية إنشاء حتى 5 مشروعات، واستخراج البيانات حتى 200 صفحة في كل مرة.
https://www.parsehub.com/register
بعد التسجيل يمكنك تحميل البرنامج الخاص بالمنصة من خلال صفحة التحميل: https://www.parsehub.com/quickstart ويعمل البرنامج على أنظمة ويندوز ولينكس وماك.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
طريقة الاستخدام
بعد تثبيت البرنامج وتسجيل الدخول ستتمكن من القيام بمختلف الأمور من داخل واجهة البرنامج، حيث يأتي مع متصفحه المدمج الذي سنستخدمه للدخول إلى صفحات الويب واستخراج المعلومات أيضا.
- تحتاج في البداية إلى الضغط على مشروع جديد لبدء مشروع استخراج فارغ.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- داخل علامة تبويب المتصفح قم بالبحث عن الموقع الذي تود استخراج المعلومات منه، أو يمكنك ببساطة إدخال عنوان URL في المربع العلوي الأيسر كما هو موضح في الصورة.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- اضغط على Start project on this URL وستظهر نافذة جديدة.
- تنقسم الواجهة الرئيسية لاستخراج المعلومات إلى 3 أجزاء:
- على الجانب الأيسر يمكنك التحكم في كيفية سير العمل، وإضافة وتعديل العناصر التي سيتم استخراجها من الصفحة وإعادة تسميتها.
- بينما تبويب المتصفح على الجهة اليمنى يمكنك من خلاله التفاعل وتحديد العناصر في أي صفحة ويب لاستخدامها.
- أما الجزء السفلي فيتم عرض جميع المخرجات به، حتى تتمكن من معرفة البيانات التي سيتم استخراجها بشكل مباشر والقيام بأي تحسينات لازمة.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- ولبدء الاستخراج، تحتاج إلى الضغط على أي نص أو صورة بصفحة الويب. فمثلا يمكنك تحديد عنوان مقال ما. ستقترح الأداة عليك بعض العناصر الأخرى وبجانبها علامة الصواب، بالضغط على هذه المقترحات يمكنك جعل عملية الاستخراج أكثر دقة. يمكنك أيضا تغيير اسم العنصر الذي قمت بتحديده من خلال لوحة العناصر أيسر الشاشة إلى title مثلا.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- بعد أن أصبح لديك بعض البيانات يمكنك رؤية معاينة لما ستكون عليه من خلال علامة تبويب النتائج أسفل الشاشة.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- يمكنك أيضا استخراج معلومات متعلقة بالعنصر الذي اختره من خلال الضغط على زر + الموجود يمين كل عنصر في لوحة العناصر يسار الشاشة.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- فمثلا باستخدام أمر التحديد النسبي Relative Select، اضغط على المقالة الأولى ثم اسم المؤلف لاستخراج أسماء المؤلفين الخاصة بكل مقال.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- ويمكنك تكرار الخطوتين 7 و8 لاستخراج المزيد من المعلومات مثل تاريخ النشر ووقت القراءة باستخدام أمر التحديد النسبي.
- الآن لتصدير البيانات يمكنك الضغط على زر Get Data.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- ستمنحك الأداة ثلاث اختيارات: Test Run للتشغيل الاختباري لمعرفة ما إذا كان كل شيء يسير على ما يرام، والجدولة Scheduleلجدولة عملية استخراج البيانات، وأخيراRunللتشغيل العادي.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- سيبدأ ParseHub عملية جمع البيانات وفي غضون دقيقة ستحصل على البيانات.
- بعد الانتهاء، يمكنك تنزيل البيانات في العديد من التنسيقات مثل CSV / ExcelوJSON حسبما ترغب.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
- وأخيرا ستجد البيانات منظمة ونظيفة لاستخدمها بالطريقة التي تريد.
استخراج البيانات من الإنترنت باستخدام أداة ParseHub]
إذن.. يمكنك البدء في استخراج البيانات من على الإنترنت واستخدامها في علوم البيانات باستخدام أداة ParseHub دون الحاجة لكتابة أي أكواد. وعلى الرغم من سهولة أداة ParseHubإلا أنها قوية للغاية وتغنيك عن كتابة برامجك الخاصة لاستخراج الملفات، كما أنها توفر واجهة تحكم برمجية تتيح لك دمج الأداة وتكاملها مع التطبيقات والخدمات الأخرى بصورة سهلة وفعالة مما يوفر وقتك وجهدك ويمنحك إمكانيات كبيرة للبدء في استخراج البيانات.


انقر هنا لقراءة الخبر من مصدره.