القائمة الرئيسية

الصفحات

استخراج ونسخ البيانات من المواقع باستخدام PHP Web Scraping


هل أنت بحاجة إلى الحصول على بعض البيانات الموجودة على بعض المواقع الإلكترونية، ولكنك تجد صعوبة في الوصول إليها جميعًا في وقت وجيز ، لان البيانات موزعة على صفحات متفرقة على الموقع الإلكتروني، وقد لا تود أن تسقط بعض البيانات الهامة.
هل كنت على استعداد لإنفاق ساعات طويلة في فتح مئات الصفحات فقط من أجل الحصول على هذه البيانات؟ على الأرجح، أغلبنا كان مستعدًا لهذه التضحية من أجل إتمام مشروعه، حتى عثرنا على بعض الطرق او الادوات المتاحة على الإنترنت التي تقوم بهذه المهمة بدلًا منا.
من بين هذه الطرق وأقواها سكربت PHP جاهز قابل للتطوير يحتوي على برمجيات وخوارزميات تساعدك على فعل ذلك .
كما سأطرح لك سكربت قمت بتطويره حيث جمع لي ملايين من ارقام الهواتف العالمية من أحد المواقع وخزنتها ملفات على شكل على مصفوفة ثم ارسلتها الى قاعدة بيانات MYSQL .
تعريف كشط المواقع :
هى تقنية استخراج البيانات من مواقع الانترانت عن طريق برامج مبرمجة خصيصا لذلك أو أدوات مخصصة مثل برامج محاكة تصفح الاشخاص للانترانت تعمل على مستوى منخفض من بروتوكول (HTTP) نقل النص التشعبى أو دمج متصفح ويب متكامل، مثل موزيلا فايرفوكس .
شاهد الفيديو حيث اشرح لك طريقة استدعاء سكربت PHP Web Scraping لكشط صفحات الويب التي يثق فيها مئات الآلاف حول العالم من الأفراد والشركات :

تحميل Script Web Scraping
https://www.mediafire.com/file/zrmupjb0hwg4fm5/سكربت_كشط_المواقع.rar/file

يمكنك ان تستفيد من هذا السكربت الذي قمت بتطويره بعد استخدام السكربت السابق :
https://www.mediafire.com/file/qqebynymog7m3q6/GET_data_web.php.rar
ستجد برنامج باسم Web Scraping.exe قمت بتصميمه بواسطة فيجوال بيسك بجلب صفحة كل اربعة ثواني وهذه صورة البرنامج
كما شاهدت الرابط :
http://irba7ni.store/irba7ni/php/ADD/GET_data.php?v=
ثم ياتي الرقم الذي اضعه في الخانة الموالة 
16666
فيصبح الرابط
http://irba7ni.store/irba7ni/php/ADD/GET_data.php?v=16666
البرنامج يقوم باضافة 1 على 16666 كل اربعة ثواني وذلك على حسب الصفحات المطلوبة من الموقع الذي يتم استهدافه .
الملف GET_data.php مرفق مع ملفات التحميل .

هل اعجبك الموضوع :

تعليقات

التنقل السريع