هل أنت بحاجة إلى الحصول على بعض البيانات الموجودة على بعض المواقع الإلكترونية، ولكنك تجد صعوبة في الوصول إليها جميعًا في وقت وجيز ، لان البيانات موزعة على صفحات متفرقة على الموقع الإلكتروني، وقد لا تود أن تسقط بعض البيانات الهامة.
هل كنت على استعداد لإنفاق ساعات طويلة في فتح مئات الصفحات فقط من أجل الحصول على هذه البيانات؟ على الأرجح، أغلبنا كان مستعدًا لهذه التضحية من أجل إتمام مشروعه، حتى عثرنا على بعض الطرق او الادوات المتاحة على الإنترنت التي تقوم بهذه المهمة بدلًا منا.
من بين هذه الطرق وأقواها سكربت PHP جاهز قابل للتطوير يحتوي على برمجيات وخوارزميات تساعدك على فعل ذلك .
كما سأطرح لك سكربت قمت بتطويره حيث جمع لي ملايين من ارقام الهواتف العالمية من أحد المواقع وخزنتها ملفات على شكل على مصفوفة ثم ارسلتها الى قاعدة بيانات MYSQL .
تعريف كشط المواقع :
هى تقنية استخراج البيانات من مواقع الانترانت عن طريق برامج مبرمجة خصيصا لذلك أو أدوات مخصصة مثل برامج محاكة تصفح الاشخاص للانترانت تعمل على مستوى منخفض من بروتوكول (HTTP) نقل النص التشعبى أو دمج متصفح ويب متكامل، مثل موزيلا فايرفوكس .
شاهد الفيديو حيث اشرح لك طريقة استدعاء سكربت PHP Web Scraping لكشط صفحات الويب التي يثق فيها مئات الآلاف حول العالم من الأفراد والشركات :
تحميل Script Web Scraping
https://exe.io/L1c3qy
يمكنك ان تستفيد من هذا السكربت الذي قمت بتطويره بعد استخدام السكربت السابق :
https://exe.io/eMQR8pZ4
ستجد برنامج باسم Web Scraping.exe قمت بتصميمه بواسطة فيجوال بيسك بجلب صفحة كل اربعة ثواني وهذه صورة البرنامج
http://irba7ni.store/irba7ni/php/ADD/GET_data.php?v=
ثم ياتي الرقم الذي اضعه في الخانة الموالة
16666
فيصبح الرابط
http://irba7ni.store/irba7ni/php/ADD/GET_data.php?v=16666
البرنامج يقوم باضافة 1 على 16666 كل اربعة ثواني وذلك على حسب الصفحات المطلوبة من الموقع الذي يتم استهدافه .
الملف GET_data.php مرفق مع ملفات التحميل .
تعليقات
إرسال تعليق