أخبار التقنية

يكشف تسريب كود Yandex الضخم عن عوامل الترتيب لمحرك البحث الروسي


تكبير / الشعار الروسي لـ Yandex ، أكبر محرك بحث في البلاد وشركة تكنولوجيا بها العديد من الأقسام ، داخل مقر الشركة.

SOPA Images / Getty Images

كشفت ما يقرب من 45 جيجا بايت من ملفات الكود المصدري ، التي يُزعم أنها سرقها موظف سابق ، عن الأسس العديدة لتطبيقات وخدمات عملاق التكنولوجيا الروسي Yandex. كما كشفت أيضًا عن عوامل التصنيف الرئيسية لمحرك بحث Yandex ، وهو النوع الذي لم يتم الكشف عنه في الأماكن العامة تقريبًا.

نُشرت “مصادر Yandex git” كملف تورنت في 25 يناير وتظهر الملفات التي يبدو أنها التقطت في يوليو 2022 وتعود إلى فبراير 2022. يدعي مهندس البرمجيات أرسيني شيستاكوف أنه تحقق مع موظفي Yandex الحاليين والسابقين من أن بعض المحفوظات “بالتأكيد . ” تحتوي على كود مصدر حديث لخدمات الشركة “. أخبرت شركة Yandex مدونة الأمان BleepingComputer أن” Yandex لم يتم اختراقها “وأن التسريب جاء من موظف سابق. وذكرت شركة Yandex أنها لم” ترى أي تهديد لبيانات المستخدم أو أداء النظام الأساسي “.

يعود تاريخ الملفات بشكل خاص إلى فبراير 2022 ، عندما بدأت روسيا غزوًا واسع النطاق لأوكرانيا. قال مسؤول تنفيذي سابق في Yandex لـ BleepingComputer إن التسريب كان “سياسيًا” وأشار إلى أن الموظف السابق لم يحاول بيع الكود إلى منافسي Yandex. كما لم يتم تسريب رمز مكافحة البريد العشوائي.

في حين أنه ليس من الواضح ما إذا كانت هناك آثار أمنية أو هيكلية للكشف عن شفرة مصدر Yandex ، فإن تسرب 1922 عامل ترتيب في خوارزمية بحث Yandex يؤدي بالتأكيد إلى موجات. مستشار SEO وصف مارتن ماكدونالد الاختراق على تويتر “على الأرجح الشيء الأكثر إثارة للاهتمام الذي حدث في تحسين محركات البحث منذ سنوات” (كما هو ملاحظ بواسطة Search Engine Land). في سلسلة محادثات توضح بالتفصيل بعض العوامل الأكثر بروزًا ، يقترح الباحث أليكس بوراك أن “هناك الكثير من المعلومات المفيدة لـ Google SEO أيضًا.”

يُزعم أن Yandex ، محرك البحث الذي يحتل المرتبة الرابعة من حيث الحجم ، يوظف العديد من موظفي Google السابقين. يتتبع Yandex العديد من عوامل الترتيب في Google ، والتي يمكن تحديدها في الكود الخاص بها ، وتتنافس بشدة مع Google. تقدم القسم الروسي في Google مؤخرًا بطلب للإفلاس بعد أن فقد حساباته المصرفية وخدمات الدفع. يلاحظ بوراك أن العامل الأول في قائمة Yandex لعوامل الترتيب هو “PAGE_RANK” ، والذي يبدو أنه مرتبط بالخوارزمية التأسيسية التي أنشأها مؤسسو Google.

كما هو مفصل من قبل Burax (في اثنين الخيوط) ، يفضل محرك Yandex الصفحات التي:

  • ليست قديمة جدا
  • الحصول على عدد كبير من الزيارات العضوية (الزوار الفريدون) وعدد أقل من الزيارات التي تعتمد على البحث
  • تحتوي على عدد أقل من الأرقام والشرطات في عنوان URL الخاص بهم
  • لديك كود محسن بدلاً من “تشاؤم صعب” مع “PR = 0”
  • مستضافة على خوادم موثوقة
  • يحدث أن تكون صفحات ويكيبيديا أو مرتبطة من ويكيبيديا
  • مستضافة أو مرتبطة من صفحات ذات مستوى أعلى في مجال
  • تحتوي على كلمات رئيسية في عنوان URL الخاص بها (ما يصل إلى ثلاثة)

يمكنك البحث والنقر فوق جميع العوامل في أداة البحث المجمعة الخاصة بـ Rob Ousbey. قد تلاحظ أن ما يقرب من 1000 من عوامل الترتيب لها العلامة “TG_DEPRECATED” ، وأكثر من 200 تم إدراجها على أنها “TG_UNUSED”. نظرًا لأن الرمز من فبراير 2022 وتم الحصول عليه في يوليو 2022 ، فقد تغير بحث Yandex بالتأكيد منذ ذلك الحين. لكن التسريب يقدم نظرة نادرة على كيفية تجميع تصنيفات البحث في موقع يخدم إحدى أكبر دول العالم.

سبق لشركة Yandex أن شهدت خروج كود محرك البحث الخاص بها في عام 2015 ، عندما حاول موظف سابق بيعه في السوق السوداء مقابل 28 ألف دولار لتمويل شركته الخاصة. يشير الرقم المنخفض بشكل مفاجئ للرمز الأساسي لمنتج Yandex الرئيسي إلى أنه لم يكن على دراية بقيمته الحقيقية. حُكم على هذا الموظف بالوقف عن العمل لمدة عامين في السجن ، ولم يُعرض القانون على الملأ.



مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى