جوجل تطلق سلاحًا جديدًا ضد البريد الإلكتروني العشوائي والضار: RETVec. كشفت جوجل عن أداة جديدة متعددة اللغات تسمى RETVec (اختصارًا لـ Resilient and Efficient Text Vectorizer) للمساعدة في اكتشاف المحتوى الضار المحتمل مثل البريد الإلكتروني العشوائي والضار في جيمال.
وفقًا لوصف المشروع على جيتاب، فإن “RETVec تم تدريبه ليكون مرنًا ضد التلاعبات التي تحدث على مستوى الأحرف بما في ذلك الإدراج والحذف والأخطاء المطبعية والرموز المتشابهة واستبدال LEET والمزيد.”
“يتم تدريب نموذج RETVec على قمة برنامج ترميز أحرف جديد يمكنه ترميز جميع أحرف وكلمات UTF-8 بكفاءة.”
بينما تعتمد المنصات الضخمة مثل جيمال و يوتيوب على نماذج تصنيف النصوص للكشف عن هجمات التصيد والتعليقات غير اللائقة والاحتيال. يعرف عن الجهات الفاعلة في مجال التهديدات وضع استراتيجيات مضادة لتجاوز هذه التدابير الدفاعية.
وقد لوحظ أنهم يلجأون إلى التلاعب العدائي بالنصوص. والتي تتراوح من استخدام الرموز المتشابهة إلى حشو الكلمات الرئيسية إلى الأحرف غير المرئية.
يهدف RETVec. الذي يعمل بأكثر من 100 لغة بشكل جاهز. إلى المساعدة في بناء مصنفات نصوص أكثر مرونة وكفاءة على مستوى الخادم وعلى الجهاز. مع كونه أيضا أكثر قوة وأقل تكلفة حسابية.
تعتبر المتجهية منهجية في معالجة اللغة الطبيعية (NLP) لرسم الكلمات أو العبارات من المفردات إلى تمثيل رقمي مقابلة لإجراء تحليل إضافي. مثل تحليل المشاعر وتصنيف النصوص وتحديد الكيانات المسماة.
يلاحظ إيلي بورشتين ومارينا تشانغ من جوجل: “بسبب بنيته الجديدة. يعمل RETVec بشكل جاهز على كل لغة وجميع أحرف UTF-8 دون الحاجة إلى معالجة مسبقة للنص. مما يجعله المرشح المثالي للنشر على الأجهزة والويب وتصنيف النصوص واسع النطاق.”
قالت الشركة العملاقة للتكنولوجيا إن دمج المتجه في جيمال أدى إلى تحسين معدل اكتشاف البريد العشوائي بنسبة 38٪ مقارنة بقيمة الأساس وخفض معدل الإيجابيات الخاطئة بنسبة 19.4٪. كما خفض استخدام وحدة معالجة Tensor (TPU) للنموذج بنسبة 83٪.
وأضاف بورشتين وتشانغ: “تظهر النماذج المدربة باستخدام RETVec سرعة استدلال أسرع بسبب تمثيلها المضغوط. يؤدي وجود نماذج أصغر إلى تقليل التكاليف الحسابية وتقليل وقت الاستجابة. وهو أمر بالغ الأهمية للتطبيقات واسعة النطاق والنماذج على الأجهزة.”
جوجل تطلق سلاحًا جديدًا ضد البريد الإلكتروني العشوائي والضار: RETVec. تابعً على Facebook او Instagram او YouTube او X لقراءة المزيد من المحتوى الحصري الذي ننشره.