مشروع Breakthrough: كيف يؤثر الناخبين على الحملة الرئاسية؟
استطلاع فريد يكشف عن آراء الأمريكيين حول المرشحين الرئاسيين، نتائج مبنية على تحليل معمق للكلمات والمشاعر. تابعوا أحدث التطورات على موقعنا خَبَرْيْن.
المنهجية وراء مشروع استطلاع الرأي "الاختراق"
إن Breakthrough هو مشروع من CNN وجامعة جورج تاون وجامعة ميشيغان وجامعة SSRS و Verasight.
في كل أسبوع، يُطلب من 1000 أمريكي مشاركة ما شاهدوه أو قرأوه أو سمعوه عن المرشحين الرئاسيين الرئيسيين بكلماتهم الخاصة. وتعتمد النتائج على عمل مماثل في الانتخابات الرئاسية لعامي 2016 و2020، وتوفر نافذة فريدة من نوعها على كيفية اختبار الناس في جميع أنحاء البلاد للحملة التاريخية لهذا العام.
بدأت المقابلات الخاصة بهذا المشروع في 21 يونيو، قبل المناظرة الرئاسية التي أجرتها شبكة CNN بين الرئيس جو بايدن والرئيس السابق دونالد ترامب، وستستمر حتى يوم الأحد التالي ليوم الانتخابات.
يتم جمع نتائج الاستطلاع عبر الإنترنت من الجمعة إلى الاثنين من كل أسبوع، باللغة الإنجليزية، من بين عينة وطنية تضم حوالي 1000 شخص بالغ أسبوعياً عبر استطلاع SSRS Opinion Panel Omnibus ولجنة Verasight التي تم التحقق منها. يتم دمج النتائج من الاستطلاعين باستخدام منهجية SSRS الهجينة لـ SSRS لمزج العينات الاحتمالية وغير الاحتمالية.
يُسأل المشاركون في الاستطلاع عن مرشحي الحزبين الرئيسيين: "ما الذي سمعته أو قرأته أو رأيته في الأيام القليلة الماضية عن دونالد ترامب، إن كان هناك أي شيء" و"ما الذي سمعته أو قرأته أو رأيته في الأيام القليلة الماضية عن كامالا هاريس إن كان هناك أي شيء؟ كما طُرح على المستجيبين نفس السؤال عن المرشح المستقل روبرت ف. كينيدي الابن. تمت إضافة السؤال حول هاريس إلى الاستطلاع في 19 يوليو، قبل وقت قصير من إعلان بايدن قراره بإنهاء حملة إعادة انتخابه. كما طُرح على المستجيبين نفس السؤال عن بايدن منذ بداية المشروع.
يتم ترتيب الأسئلة بشكل عشوائي، بحيث لا يُسأل جميع المستجيبين عن المرشحين بالترتيب نفسه. يتم ترميز الإجابات الدقيقة على هذه الأسئلة استناداً إلى المعالجة المسبقة التقليدية للنص لتحليل تردد الكلمات، ونمذجة الموضوع لتحليل الموضوع، والتعلم العميق لتحليل المشاعر. تم تطوير قاعدة البرمجة بشكل مشترك من قبل ليزا سينغ في جامعة جورجتاون مع مدخلات من فريقها البحثي والفريق التقني لمعهد البيانات الضخمة وجوش باسيك ومايكل تروغوت وسيرين بوداك في جامعة ميشيغان.
مع تقدم الحملة، قد تتغير الكلمات المرتبطة بالمواضيع الفردية، مما قد يؤدي إلى تغييرات في الموضع النسبي لتلك المواضيع في النتائج القديمة. هذه التغييرات ضرورية لكي تكون المقارنات الحالية صالحة. لتطوير المواضيع، يتم تحديد كلمات المواضيع يدويًا وإضافتها بكلمات وموضوعات يتم تحديدها باستخدام مزيج من نموذج التخصيص الكامن الضوضائي غير المشوش (NLDA) ونموذج ضوضاء المواضيع الموجهة (GTM). يتم ترميز المشاعر باستخدام RoBERTa الذي تم تدريبه مسبقًا على التغريدات الإنجليزية وضبطه باستخدام SemEva.
فريق البحث الذي يقوم بتحليل نتائج الاختراق وإدارة الاستبيان الميداني هم جينيفر أجيستا وأرييل إدواردز ليفي وإدوارد وو ودانا العبيد من شبكة سي إن إن؛ وليزا سينغ ولي باو ويانشن وانغ ومحمد أحمد من جامعة جورج تاون؛ وجوش باسيك ومايكل تراوغوت وسيرين بوداك من جامعة ميشيغان؛ وأكيلا إيفانز-بيغفورد وهوب ويلسون وكاميرون ماكفي والعديد من أعضاء فريق الأساليب المتقدمة وعلوم البيانات من SSRS؛ وبيتر ك. إينس وغريتشن ستريت، وأميليا غورانسون وجيك روتشيلد من شركة فيراسايت.