✋
در باب پیشبینیهای انتخاباتی
🔸 برای علاقمندان افکارسنجی مجازی
🔹 پیشبینی انتخابات از امور رایج در موسسات تحلیلی و دادهکاوی است که معمولا با استفاده از الگوریتمهای پردازش زبان طبیعی و یادگیری عمیق از طریق تمامخوانی با ناظر بهره میگیرد. این امر در انتخاباتهایی که دوقطبی شده و نزاع بر سر دو کاندیدای مشخص است، بهتر پاسخ میدهد چرا که افکار عمومی و گروههای مرجع به روشنی دلایل و رای خود را ابراز میکنند. اما در این انتخابات به واسطه شرایط واقعی کشور، نزاع اصلی بر سر میزان و چگونگی مشارکت بوده و قطبیتی میان کاندیداها شکل نگرفت. به بیان دیگر مهمترین مساله عدد میزان مشارکت و آرای باطله بود.
🔹 از نظر مشارکت، دیتاک روز ۲۵ خرداد یعنی ۳ روز پیش از برگزاری انتخابات، میزان مشارکت را ۴۶.۶ پیشبینی کرده بود. که اگر فرایند قبلی را که در روزهای ابتدایی خرداد انجام شده بود و عدد ۳۸ درصد را نشان داده بود، برونیابی کنیم به عدد ۴۸.۲ میرسیم که بسیار نزدیک به میزان نهایی اعلامی مشارکت یعنی ۴۸.۸ است.
🔹
در میان نامزدهای محترم، دیتاک میزان رایآوری جناب آقای همتی را در ۶ گزارش تقریبا همواره درست پیش بینی کرده بود. به ترتیب (۸.۴ - ۷.۵ - ۸.۲ - ۸.۳ - ۶ - ۹.۵). این درحالیست که میانگین این اعداد ۷.۹۸ بوده و رای واقعی دکتر همتی ۸.۳۸ درصد اعلام شده است. دلیل این امر آن است که حامیان دکتر همتی کنشگری نسبتا روشن و واقعیتری را در فضای مجازی از خود به نمایش گذاشتند.
🔹 اما در مورد جبهه مقابل که دارای چندکاندیدا با همپوشانی بالا بودند و تکلیف خود و افکار عمومی هم در این میان روشن نبود، و به طور ویژه در مورد جناب آقای رییسی، دیتاک میزان رایآوری را به ترتیب در روزهای منتهی به انتخابات (۶۴.۴ – ۶۷.۸ - ۶۴.۱ – ۶۶.۳ – ۷۶.۲ – ۷۴.۸) اعلام کرده بود. چنانچه مشخص است میانگین اعداد پیشبینی شده در ۴ گزارش اول عدد ۶۵.۶۵ میشود که با درنظر گرفتن ضریب خطای ۴ درصد، بسیار نزدیک به میزان واقعی رای آوری جناب رییسی یعنی ۶۱.۹۵ است. اما در دو روز آخر به دلیل انصراف دو کاندیدا و پیچیدگی تغییر آرای مردم، این اعداد به درستی پیشبینی نشد. در اینجا لازم به ذکر است فرایند پیشبینی برای آنکه دقت بالاتری داشته باشند معمولا مبتنی بر الگوریتمهای با ناظر انجام میپذیرد و این خود هزینه و انرژی بسیار بیشتری را صرف میکند، اما در چنین رویدادهایی همچون انصراف دو کاندیدا که بخشی از سبد رای دیگری را دارند، علاوه بر سردرگمی حرکتهای سازماندهی شده سایبری که البته دیتاک قدرت تشخیص آن ها را داشته است، حتی هوش انسانی هم به سختی میتواند از پردازش و تحلیل متن فارسی و کنشهای کاربران، چگونگی تغییر سبد رای را تشخیص دهد، چه رسد به هوش مصنوعی. اگرچه شرکتها معمولا تلاش میکنند با شاخصگذاریهای اجتماعی، تمام محبوبیت و رای دو کاندیدای دیگر (زاکانی و جلیلی) را مستقیم برای کاندیدای باقیمانده (آقای رییسی و قاضیزاده) محسوب نکنند، اما باز هم در شرایط واقعی سیاست ایران مشخص شد که بسیاری از طرفداران این دو کاندیدا، اساسا به سبد رای هیچیک از کاندیداها اضافه نکرده و جزو آرای باطله یا حتی عدم مشارکتکنندگان شدهاند.
🔹
در مورد کسانی که از ابتدا علیرغم ابراز مشارکت، اما عدم تصمیم خود برای رایدهی به نامزدی مشخص را اعلام میکردند، میتوان گفت بخش مهمی از افرادی که رای باطله به صندوق ریختند از همین گروه بوده و علیرغم نیت مشارکت با انگیزههای گوناگون، اما نمیخواستند مستقیما نامزدی را تایید کنند. باز هم دیتاک در گزارشهای مختلف به ترتیب (۱۰.۴ - ۸.۳ - ۱۱.۲ - ۱۲.۸ - ۱۰.۷ – ۱۱) را پیشبینی کرده بود که میانگین آن یعنی ۱۰.۷۳ به میزان اعلام شده آرای باطله یعنی ۱۲.۸۸ نزدیک بوده و بخش مهمی از آن (بدون اضافه شدگان بعدی پس از انصراف و تغییرات آرا) را نشان داده است.
🔹 در افکارسنجی (چه مجازی و چه میدانی) همواره میزانی از ضریب خطا درنظر گرفته میشود. که در مورد نامزدهای دیگر یعنی جناب رضایی و قاضیزاده، اگرچه مساله تفاوت معنادار میان نظرات افکار عمومی در پیش از انتخابات با روز انتخابات و در واقع آرای مجازی و واقعی مطرح است که نیازمند بررسی دقیقتر است، اما با درنظر گرفتن ضریب خطای ۴ درصد، پیشبینیهای دیتاک برای هر دو کاندیدا نزدیک به واقعیت بوده است.
✅
کانال جامع خبری، تحلیلی، آموزشی باسواد رسانه ای
👇
https://eitaa.com/joinchat/3688300608Cf61f1be155