در باب پیش‌بینی‌های انتخاباتی 🔸 برای علاقمندان افکارسنجی‌ مجازی 🔹 پیش‌بینی انتخابات از امور رایج در موسسات تحلیلی و داده‌کاوی است که معمولا با استفاده از الگوریتم‌های پردازش زبان طبیعی و یادگیری عمیق از طریق تمام‌خوانی با ناظر بهره می‌گیرد. این امر در انتخابات‌هایی که دوقطبی شده و نزاع بر سر دو کاندیدای مشخص است، بهتر پاسخ می‌دهد چرا که افکار عمومی و گروه‌های مرجع به روشنی دلایل و رای خود را ابراز می‌کنند. اما در این انتخابات به واسطه شرایط واقعی کشور، نزاع اصلی بر سر میزان و چگونگی مشارکت بوده و قطبیتی میان کاندیداها شکل نگرفت. به بیان دیگر مهم‌ترین مساله عدد میزان مشارکت و آرای باطله بود. 🔹 از نظر مشارکت، دیتاک روز ۲۵ خرداد یعنی ۳ روز پیش از برگزاری انتخابات، میزان مشارکت را ۴۶.۶ پیش‌بینی کرده بود. که اگر فرایند قبلی را که در روزهای ابتدایی خرداد انجام شده بود و عدد ۳۸ درصد را نشان داده بود، برون‌یابی کنیم به عدد ۴۸.۲ می‌رسیم که بسیار نزدیک به میزان نهایی اعلامی مشارکت یعنی ۴۸.۸ است. 🔹 در میان نامزدهای محترم، دیتاک میزان رای‌آوری جناب آقای همتی را در ۶ گزارش تقریبا همواره درست پیش بینی کرده بود. به ترتیب (۸.۴ - ۷.۵ - ۸.۲ - ۸.۳ - ۶ - ۹.۵). این درحالیست که میانگین این اعداد ۷.۹۸ بوده و رای واقعی دکتر همتی ۸.۳۸ درصد اعلام شده است. دلیل این امر آن است که حامیان دکتر همتی کنشگری نسبتا روشن و واقعی‌تری را در فضای مجازی از خود به نمایش گذاشتند. 🔹 اما در مورد جبهه مقابل که دارای چندکاندیدا با هم‌پوشانی بالا بودند و تکلیف خود و افکار عمومی هم در این میان روشن نبود، و به طور ویژه در مورد جناب آقای رییسی، دیتاک میزان رای‌آوری را به ترتیب در روزهای منتهی به انتخابات (۶۴.۴ – ۶۷.۸ - ۶۴.۱ – ۶۶.۳ – ۷۶.۲ – ۷۴.۸) اعلام کرده بود. چنانچه مشخص است میانگین اعداد پیش‌بینی شده در ۴ گزارش اول عدد ۶۵.۶۵ می‌شود که با درنظر گرفتن ضریب خطای ۴ درصد، بسیار نزدیک به میزان واقعی رای آوری جناب رییسی یعنی ۶۱.۹۵ است. اما در دو روز آخر به دلیل انصراف دو کاندیدا و پیچیدگی تغییر آرای مردم، این اعداد به درستی پیش‌بینی نشد. در اینجا لازم به ذکر است فرایند پیش‌بینی برای آنکه دقت بالاتری داشته باشند معمولا مبتنی بر الگوریتم‌های با ناظر انجام می‌پذیرد و این خود هزینه و انرژی بسیار بیشتری را صرف می‌کند، اما در چنین رویدادهایی همچون انصراف دو کاندیدا که بخشی از سبد رای دیگری را دارند، علاوه بر سردرگمی حرکت‌های سازماندهی شده سایبری که البته دیتاک قدرت تشخیص آن ها را داشته است، حتی هوش انسانی هم به سختی می‌تواند از پردازش و تحلیل متن فارسی و کنش‌های کاربران، چگونگی تغییر سبد رای را تشخیص دهد، چه رسد به هوش مصنوعی. اگرچه شرکت‌ها معمولا تلاش می‌کنند با شاخص‌گذاری‌های اجتماعی، تمام محبوبیت و رای دو کاندیدای دیگر (زاکانی و جلیلی) را مستقیم برای کاندیدای باقیمانده (آقای رییسی و قاضی‌زاده) محسوب نکنند، اما باز هم در شرایط واقعی سیاست ایران مشخص شد که بسیاری از طرفداران این دو کاندیدا، اساسا به سبد رای هیچ‌یک از کاندیداها اضافه نکرده و جزو آرای باطله یا حتی عدم مشارکت‌کنندگان شده‌اند. 🔹 در مورد کسانی که از ابتدا علی‌رغم ابراز مشارکت، اما عدم تصمیم خود برای رای‌دهی به نامزدی مشخص را اعلام می‌کردند، می‌توان گفت بخش مهمی از افرادی که رای باطله به صندوق ریختند از همین گروه بوده و علیرغم نیت مشارکت با انگیزه‌های گوناگون، اما نمی‌خواستند مستقیما نامزدی را تایید کنند. باز هم دیتاک در گزارش‌های مختلف به ترتیب (۱۰.۴ - ۸.۳ - ۱۱.۲ - ۱۲.۸ - ۱۰.۷ – ۱۱) را پیش‌بینی کرده بود که میانگین آن یعنی ۱۰.۷۳ به میزان اعلام شده آرای باطله یعنی ۱۲.۸۸ نزدیک بوده و بخش مهمی از آن (بدون اضافه شدگان بعدی پس از انصراف و تغییرات آرا) را نشان داده است. 🔹 در افکارسنجی (چه مجازی و چه میدانی) همواره میزانی از ضریب خطا درنظر گرفته می‌شود. که در مورد نامزدهای دیگر یعنی جناب رضایی و قاضی‌زاده، اگرچه مساله تفاوت معنادار میان نظرات افکار عمومی در پیش از انتخابات با روز انتخابات و در واقع آرای مجازی و واقعی مطرح است که نیازمند بررسی دقیق‌تر است، اما با درنظر گرفتن ضریب خطای ۴ درصد، پیش‌بینی‌های دیتاک برای هر دو کاندیدا نزدیک به واقعیت بوده است. ✅ کانال جامع خبری، تحلیلی، آموزشی باسواد رسانه ای 👇 https://eitaa.com/joinchat/3688300608Cf61f1be155