در دفاع از علم آمار: چرا نتایج انتخابات با پیش‌بینی‌ها متفاوت بود؟

متاسفانه پس از انتخابات سال ۱۴۰۳، شاهد آن بودیم که برخی با حمله به علم آمار و احتمالات ادعا کردند که آمار درست نیست و باید به شکل دیگری (که البته نمی‌گویند به چه شکلی) با پدیده‌ها مواجه شد.

در این متن قصد دارم به دفاع از علم آمار بپردازم و بگویم دلیل آنکه در انتخابات، پیش‌بینی‌ها از مشارکت درست از آب در نیامد، چه بوده است.

چند دلیل عمده می‌توان برای مشارکت پایین در نظر گرفت. همینطور بنده در آخرین پادکست فینسوف بحثی در مورد آنکه پیام چنین عدم مشارکتی چه بوده، داشته‌ام. از جمله دلایل مشارکت پایین که در نظرسنجی‌ها منعکس نشده است، عبارت‌اند از:

۱- عدم همزمانی انتخابات شوراها، باعث شده بود که مشارکت کاهش پیدا کند. برای بسیاری از اصناف و سندیکاها، انتخابات شوراهای شهرستان و روستا از اهمیت بالایی برخوردار است و بسیاری افراد در این انتخابات منافعی دارند. بنابراین عدم همزمانی این انتخابات باعث مشارکت پایین شده بود. بسیاری از افراد که در سال ۱۴۰۰ رای سفید به صندوق انداختند، برای مشارکت در انتخابات شوراها پای صندوق رفته بودند.

۲- عدم ایجاد دوقطبی در انتخابات باعث شده بود که بسیاری از رای دهندگان تا انتها نتوانند نامزد مورد نظر خود را پیدا کنند. بنابراین بسیاری از اقشار خاکستری نتوانستند که نامزد مورد نظر خود را پیدا کنند. تا آخرین نظرسنجی ایسپا همچنان حدود ۱۰ درصد از افراد گفته بودند که نامزد مورد نظر خود را پیدا نکرده‌اند.

۳- در انتخابات پیشین، از ماه‌ها قبل کشور در حال و هوای انتخابات بود اما در این انتخابات شاهد آن بودیم که طی کمتر از چند ماه، سیستم انتخابات چیده شده و افراد برای حضور در انتخابات اقدام کردند. بنابراین کشور به درستی در حال و هوای انتخابات قرار نگرفت.

اما اینها همگی بهانه است. می‌توان هزاران بهانه از این جنس ردیف کرد و گفت که به چه علت مردم کدام رفتار را انجام می‌دهند. حقیقت این است که بخش مهمی از مردم دیگر تغییر را از صندوق نمی‌دانند.

بازگردیم به آمار. در آمار بخش دیگری نیز وجود داشت که به درستی نتوانست آمار را منعکس کند و انحراف از آمار پیشین که بنده دادم نیز از همین بخش است چرا که در آماری که من محاسبه کردم، پزشکیان حدود ۱۱ میلیون رای و جلیلی و قالیباف مجموعا چیزی حدود ۱۳ میلیون رای بود. توجه داشته باشید که آمار من با توجه به انتخابات پیشین و با حذف آرای باطله و رای آقای پور محمد بود.

همینطور رای آقای پزشکیان را ۴۷ درصد و مجموع رای آقایان جلیلی و قالیباف را ۵۳ درصد پیش‌بینی کردم. که در واقع با حذف آرای باطله این پیش‌بینی تا حدودی درست از آب در آمد.

به نظر می‌رسد روش‌شناسی که بنده از آن استفاده کردم، زمانی که دو نفر سبد رای مشترک دارند، به درستی کار نمی‌کند. آقایان جلیلی و قالیباف تا حدود زیادی سبد رای مشترک داشتند. بنابراین احتمال خروج آرا از سبد رای یک نفر و ورود آن به سبد رای دیگری وجود دارد. در مورد اینکه چگونه می‌توان این مشکل را حل کرد، در حال حاضر ایده‌ای ندارم.

اما در مورد اینکه بزرگترین اشتباه من در کدام شهرستان‌ها بوده است، می‌توان اظهار نظر کرد. بنده در این مقایسه آرای آقای پزشکیان را در یک طرف و مجموع آراء آقای قالیباف و جلیلی را در طرف دیگر قرار می‌دهم. همچنین برخی از استان‌ها هنوز آراء تفکیکی را منتشر نکرده اند. به همین خاطر آنها را از مقایسه حذف می‌کنم.

در طرف دیگر تنها استان‌هایی را بررسی می‌کنم که در آنها اختلاف پیش‌بینی با‌ آمار واقعی بالای ۵ درصد باشد.

در حال حاضر، استان‌های آذربایجان غربی، البرز، قم، هرمزگان و کردستان آرای تفکیکی خود را منتشر نکرده‌اند.

استان‌هایی که اختلاف پیش‌بینی آراء آقای پزشکیان با آرای واقعی وی بسیار پایین بوده به این شرح است: یزد، همدان، مازندران، لرستان، کهگیلویه و بویر احمد، بوشهر، تهران، چهارمحال و بختیاری، خراسان شمالی، فارس، زنجان، قزوین، سیستان و بلوچستان. یعنی ۱۳ استان از ۳۱ استان، به این روش به درستی پیش‌بینی شد. استان‌هایی که پیش‌بینی در آنها درست بود، استان‌هایی است که نماینده‌ای برای رای قومیتی نداشتند (بجز زنجان) یا رای دهندگان قومیتی در انتخابات شرکت نکردند (مانند سیستان).

بیشترین اختلاف منفی در پیش‌بینی متعلق به استان خراسان جنوبی بود که انتظار داشتم آقای پزشکیان ۵۴ درصد آرا را به خود اختصاص دهد در حالی که تنها ۲۷ درصد کسب کرد. همینطور در اصفهان انتظار داشتم آقای پزشکیان ۵۲ درصد رای کسب کند اما کمتر از ۳۰ درصد رای کسب کرد در حالی که آقای جلیلی در این استان کولاک کرد و بیش از ۵۵ درصد آرا را به خود اختصاص داد. آقای پزشکیان یک استان پررای دیگر را نیز از دست داد و آن استان کرمان است. در این استان انتظار داشتم که حدود ۵۰ درصد آرا به آقای پزشکیان تخصیص پیدا کند اما حدود ۳۰ درصد آرا را کسب کرد. در استان ۳ میلیون رایی خراسان رضوی نیز آقای پزشکیان بر خلاف انتظار که فکر می‌کردم ۳۹ درصد رای کسب کند تنها ۲۷ درصد رای کسب کرد.

بدون توهم: چرا قالیباف

بیشترین اختلاف مثبت در پیش‌بینی‌ها در اردبیل بود. با توجه به سبقه اصولگرایی اردبیل، انتظار نداشتم که آقای پزشکیان بتواند در این استان نزدیک به ۸۰ درصد رای کسب کند. انتظار من برای این استان حدود ۶۰ درصد بود. در استان ایلام انتظار داشتم که اقای پزشکیان ۴۵ درصد رای کسب کند اما حدود ۶۵ درصد کسب کرد. در استان آذربایجان شرقی انتظار داشتم ۷۰ درصد رای کسب کند اما حدود ۸۰ درصد کسب کرد (احتمالا در استان پررای آذربایجان غربی نیز اختلاف مثبت بالا است) عملکرد در گلستان و کرمانشاه نیز مطلوب بوده است.

اما برویم سراغ پیش‌بینی‌ سایر نهادها

در این مقایسه، من پیش‌بینی آراء پزشکیان را در کنار پیش‌بینی آراء ائتلاف آقایان جلیلی و قالیباف قرار دادم. چرا که پیش‌بینی واریز آراء جلیلی به سبد قالیباف (به دلیل همان سبد رای مشترک) بسیار سخت بود. با این حال، پیش‌بینی جداگانه هرکدام از نامزدها را با آمار واقعی تطبیق داده‌ام.

همانطور که می‌بینید و پیشتر هم گفته‌ام. آمار نظرسنجی ایسپا وابسته به جهاد دانشگاهی اختلاف بسیار کمی با آمار واقعی داشته است. پس از آن موسسه متا، وابسته به دانشگاه امام صادق است که بهترین عملکرد را داشته است.

مرکز پژوهش‌های مجلس مطابق انتظار بدترین عملکرد را داشته است و به خوبی منعکس کننده طرح‌ها و لوایحی است که از این مرکز خارج می‌شود و مامنی برای افراد غیرمتخصص شده است.

علم آمار همواره با احتمالات همراه است. ما داده‌ها را آماری می‌کنیم تا بتوانیم از آنها استفاده کرده و آینده را پیش‌بینی کنیم. بنده قبلا در مورد پیش‌بینی کردن صحبت کرده‌ام و گفته‌ام که پیش‌بینی کردن تا چه حد ممکن و تا چه حد مطلوب است.

با این همه، برای آنکه بتوان از علم آمار و احتمالات به درستی استفاده کرد. نیاز است که روش‌شناسی به طور مرتب به روزرسانی شود. همچنین گروه نمونه و گروه کنترل باید منعکس کننده جامعه باشد.

برای افرادی مانند ما که داده‌ها را بررسی می‌کنیم، باید توجه داشت که داده‌ها تنها یک سری عدد و رقم هستند. این بر عهده خود افراد است که این داده‌ها را به درستی بررسی و تحلیل کنند و بر اساس آن تصمیم بگیرند.

خطا در ذات داده‌ها و پیش‌بینی هاست. یک پیش‌بینی کننده خوب کسی است که این خطاها را می‌شناسد، داده‌ها را در بستر فکری خود برده و تحلیل می‌کند و هرگز به نقطه داده‌ها نگاه نمی‌کند، بلکه با تفسیر داده‌ها و روند آنها، آینده را می‌بیند.

به نظر من، داده‌های فعلی اتفاقا به خوبی توانست پیش‌بینی کند. عدم موفقیت آقای پزشکیان و پیروزی وی در صورت انصراف قالیباف نقاطی بود که نظرسنجی‌ها به خوبی پیش‌بینی کردند. (برای اینکه آقای جلیلی در صورت انصراف آقای قالیباف پیروز می‌شد، باید ۳ میلیون از آراء آقای قالیباف به حساب آقای جلیلی واریز می‌شد که این امر تقریبا غیرممکن بود.)

همینطور نظرسنجی‌ها پیشتازی آقای جلیلی را نسبت به آقای قالیباف به خوبی پیش‌بینی کردند. اگرچه اختلاف را نتوانستند پیش بینی کنند که به خاطر ماهیت سبد رای مشترک بود که پیشتر توضیح دادم.

اما نظرسنجی‌ها برخلاف انتخابات مجلس که توانسته بودند به خوبی میزان مشارکت را پیش‌بینی کنند، اینبار نتوانستند پیش‌بینی خوبی ارائه کنند که دلایل آن پیشتر ذکر شد.

به طور کلی بنده برای نظرسنجی‌ها در این انتخابات نمره ۱۶ را ارائه می‌کنم و موسسه نظرسنجی ایسپا همچنان در صدر بالاترین و معتبرترین نظرسنجی‌ها در حوزه انتخابات قرار گرفت.

در دفاع از علم آمار: چرا نتایج انتخابات با پیش‌بینی‌ها متفاوت بود؟

در دفاع از علم آمار: چرا نتایج انتخابات با پیش‌بینی‌ها متفاوت بود؟

عضویت در خبرنامه !

Ahmad Sobhani

دیدگاهتان را بنویسید لغو پاسخ

ورود

ثبت نام

یافتن حساب کاربری