متاسفانه پس از انتخابات سال ۱۴۰۳، شاهد آن بودیم که برخی با حمله به علم آمار و احتمالات ادعا کردند که آمار درست نیست و باید به شکل دیگری (که البته نمیگویند به چه شکلی) با پدیدهها مواجه شد.
در این متن قصد دارم به دفاع از علم آمار بپردازم و بگویم دلیل آنکه در انتخابات، پیشبینیها از مشارکت درست از آب در نیامد، چه بوده است.
چند دلیل عمده میتوان برای مشارکت پایین در نظر گرفت. همینطور بنده در آخرین پادکست فینسوف بحثی در مورد آنکه پیام چنین عدم مشارکتی چه بوده، داشتهام. از جمله دلایل مشارکت پایین که در نظرسنجیها منعکس نشده است، عبارتاند از:
۱- عدم همزمانی انتخابات شوراها، باعث شده بود که مشارکت کاهش پیدا کند. برای بسیاری از اصناف و سندیکاها، انتخابات شوراهای شهرستان و روستا از اهمیت بالایی برخوردار است و بسیاری افراد در این انتخابات منافعی دارند. بنابراین عدم همزمانی این انتخابات باعث مشارکت پایین شده بود. بسیاری از افراد که در سال ۱۴۰۰ رای سفید به صندوق انداختند، برای مشارکت در انتخابات شوراها پای صندوق رفته بودند.
۲- عدم ایجاد دوقطبی در انتخابات باعث شده بود که بسیاری از رای دهندگان تا انتها نتوانند نامزد مورد نظر خود را پیدا کنند. بنابراین بسیاری از اقشار خاکستری نتوانستند که نامزد مورد نظر خود را پیدا کنند. تا آخرین نظرسنجی ایسپا همچنان حدود ۱۰ درصد از افراد گفته بودند که نامزد مورد نظر خود را پیدا نکردهاند.
۳- در انتخابات پیشین، از ماهها قبل کشور در حال و هوای انتخابات بود اما در این انتخابات شاهد آن بودیم که طی کمتر از چند ماه، سیستم انتخابات چیده شده و افراد برای حضور در انتخابات اقدام کردند. بنابراین کشور به درستی در حال و هوای انتخابات قرار نگرفت.
اما اینها همگی بهانه است. میتوان هزاران بهانه از این جنس ردیف کرد و گفت که به چه علت مردم کدام رفتار را انجام میدهند. حقیقت این است که بخش مهمی از مردم دیگر تغییر را از صندوق نمیدانند.
بازگردیم به آمار. در آمار بخش دیگری نیز وجود داشت که به درستی نتوانست آمار را منعکس کند و انحراف از آمار پیشین که بنده دادم نیز از همین بخش است چرا که در آماری که من محاسبه کردم، پزشکیان حدود ۱۱ میلیون رای و جلیلی و قالیباف مجموعا چیزی حدود ۱۳ میلیون رای بود. توجه داشته باشید که آمار من با توجه به انتخابات پیشین و با حذف آرای باطله و رای آقای پور محمد بود.
همینطور رای آقای پزشکیان را ۴۷ درصد و مجموع رای آقایان جلیلی و قالیباف را ۵۳ درصد پیشبینی کردم. که در واقع با حذف آرای باطله این پیشبینی تا حدودی درست از آب در آمد.
به نظر میرسد روششناسی که بنده از آن استفاده کردم، زمانی که دو نفر سبد رای مشترک دارند، به درستی کار نمیکند. آقایان جلیلی و قالیباف تا حدود زیادی سبد رای مشترک داشتند. بنابراین احتمال خروج آرا از سبد رای یک نفر و ورود آن به سبد رای دیگری وجود دارد. در مورد اینکه چگونه میتوان این مشکل را حل کرد، در حال حاضر ایدهای ندارم.
اما در مورد اینکه بزرگترین اشتباه من در کدام شهرستانها بوده است، میتوان اظهار نظر کرد. بنده در این مقایسه آرای آقای پزشکیان را در یک طرف و مجموع آراء آقای قالیباف و جلیلی را در طرف دیگر قرار میدهم. همچنین برخی از استانها هنوز آراء تفکیکی را منتشر نکرده اند. به همین خاطر آنها را از مقایسه حذف میکنم.
در طرف دیگر تنها استانهایی را بررسی میکنم که در آنها اختلاف پیشبینی با آمار واقعی بالای ۵ درصد باشد.
در حال حاضر، استانهای آذربایجان غربی، البرز، قم، هرمزگان و کردستان آرای تفکیکی خود را منتشر نکردهاند.
استانهایی که اختلاف پیشبینی آراء آقای پزشکیان با آرای واقعی وی بسیار پایین بوده به این شرح است: یزد، همدان، مازندران، لرستان، کهگیلویه و بویر احمد، بوشهر، تهران، چهارمحال و بختیاری، خراسان شمالی، فارس، زنجان، قزوین، سیستان و بلوچستان. یعنی ۱۳ استان از ۳۱ استان، به این روش به درستی پیشبینی شد. استانهایی که پیشبینی در آنها درست بود، استانهایی است که نمایندهای برای رای قومیتی نداشتند (بجز زنجان) یا رای دهندگان قومیتی در انتخابات شرکت نکردند (مانند سیستان).
بیشترین اختلاف منفی در پیشبینی متعلق به استان خراسان جنوبی بود که انتظار داشتم آقای پزشکیان ۵۴ درصد آرا را به خود اختصاص دهد در حالی که تنها ۲۷ درصد کسب کرد. همینطور در اصفهان انتظار داشتم آقای پزشکیان ۵۲ درصد رای کسب کند اما کمتر از ۳۰ درصد رای کسب کرد در حالی که آقای جلیلی در این استان کولاک کرد و بیش از ۵۵ درصد آرا را به خود اختصاص داد. آقای پزشکیان یک استان پررای دیگر را نیز از دست داد و آن استان کرمان است. در این استان انتظار داشتم که حدود ۵۰ درصد آرا به آقای پزشکیان تخصیص پیدا کند اما حدود ۳۰ درصد آرا را کسب کرد. در استان ۳ میلیون رایی خراسان رضوی نیز آقای پزشکیان بر خلاف انتظار که فکر میکردم ۳۹ درصد رای کسب کند تنها ۲۷ درصد رای کسب کرد.
بیشترین اختلاف مثبت در پیشبینیها در اردبیل بود. با توجه به سبقه اصولگرایی اردبیل، انتظار نداشتم که آقای پزشکیان بتواند در این استان نزدیک به ۸۰ درصد رای کسب کند. انتظار من برای این استان حدود ۶۰ درصد بود. در استان ایلام انتظار داشتم که اقای پزشکیان ۴۵ درصد رای کسب کند اما حدود ۶۵ درصد کسب کرد. در استان آذربایجان شرقی انتظار داشتم ۷۰ درصد رای کسب کند اما حدود ۸۰ درصد کسب کرد (احتمالا در استان پررای آذربایجان غربی نیز اختلاف مثبت بالا است) عملکرد در گلستان و کرمانشاه نیز مطلوب بوده است.
اما برویم سراغ پیشبینی سایر نهادها
در این مقایسه، من پیشبینی آراء پزشکیان را در کنار پیشبینی آراء ائتلاف آقایان جلیلی و قالیباف قرار دادم. چرا که پیشبینی واریز آراء جلیلی به سبد قالیباف (به دلیل همان سبد رای مشترک) بسیار سخت بود. با این حال، پیشبینی جداگانه هرکدام از نامزدها را با آمار واقعی تطبیق دادهام.
همانطور که میبینید و پیشتر هم گفتهام. آمار نظرسنجی ایسپا وابسته به جهاد دانشگاهی اختلاف بسیار کمی با آمار واقعی داشته است. پس از آن موسسه متا، وابسته به دانشگاه امام صادق است که بهترین عملکرد را داشته است.
مرکز پژوهشهای مجلس مطابق انتظار بدترین عملکرد را داشته است و به خوبی منعکس کننده طرحها و لوایحی است که از این مرکز خارج میشود و مامنی برای افراد غیرمتخصص شده است.
علم آمار همواره با احتمالات همراه است. ما دادهها را آماری میکنیم تا بتوانیم از آنها استفاده کرده و آینده را پیشبینی کنیم. بنده قبلا در مورد پیشبینی کردن صحبت کردهام و گفتهام که پیشبینی کردن تا چه حد ممکن و تا چه حد مطلوب است.
با این همه، برای آنکه بتوان از علم آمار و احتمالات به درستی استفاده کرد. نیاز است که روششناسی به طور مرتب به روزرسانی شود. همچنین گروه نمونه و گروه کنترل باید منعکس کننده جامعه باشد.
برای افرادی مانند ما که دادهها را بررسی میکنیم، باید توجه داشت که دادهها تنها یک سری عدد و رقم هستند. این بر عهده خود افراد است که این دادهها را به درستی بررسی و تحلیل کنند و بر اساس آن تصمیم بگیرند.
خطا در ذات دادهها و پیشبینی هاست. یک پیشبینی کننده خوب کسی است که این خطاها را میشناسد، دادهها را در بستر فکری خود برده و تحلیل میکند و هرگز به نقطه دادهها نگاه نمیکند، بلکه با تفسیر دادهها و روند آنها، آینده را میبیند.
به نظر من، دادههای فعلی اتفاقا به خوبی توانست پیشبینی کند. عدم موفقیت آقای پزشکیان و پیروزی وی در صورت انصراف قالیباف نقاطی بود که نظرسنجیها به خوبی پیشبینی کردند. (برای اینکه آقای جلیلی در صورت انصراف آقای قالیباف پیروز میشد، باید ۳ میلیون از آراء آقای قالیباف به حساب آقای جلیلی واریز میشد که این امر تقریبا غیرممکن بود.)
همینطور نظرسنجیها پیشتازی آقای جلیلی را نسبت به آقای قالیباف به خوبی پیشبینی کردند. اگرچه اختلاف را نتوانستند پیش بینی کنند که به خاطر ماهیت سبد رای مشترک بود که پیشتر توضیح دادم.
اما نظرسنجیها برخلاف انتخابات مجلس که توانسته بودند به خوبی میزان مشارکت را پیشبینی کنند، اینبار نتوانستند پیشبینی خوبی ارائه کنند که دلایل آن پیشتر ذکر شد.
به طور کلی بنده برای نظرسنجیها در این انتخابات نمره ۱۶ را ارائه میکنم و موسسه نظرسنجی ایسپا همچنان در صدر بالاترین و معتبرترین نظرسنجیها در حوزه انتخابات قرار گرفت.