روش ما در انتخابات پیش بینی

در این سال OZY است teaming تا با فن آوری و اطلاعات شرکت 0ptimus و خواهر خود شرکت تصمیم میز HQ که گزارش و تجزیه و تحلیل نتایج انتخابات به ارائه “پیش بینی.”

منحصر به فرد پیش بینی مدل توسعه یافته توسط 0ptimus پیش بینی با استفاده از روند تاریخی در انتخابات داده ها در برآورد پیش بینی رای به اشتراک گذاری برای هر دموکراتیک اولیه نامزد در هر حالت از این سال اولیه و حزبی تقویم و همچنین هر نامزد احتمال برنده اصلی ترین نمایندگان. پیش بینی ما چگونه شناسایی هر نامزد است که انتظار می رود به انجام در انتخابات و یا در جلسه اتاق در شب انتخابات.

پس از جمع آوری طیف گسترده ای از داده های مربوط به ریاست جمهوری اولیه و حزبی مسابقات ما برآورد دولت در سطح مدل به بررسی روابط تاریخی بین ما پیش بینیها و گذشته های اولیه و حزبی اجرای برنامه. ما پس از آن بهینه سازی مدل عملکرد و ایجاد یک گروه از بهترین و اجرای مدل برای ایجاد پیش بینی های دموکراتیک فعلی زمینه را نامزد انتخاباتی است. به خاطر پیش بینی های ما در زمان ما داده است به طور مداوم تجدید منعکس کننده دقیق ترین نمایندگی از زمان ریاست جمهوری زمینه است.

مجموعه داده ها و متغیر ها

مجموعه داده برای پروژه ما شامل تعداد قابل توجهی از متغیرهای تاریخی در ارتباط با توضیح ریاست جمهوری اولیه فرایند در دوران مدرن است. به طور کلی ما ترکیب رای گیری در دولت ملی و سطوح مختلف مالی مبارزات انتخاباتی متریک (مانند فردی سهم کل پرداخت و نامزد وام) تاییدیه از انتخاب حزب عدالت و پوشش رسانه ای و نامزدهای زندگینامه جزئیات (مانند دولت خانه).

محدوده ما مجموعه داده شامل تمام رقابتی ریاست جمهوری در انتخابات مقدماتی از سال 1992 تا به امروز به منظور جذب وسعت مدرن ریاست جمهوری مقدماتی و قفقاز در سیاسی معاصر چشم انداز است. ما داده های تاریخی نیز شامل نتایج فردی دولتی در سطح مسابقات در هر یک از این رقابتی نامزدی مبارزات. این به این معنی است که نامزدی مبارزات شامل یک رئیس جمهور فعلی (به عنوان مثال باراک اوباما unopposed مبارزات انتخاباتی سال 2012 نامزدی حزب دموکرات) در حال حذف از تجزیه و تحلیل ما از آنها نمی ارائه اطلاعات مفید برای پیش بینی و تحلیل. 2020 اطلاعات به روز شده در نورد اساس به منعکس کننده ترین تا به روز در حالت مسابقه. این به روز رسانی ها به خصوص مهم برای در نظر گرفتن تغييرات رای داده FEC گزارش و پوشش رسانه ای.

ما مالی مبارزات انتخاباتی داده ها می آید از FEC; پوشش رسانه ای از LexisNexis; تاییدیه از megyn kelly کوهن و همکاران. تکرار داده ها و دموکراسی در عمل و نظر سنجی از HuffPost ناظر انتخابات, megyn kelly, ویکیپدیا, LexisNexis, RealClearPolitics و PollingReport.

توسعه مدل

پیش بینی ما چارچوب تولید پیش بینی برای هر یک از دموکرات نامزد ریاست جمهوری در یک دولت توسط دولت اساس با پیش بینی در بعد مسابقات را تحت تاثیر قرار قبلی مسابقات هر دو به طور مستقیم (با مسابقه برنده) و غیر مستقیم (با تغییرات در نظرسنجی رسانه, پوشش, و غیره.). ما پیش بینی رای دادن سهام به جای برنده شدن احتمال به دلیل تخصیص متعهد نمایندگان در دموکراتیک اولیه جایزه مسابقه نمایندگان متناسب به جای winner-take-all قوانین. در ملی ما شبیه سازی (توضیح در زیر) سپس ما ترجمه این دولت رای پیش بینی به نماینده شمارش برای شناسایی کلی احتمال نامزد شدن حزب دموکرات نامزد.

با استفاده از مجموعه داده های معرفی شده در بالا ما زد
تکراری آزمایشات معلوم ترین اخباری ترکیبی از ویژگی های به
شامل هر یک از ما دولت توسط دولت ، این فرایند اجازه می دهد تا ما را به کشف
چگونه رابطه بین پیش بینی و نتیجه انتخابات ممکن است متفاوت باشد
در سراسر متحده است. برای مثال نسبت مالی مبارزات انتخاباتی رسید از
افراد ممکن است بیشتر اخباری در بزرگتر متحده اما کمتر اخباری در
کشورهای کوچکتر.

با استفاده از مجموعه داده ما زد ما اخباری
مدل برای هر ترکیبی از عوامل پيش بينی کننده و بهینه سازی کلی ما پیش بینی
مدل بر اساس چه هر ترکیبی از متغیرهای دقت پیش بینی
تاریخی آموزش داده است. در این
فرآیند تخمین زده ایم که میلیون ها نفر از مدل های به دقت ارزیابی
بين ما پيش بينی کننده و تاریخی نتایج انتخابات برای هر دولت است. برای جلوگیری از overfitting این
مدل ما گروه در میان مدل هایی که انجام می شود بهترین در داده های تاریخی
سپس ما ایجاد مقادیر پیش بینی شده.

این فرایند مدلسازی برای پیش بینی سهم رای در یک نامزدی مسابقه از جمله چند شرکت حزبی نامزدها به نظر می رسد متفاوت از مدل های رایج به انتخابات عمومی در ایالات متحده به دلیل وجود نامزدهای متعدد در این مسابقه که نیاز به در نظر گرفته شود.

مدل ما با بهره گیری از دو برآورد
تکنیک های برای کشف روابط بین ما پیش بینیها و انتخابات
نتایج: رگرسیون خطی و XGBoost. است که برای هر تکرار از ما
مدل در هر حالت ما برآورد یک مدل رگرسيون خطی و یک XGBoost
مدل. پس از بررسی معیارهای برای هر مدل ما وزن پیش بینی از
هر مدل برای کشف هر تکرار را پیش بینی. با به طور متوسط در سراسر این
دو الگوریتم ما می توانید اهرم سود برای هر یک بدون overfitting با استفاده از
یک مدل.

نظرسنجی

رای گیری داده ها در انتخابات ریاست جمهوری اولیه نامزدی مسابقات است که شاید مهم ترین متغیر در نظر گرفته شده توسط مدل های ما: رای گیری کمک می کند تا منعکس کننده نگرش شیفت در میان رای گیری عمومی آن قطاری از اثرات عمده تاییدیه و هزینه های کمپین و این نشان می دهد که در آن نامزدها ممکن است رتبه در هر دو دولت ملی و سطوح. ما شامل یک آرایه وسیعی از در دسترس عموم انتخابات به عنوان آنها در دسترس ساخته شده است. از نظر تاریخی داده ایم جمع آوری به عنوان بسیاری از نظرسنجی ها به عنوان ما می تواند پیدا کردن از جمله کسانی که در رای گیری پایگاه داده به عنوان به خوبی به عنوان کسانی که در رسانه های تاریخی پوشش اولیه نژادها.

از نظر داده ها برای سال 2020 دموکراتیک اولیه ما همچنان شامل نظر سنجی که در دسترس ساخته شده توسط محبوب aggregators مانند megyn kelly, RealClearPolitics, PollingReport و دیگر نظرسنجی های موجود در اخبار. این نظر سنجی شامل مشاهدات برای داوطلبانی که در حال اعلام کرد و هنوز هم به طور فعال در مبارزات انتخاباتی. ما به روز رسانی ما رای گیری اطلاعات روزانه به نگه دارید تا با ماهیت پویا از مبارزات انتخاباتی. به نمایندگی از این نظرسنجی جایگاه هر نامزد ما محاسبه هر دو به طور متوسط ملی و دولتی در سطح کشور ، این به طور متوسط وزن تاخر با همه نظرسنجی ها از ماه گذشته میان اما انتخابات از قبل دو هفته داده می شود قابل ملاحظه ای وزن بیشتری نسبت به نظرسنجی های انجام شده پیش از آن.

ملی شبیه سازی

در علاوه بر این به ما دولت توسط دولت اولیه و حزبی نتایج انتخابات پیش بینی ما با هم قرار داده ام یک شبیه ساز که برای شناسایی هر نامزد احتمال گرفتن کثرت متعهد نمایندگان ورود کنوانسیون ملی دموکرات ها در ماه ژوئیه. با استفاده از توزیع در کشور ما توسط دولت پیش بینی ما شبیه سازی 10,000 نتایج بالقوه در حالی که حسابداری برای روابط میان آمریکا و سراسر انتخابات تقویم. بیشتر ما در نظر گرفتن انواع شرایط است که بی درنگ نامزدها به رها کردن از نامزدی مسابقه به حساب کاربری بهتر برای خود پیش بینی تخصیص متعهد نمایندگان.

ملی ما شبیه سازی ادامه خواهد داد به روز شده به عنوان داده های جدید (به عنوان مثال سنجی و یا پیشنهادات) نفوذ دولت ما پیش بینی و به حالت اولیه و حزبی نتایج شروع به رول در.

tinyurlis.gdv.gdv.htu.nuclck.ruulvis.netshrtco.dehec.su

Leave a reply

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>