گنجینه آماری

رگرسیون لوجستیک Logistic regression overview

>>> استفاده از این مقاله بدون بدون ذکر منبع مجاز نمی باشد . 

 

بسم الله الرحمن الرحیم

 

مروری بر رگرسیون لوژستیک درspss  

و سایر شکل ها وحالتهای رگرسیون

 

Logistic regression overview

  

نویسنده

جهان بخش شاکر

 دانشجوی رشته ی آمار واحد نیر

 

 

 >>>  مقدمه                                                              

 

واژه رگرسیون در فرهنگ لغت به معنی بازگشت است و اغلب جهت رساندن مفهوم بازگشت به یک قدار متوسط است . در مقاله ای که در همین زمینه منتشر کرد اظهار داشت که متوسط قد پسران که دارای پدران قد بلند هستند کمتر از قد پدرانشان می باشد . به نحو مشابه متوسط قد پسران دارای پدران کوتاه قد نیز بزرگتر از قد پدرانشان می باشد . به این ترتیب گالتون پدیده بازگشت به طرف میانگین را در داده هایش مورد تأکید قرار داد (Francis Galton) . گرچه گالتون برای تأکید بر پدیده بازگشت به سمت مقدار متوسط از تحلیل رگرسیون استفاده کرد، اما به هر حال امروزه واژه تحلیل رگرسیون جهت اشاره به مطالعات مربوط به پیش بینیها بکار می رود .

در حقيقت تحليل رگرسيوني فن و تکنيکي آماري براي بررسي و مدل سازي ارتباط بين متغيرها است. که در حالت کلی ابتدا با حدس این که رابطه ای بین دو متغیر وجود دارد و سپس  به جمع اوری اطلاعات کمی از دو متغیر می پردازیم واین داده ها را در یک نمودا دو بعدی به صورت نقاط گسسته مشخص می کنیم . ودر مورد وضعیت حاصل بحث می کنیم .

اين نمودار که به آن نمودار پراکندگي گفته مي شود نقش بسيار مهمي را در تحليل هاي رگرسيوني و نمايش ارتباط بين متغيرها ايفا مي کند.

در صورتي که نمودار نشان دهنده اين باشد که داده ها تقريباً (نه لزوماً دقيق) در امتداد يک خط مستقيم پراکنده شده اند، حدس تحليل گر تأييد شده و اين ارتباط خطي به صورت زير نمايش داده مي شود :

 y = a x + b                                                    

a  شیب خط و  b عرض از مبداء

 در نمودار اولی و در نمودار دومی کمی تفاوت به چشم می خورد که آن را خطای براورد یاد می کنیم ( این خطاها که می تواند ناشی از خطای اندازه گیری و شرایط محیط و ... باشد ) .

بنابراین معادله اولیه را به صورت زیر اصلاح می کنیم .

y = ax + b + є

خطای є متغیر وابسته گفته می شود . که y  متغیر مستقل ( رگرسیونی ) است و به x یک مدل رگرسیونی گویند .

معمولا فرض میشود که خطاها یکدیگر را خنثی میکنند ، به عبارت دیگر مجموع خطا ها برابر صفر است . همچنین فرض میشود خطای موجود در یک مشاهده رابطه ای با خطاهای دیگر ندارد و در نهایت تغییرات بین خطاها ثابت در نظر گرفته میشود . این سه فرض برای ساختن یک مدل ضروری است و روشهای بسیاری برای پی بردن به وجود (یا عدم برقراری) این فرض ها وجود دارد . یکی از دلایل استفاده های نادرست از رگرسیون معمولا نادیده گرفتن  این فرض ها است که موجب استدلال های غلط خواهد شد .

پس تا اين قسمت تحليل گر مدلي مشخص را به عنوان الگويي براي داده ها معرفي کرده است. مرحله بعدي "کنترل مناسب بودن مدل" مي باشد که مدل از نظر قابل استفاده بودن و اين که تا چه حد مي تواند خوب داده ها را بيان کند بررسي مي شود و در مورد بکارگيري مدل تصميم گرفته مي شود. در نتيجه مدل يا قابل استفاده تشخيص داده مي شود و يا اينکه بايد اصلاح شود . بنابراين تحليل رگرسيوني فرآيندي همراه با تکرار و بازنگري است، يعني در ابتدا مدلي معرفي مي شود، کيفيت مدل مورد بررسي قرار میگیرد ، مدل قبول و يا اينکه مجدداً اصلاح مي شود .

 رابطه قد و وزن، رابطه عرضه و تقاضا در علم اقتصاد، تعيين رابطه بين سن افراد و فشارخون آنها، رابطه بين ميزان مطالعه دانش آموزان و سطح نمرات آنها، رابطه بين نمرات و ميزان قبولي در کنکور سراسري مثال هایی ساده در کاربرد رگرسیون  هستند .

 حال در حقیقت موضوع اصلی مبحث رگرسیون یافتن رابطه ی بین متغیر پاسخ y و

مجموعه ای از متغیر های پیشگو ماننده  X1،X2 ،... و Xk است . در واقع رگرسیون به دنبال

رابطه ای بین مشاهدات y  و مشاهدات X1،X2 ،... و Xk ماننده y = ƒ( x1,x2,…,xk )   برقرار سازد . که در حالت کلی :

 Y  = β0  + β1 X+ …+ βk X

 که ضرایب  βkو...و  β1 و  β0 معمولا با استفاده از یک نمونه و به کمک یک روش برآورد

 ماننده روش کمترین مربعات خطا براورد می شوند .

 

 >>>  رگرسیون لوژستیک                                            

 

 گاهی اوقات متغیر پاسخ دو حالته است . مثلا مرگ ( زنده ماندن یا مردن ) ابتلا به بیماری (سالمت یا بیمار شدن ) متغیرهای دو حالته هستند . از طرف دیگر متغیرهای  پیشگو که

که می توان تاثیر آنها را بر متغیر پاسخ سنجید ممکن است کمی باشند . بنابراین دیگر آن رابطه ای که در اول بود دیگر سازگار نیست . یک راه حل این مشکل آن است که طرف چپ تساوی را به یک متغیر کمی تبدیل کنیم . که این کار در سه مرحله صورت می گیرد

1)   در رابطه ی نخست عبارت pr [y = 1] را جایگزین y  می کنیم که این احتمال می تواند هر مقداری ما بین 0 و 1 را اختیار کند .

2) بجای استفاده مستقیم از احتمال (pr)  از مفهوم معادل آن یعنی نسبت بخت استفاده

                                                                                                   P

میکنیم . توجه به این که احتمال p = 0.9  را می توان به صورت 9 به 1 یا  ____ = OR

                                                                                                                                                                       P     -   1

بیان کرد . واضح است اگرP = 0  انگاه  OR=0  و اگر P =0 .5 انگاه OR=1 و اگر

P= 1 انگاه OR = + ∞ .

 

3) از OR لگاریتم طبیعی می گیریم تا محدوده ی متغیر پاسخ جدید از∞ - تا ∞ + تغیر کند . در واقع ln (0) = - ∞   و ln (1) = 0 و ln(+ ∞) = + ∞ . لازم به ذکر است

                    p

     که    (  _____ ) ln به طور خلاصه logit (p)  نامیده می شود .

                           P    -  1

 که در این حالت مدل جدید به صورت زیر خواهد بود .

                                                   Pr[y=1]                                         

B.+B1X1+…+BKXK         =     ________ )        Logit(   (2)

                                    1 – pr[y=1]

 برای براورد ضرایب مدل (2) یک نمونه ی تصادفی به اندازه ی n انتخاب می شود و برای آنها مقادیر متغیر پاسخ و متغیرهای پیشگو اندازه گیری می شود . در این حالت مشاهدات را

می توان به صورت زیر نمایش داد :

   Y1 , x11 , x21 ,…, xk1 ) )      مشاهده 1

 Y2 , x12 , x22 , … , xk2 )  )        مشاهده 2

.

.

.

  Yn , x1n , x2n , … , xkn )  )     مشاهده

 در این صورت برای مجموعه ی n  مشاهده از متغیرهای پیشگوی J  الگوی متفاوت وجود خواهد داشت که برای    j = 1,…,J ) ) j امین الگوی متغیرهای پیشگو m j  مشاهده وجود دارد و احتمال انکه j  امین الگو دارای متغیر پاسخ y = 1  باشد عبارت است از :

                                                                B.+ B1X1j+B2X2j+…+BkXkj

        e

π j = _________________________________________                                                                      (3)

                                      B.+B1X1j+B2X2j+…+BkXkj

1        + e

بنا براین لگاریتم تابع درستنمایی ضرایب B = ( B.,B1,…,BK ) به صورت زیر خواهد بود

  

  ( yj. lnj) + ( mj yj) ln(1j)    (4=  Ln L(B) = ( B)

 که در آن منظور از yj مجموع مشاهدات y   برای j  امین الگو است . برای یافتن براوردگر ماکسیمم درستنمایی که از ماکسیمم کردن (4) نسبت به B  بدست می آید بایستی دستگاه معادلات زیر را ( که در واقع k+1  معادله و k+1  مجهول است ) نسبت به B حل می کنیم :

  j

mjπj  )= 0                                         (5)  (yj  __∑

 j=1

 

  j

∑ xji(yj __  mjπj )= 0                                       (6)

 J=1

معادلات (5) و (6) با توجه به (3) نسبت به B.,B1,…, BK    غیر خطی هستند و لذا برای حل آن از روش های عددی تکراری استفاده می شود . براوردگری که به این روش برای B بدست می آید با  βˆ   نشان می دهیم .

 نکته 1 : Bi  در واقع میزان تغییرات لگاریتم نسبت بخت را نسبت به افزایش 1 واحد در عامل i ام بیان می کند .

                     Bi

نکته 2 : از روی مقدار Bi  می توان OR مربوط به عامل مورد نظر را به صورت e  بدست آورد . به عنوان مثال اگر در بررسی تاثیر مصرف سیگار (x ) بر بروز سکته ی

                                                                         B

قلبی (y ) نسبت بخت 5 = e باشد یعنی احتمال بروز سکته ی قلبی در افراد سیگاری 5 برابر افراد غیر سیگاریست .

 نکته 3 : با استفاده از فرمول براورد (2 ( با جایگذاری مقادیر پیشگو می توان مقدار متغیر پاسخ را پیشگویی کرد .

 

 

>>>  تحلیل رگرسیون لوژستیک در SPSS     

 

با توجه به فایل ingots.sav که این داده ها مربوط به اطلاعات آمادگی شمش ها برای نورد را به همراه زمان فروبردن در آب بر اساس یک نمونه ی تصادفی 387 تایی از شمش ها ارائه می کند .

که روند آنالیز رگرسیونی  این داده ها به صورت زیر است :

 از منوی  analayze >

Logistic…           Binery

در کادر باز شده متغیر Ready را به قاب Dependent و متغیرهای Heat و Soak را به قاب covariates  انتقال می دهیم سپس Ok را کیلک می کنیم .

 حال خروجی این آزمون به صورت زیر است که با توجه به P-Value = 0.03   لذا رگرسیون لوژستیک معنادار است .

 Omnibus Tests of Model Coefficients

 

 

Chi-square

df

Sig.

Step 1

Step

11.643

2

.003

Block

11.643

2

.003

Model

11.643

2

.003

ودر خروجی زیر مقادیر براورد شده برای ضرایب مربوط به هر متغیر در ستون B آورده شده است . همچنین آزمون معناداری برای هر عامل انجام شده که P-Value  مربوطه در ستون Sig. آورده شده است .

                                                                        Variables in the Equation

 

 

B

S.E.

Wald

df

Sig.

Exp(B)

Step 1(a)

Heat

.082

.024

11.945

1

.001

1.085

Soak

.057

.331

.029

1

.864

1.058

Constant

-5.559

1.120

24.650

1

.000

.004

a  Variable(s) entered on step 1: Heat, Soak.

 

با توجه به خروجی به نظر می رسد که متغیر Soak   معنادار نیست . یعنی زمان فرو بردن در آب به لحاظ آماری تاثیر معنا داری روی احتمال آمادگی شمش ها برای نورد ندارد .

بنابراین می توان تحلیل رگرسیون لوژستیک را بار دیگر بدون حضور متغیر Soak  اجرا کرد . در این خروجی مقادیر نسبت بخت در ستون Exp(B)  آورده شده است :

 Model Summary

Step

-2 Log likelihood

Cox & Snell R Square

Nagelkerke R Square

1

95.346(a)

.030

.123

a  Estimation terminated at iteration number 7 because parameter estimates changed by less than .001.

با توجه به این جدول به نظر می رسد مدل رگرسیونی ارائه شده برای این داده ها مناسب نیست چرا که طبق ملاک ( 3 در صد تغییرات توسط متغیر های پیشگو قابل بیان است ) که

در جدول زیر به خوبی دیده می شود :

                                                                     Classification Table(a,b)

 

 

Observed

Predicted

 

 

Readiness

Percentage Correct

 

 

Ready

Not Ready

Ready

Step 0

Readiness

Ready

375

0

100.0

 

 

Not Ready

12

0

.0

 

Overall Percentage

 

 

96.9

a  Constant is included in the model.

b  The cut value is .500

 

دراین جدول مشاهدات بر اساس مقادیر پیش بینی شده به وسیله ی مدل لوژستیک ( و مقدار

برش p = 0.5 ) طبقه بندی شده اند . همانطور که می بینید همه ی 12 مشاهده ی مربوط به

 شمش هایی که آماده ی نورد نیستند در این مدل به اشتباه طبقه بندی شده اند و میزان صحت

مدل 9/96 % است .

 

 

 >>>  آشنایی با رگرسیون لوژستیک – کاربردی   

 

مثال کاربردی : مقیاس APACHI II  و مرگ ناشی از عفونت

نمودار زیر مرگ و میر 30 روزه ی نمونه ای از بیماران عفونی بر مبنای مقیاس APACHI II  را نشان می دهد . بیماران بسته به این که طی 30 روز مرده اند یازنده مانده اند به ترتیب به 1 و 0 کد گذاری شده اند .

ما می خواهیم مرگ بیماران را بر اساس شاخص APACHI II   آنها پیش بینی کنیم :

فرض کنیم  (x) π  احتمال این باشد که یک بیمار با شاخص x بمیرد .

توجه کنید که رگرسیون خطی مناسب نیست چرا که احتمالی بیش از 1 یا کمتر از 0 ارائه می کند .

 انحناء S شکل خانواده منحنی های رگرسیون خطی رگرسیون لوژستیک تابع احتمال هایی به فرم زیر است :

Bx}                                Exp{α +

(x) = --------------π

                1 + Exp{ α + Bx}

 این معادله خانواده ای از منحنی های S شکل را که در زیر داده شده است ارائه می کند :

 مقادیر پارامترها وشکل منحنی رگرسیون با فرض این که B مثبت باشد .

 برای مقادیر منفی x  وقتی  x→ - ∞ آنگاه → 0 exp { α + xB} بنابراین

  0/(1+0) = 0 → (x) π  .

 و برای مقادیر خیلی بزرگ x  . ∞ → exp( α + xB}   . بنابراین

 1=(∞+1) /∞ → ((x . π

 وقتی x = - α/ß  . + ßx = 0  α لذا .π(x) = 1 (1+1) = 0.5

 شیب (x)π وقتی x = - α/ß   برابر / 4ß است . بنابراین ß سرعت تغییرات

 منحنی از 0 به 1 را کنترل می کند .

 برای یک ß ثابت ٬ α محلی که احتمال نجات و مرگ بیماران دارند ٬ باید ß بزرگی داشته باشند .

 داده ها یی که تغییرات آنها از نجات به مرگ کش دار است ٬ ß کوچکی دارند .

  احتمال مرگ تحت مدل لوژستیک این احتمال عبارت است از

 Bx}                                Exp{α +

(x) = --------------                                          π

                1 + Exp{ α + Bx}

 

بنا براین 1- π(x)  عبارتست از احتمال زنده ماندن یعنی 1/ (1 + exp{α + ßx})  .

بنابراین بخت مرگ عبارتست از

 Log(π(x)/(1- π(x))) = α + ßx → π(x)/(1- π(x)) = exp{α + ßx}

 

>>>  تابع لوجیت                                       

 

برای هر عدد π بین 0 و 1 تابع لوجیت به فرم زیر تعریف می شود :

 

Logit(π) = log (π/1- π)

 

فرض کنید di = 1   اگرi  امین بیمار بمیرد و di = 1 اگر i  امین بیمار زنده بماند و  xi  

 

شاخص APACHI II   بیمار i  ام باشد . آنگاه مقدار مورد انتظار di  برابر است با

 

E(di) = π(xi) = Pr[di = 1 ]

 

حال معادله ی رگرسیون لوژستیک را به صورت زیر می توان بازنویسی کرد :

 

Logit (E(di)) = π(xi) = α + ßxi

 

 >>>  مقایسه ی بین رگرسیون خطی و لوژستیک

 

در رگرسیون خطی ٬ مقدار مورد انتظار di  وقتی xi  داده شده باشد عبارتست از

 

E(yi) = α + ßxi                   i = 1 , …, n

 

yi   توزیع نرمال دارد با انحراف معیار σ که مولفه تصادفی مدل است α + ßxi  پیشگوی

 

خطی است

 

دررگرسیون لوژستیک ٬ مقدار مورد انتظار di وقتی xi داده شده باشد عبارتست از

 

E(di) = π(xi) = Pr[di = 1 ]

 

Logit (E(di)) = π(xi) = α + ßxi     i = 1,…,n

 

di  دو سطحی است با احتمال پیشامد πi = π(xi)   و مولفه ی تصادفی مدل است تابع لوجیت

 

یک تابع وصل است که مقدار مورد انتظار مولفه ی تصادفی را اب پیشگوی خطی مرتبط

 

می سازد .

 

 >>>  برآورد ماکزیمم درست نمایی              

 

در رگرسیون خطی ما از روش کمترین مربعات خطا برای برآورد ضرایب رگرسیون استفاده کردیم . در مدلهای خطی تعمیم یافته از شیوه ی دیگری به نام برآورد ماکزیمم درستنمایی استفاده می کنیم . برآورد ماکزیمم درستنمایی یک پارامتر مقداری است که احتمال مشاهده  نمونه  را ماکزیمم می کند .

 ما ß و α را با مقادیر βˆ و ά که احتمال مشاهده نمونه را تحت مدل رگرسیون لوژستیک ماکزیمم می کند ٬ برآورد می کنیم .

به عنوان مثال :

 

بنابراین احتمال اینکه یک بیمار عفونی با شاخص APACHI II   ٬ 20 بمیرد ٬  تقریبا 50.5

 در صد است .

 

 >>>  مقدمات رگرسیون ناپارامتری            

 

تحلیل رگرسیون ناپارامتری، رگرسون بدون فرض خطی می باشد . هدف رگرسو ن ناپارامتری پهنه وسیعی از هموار سازی می باشد که ارتباط بین دو متغیر در نمودار پرا کنش، تحلیل رگر سیون چند گانه و مدلهای رگرسیونی کلی را دربردارد. ( برای مثال رگرسیون لجستیک ناپاراتی برای یک متغیر پاسخ دو تایی )

تا چند سال پیش روشهایی از تجزیه و تحلیل رگرسیون ناپاراتی که به طور کاربردی به وسیله پیشرفت در آمار و علم حساب به عمل حساب آمده باشد، دور از ذهن به نظر می رسد و هم اکنون یک شق مهمتر از مدلسازی سنت گرای رگرسیون پارامتری می باشد. این حرکت کوتاه پهنه از مقدمه رگرسیون ناپاراتی راکه عناوین ارائه شده راپوشش می دهد تامین می کند.

معرفی رگرسیون ناپارامتری :

 معدل گیری موضعی برآورگرها ی کرنل رگرسیون ناپارامتری نیرومند،رگرسیون و هموار سازی دسته های باریک، استناج آماری برای رگرسیون ناپارامتری در تجزیه و تحلیل داده ها ، رگرسیون چند متغیر ناپارامتری به انضمام مدلهای رگرسیون افزایشی ، رگرسیون ناپارامتری تعمیم یافته و مدلهای تعمیم یافته افزایشی.

رگرسیون ناپارامتری معمولاً در فرضیات خطی آزاد می باشد و شما را به شرح داده های بصری ، ساختار غیرپوششی در داده ها که ممکن است به نحوی گمشده باشد ، قادر می سازد. بنابراین خیلی از روشهای رگرسیون ناپارامتری هنگامی که تعداد متغیر های مستقل در مدل زیاد می باشد به خوبی اجرا نمی شوند.پراکندگی داده ها در این مجموعه سبب می شود بر آوردهای واریانس به اندازه غیر قابل پذیرش بزرگ شود، مگر آنکه حجم نمونه فوق العاده بزرگ باشد. قابلیت تفسیر یکی دیگر از مسایل رگرسیون ناپارامتری است که بر پایه کرنل و هموارسازی برآورد گرهای خط  sp می باشد. اطلاعات این برآورد گرها شامل رابطه بین متغیرهای مستقل و وابسته می باشد که اغلب درک آنها دشوار است.  برای بر طرف کردن این مشکلات،استون(1985)مدلهای جمع پذیر را پیشنهاد کرد.این مدلها یک تقریب فزآینده ی تابع رگرسیون چند متغیره را  برآورد می کنند. مزایای یک تقریب فز آینده حداقل دو مورد است.اول اینکه هر کدام از اصطلاحات جمع پذیر با استفاده از یک صافی یک متغیری منحصر فرد تخمین زده می شوند. دوم اینکه ظوابط منحصر به فرد توضیح می دهند که چگونه متغیر وابسته با وجود متغیرهای مستقل برآورد می شود. 

توسعه مدل جمع پذیر به سوی یک میدان وسیع از خانواده های توزیع؛ هاستی و تیب شیرانی (1990) مدلهای جمع پذیر تعمیم یافته را پیشنهاد دادند. این مدلها قادرند میانگین متغیر وابسته را به یک دستگاه جمع پذیر از طریق یک تابع خطی ربط دهند. این مدل اجازه می دهد توزیع احتمال متغیر پاسخ هر عضو، از طریق خانوادهء نمائی باشد.

در خیلی مواردمدلهای آماری در یک دستهء خاص مورد استفاده قرار می گیرند؛ آنها مدلهای جمع پذیر برای داده های نرمال، مدلهای لجستیک ناپارامتری برای داده های دوجمله ای و مدلهای لگ خطی ناپارامتری برای داده ها ی پواسن را در بر دارند.

تحلیل رگرسیون ناپارامتری:

رگرسیون ناپارامتری فرضیات کمینه در مورد وابستگی میانگین Y بر روی X ها را درست می کند. این جریان کوتاه برآوردگرهای رگرسیون ناپارامتری را به دو صورت برای تحلیل رگرسیون ساده(یک X تنها) - - موسوم به نمدار پراگندگی هموارساز- - و تحلیل  رگرسیون چند متغیره(چندین X) معرفی می کند.

ما به طور طبیعی این برآوردگرها را، برآوردگر کرنل( میانگین وزن دار شده)، برآوردگرهای چندجمله ای(lowess) و مدلهای جمع پذیر رگرسیون ناپارامتری، توضیح می دهیم. چند ملاحظه نیز برای روشهای استنتاج آماری برای رگرسیون ناپارامتری وجود دارد، که شبیه بکار گرفته شده برای حداقل مربعات خطی می باشد.

 

یک نمونه ی کاربردی برای رگرسیون دوجمله ای منفی :

 ((كاربرد مدل رگرسيون دو جلمه اي منفي در تعيين عوامل موثر بر حاملگي ناخواسته)) مي باشد و متغير وابسته تعداد حاملگي هاي ناخواسته در نظر گرفته شده است.در آناليز رگرسيون در حالت كه متغير وابسته گسسته و نامنفي باشد، مدل رگرسيون پواسن مورد استفاده قرار مي گيرد. مدل رگرسيون پواسن به عنوان نمونه اي از مدل هاي تعميم يافته خطي است كه مدل هاي رگرسيوني را به خانواده نمايي توزيع هايي بسط مي دهد كه هر دو توزيع نرمال و پواسن را شامل مي شوند. شرط اصلي استفاده از مدل رگرسيون پواسون معادل بودن ميانگين و واريانس متغير وابسته مي باشد. وقتي كه ميانگين و واريانس داده ها به طور تقريبي برابر نباشند، مدل پواسن برآوردهاي ناصحيحي از واريانس جملات و استنباط هايي گمراه كننده درباره رگرسيون ايجاد مي كند. براي حل اين مشكل مي توان از مدل رگرسيوني دو جمله اي منفي استفاده كرد. به منظور تعيين مهمترين عوامل خطرساز در حاملگي ناخواسته در تعيين برآورد پارامترها از مدل هاي رگرسيوني پواسن و دو جلمه اي منفي استفاده شده و مقايسه اي بين آنها صورت گرفته است. از بين كليه متغيرهاي مورد بررسي، متغيرهاي سطح تحصيلات مادر، تعداد فرزندان زنده دختر، تعداد فرزندان زنده پسر و استفاده از روش پيشگيري موثر بودند و متغيرهاي سن، سطح تحصيلات پدر و آگاهي قبلي از روشهاي تنظيم خانواده از نظر آماري از مدل حذف شدند و اثرات متقابل نيز وارد مدل نشدند. آبستني / رگرسيون دو جلمه اي منفي / رگرسيون پواسون .

مراجع :

 

{1} کمیته پژوهشی دانشجویی پزشکی ٬ نشر سارا

{2} Agresti , categorical data anlysis , john wily and sons , New york .

{3} cox , d.r . and snell , E.J (1989) , Champman and Hall , londan.

{4} Hosmer , D.W, and lemeshow , s. (2000) , applied logistic regression .

 و همچنین برگرفته از رگرسیون دکتر جواد بهبودیان و برخی از سایتهای خبری بین المللی آمار

 با تشکر

+ نوشته شده در  ساعت   توسط جهانبخش شاکر  |