مقایسه میانگین‌ها

آزمونهای دونمونه ای

درمطالعات تجربی، شبه تجربی که درآنهاعملکرد متغیر موردمطالعه درشرایط متفاوت باهم مقایه میشوندطبیعت پرسش درمورد معنی دار بودن تفاوت درمیانگین، پیش میآید. درچنین شرایطی به ندرت پرسش درموردطبیعت اطلاعات مطرح میشود. چرا که درمطالعات تجربی واقعی دادهها معمولاً حالت کلی به خود میگیرند. فرض کنید دریک مطالعه ساده تجربی درمورد یک داردکارایی آن دردوحالت متفاوت (گروه آزمایش و گروه شاهد) اندازه گیری شده است. میانگینهاممکن استبه طورقابل توجهی با هم تفاوت داشته باشند. آیا اگر مطالعه مجدداً تکرار شود. تفاوتهای مشابهی به وقت میآید؟ اینجاست که یک محقق میخواهد معنی دار بودن آماری تفاوت میانگینهابین دو گروه، آزمایش و شاهد را آزمایش کند.

روشهای پارامتری

در بیشتر مدلهایی که برای شیوههای استنباطی موردبحث قرارمیگیرد به طورتجربی ساختار معینی را دربارة توزیع جامعه فرض میکنند، رفتار آزمونها همه برمبنای این فرضا هستند که اندازههای پاسخ، نمونههایی از جامعههای نرمال تشکیل میدهند. این شیوهها برای ساختن استنباطهایی دربارة مقادیر پارامترهای طرحریزی شده اند که وقتی مجاز به استفاده از منحنی جامعه نرمال هستیم به کار میروند. به طورکلی، اینها را شیوههای استنباط پارامترهای نظریه نرمال مینامند.


نمونههای مستقل (واریانس نامعلوم)

وقتی هدف انجام مقایسه ای بین دوجامعه یا دو گروه است وضعیتی را بررسی میکنیم که درآن دادههابه شکل نمونههای تصادفی به حجم  از جامعه 1 و به حجم  از جامعه 2 تحقق یافتهاند.

از جامعه 1                                 

از جامعه 2                          

فرضهای کوچک نمونه ای

1)  نمونه ای تصادفی از  است.

2)  نمونهن ای تصادفی از  است.

3)  مستقل اند.

فرض آزمون:

             

آماره آزمون:

                               

فرض مقابل:

ناحیه رد در سطح معنی داری :

برمنظورمقایسه دربرنامه جهت آموزش کارگران صنعتی برای انجام کاری تخصصی 20کارگردرآزمایش شرکت داده میشوند. از بین آنهابه طورتصادفی 10نفر را برای آموزش به وسیله روش 1و10نفر بقیه را با روش 2 آموزش میدهند. بعدازتکمیل دورة آموزش همه کارگران درمعرض یک آزمون زمان و حرکت قرارمیگیرند که سرعت انجام یک کارتخصصی را ثبت میکند. دادههای زیر به دست آمده اند:

24

27

16

18

21

16

23

11

20

15

روش 1

28

25

26

28

17

23

19

12

31

23

روش 2

وقتی که هردوحجم نمونه ای  بزرگتر از25 یا 30 باشند لازم نیست که فرض کنیم توزیع جامعههای مادر، نرمال هستند زیرا قضیه حدمرکزی تضمین میدهد که تقریباً به صورت  تقریباً به صورت توزیع شدهاند.

شیوه تصادفی کردن برای مقایسه در گروه

از  واحد آزمایش موجود  واحد را برای دریافت گروه 1 به طورتصادفی برگزینید و بقیه  واحد را به گروه 2 نسبت دهید انتخاف تصادفی موجب میشود که تمام  گزینش ممکن برای انتخاب شدن همشانس باشند.

در روش آزمایش فرضیههای عنوان شده نتوان فرض کرد که واریانسهای دو جامعه برابرند  آنگاه روش آزمون فوق باید اصلاح گردد. در این صورت آماره آزمون به صورت زیر خواهد بود.

و درجه آزادی برای t برابرخواهد بود با:

نمونههای مستقل با واریانس معلوم

دوجامعه با میانگینهای نامعلوم  و واریانسهای معلوم  را درنظر گیرید.

فرض آزمون:


آماره آزمون:

فرض مقابل:

ناحیه رد درسطح معنی داری :

نمونههای وابسته:

درمقایسه دو عامل مطلوب آن است که واحدهای آزمایش تا جایی که ممکن است همگن باشند، به طوری که اختلاف در پاسخهای بین دو گروه را بتوان به اختلافهای دو عامل نسبت داد. اگر بعضی شرایط قابل شناسایی که میتوانند در پاسخ اثر کنند به طریقی کنترل نشده، مجاز به تغییر روی واحدها باشند آنگاه تغییرپذیری زیادی در اندازهها به وجود میآید. دراین حالت اغلب مبنایی برای جفت کردن ارقام در دو نمونه وجود دارد. از طرف دیگر شرط همگنی ممکن است روی تعداد آزمودنیهای موجود در یک آزمایش مقایسهای محدودیتی جدی را تحمیل کند. برای فراهم کردن سازش بین دو ضرورت مغایر همگن و تنوع واحدهای آزمایش مفهوم جورکردن یا بلوکبندی موضوعی بنیادی است. این شیوهن شامل انتخاب واحدها در گروهها یا بلوکهاست به طوری که واحدهای هربلوک همگن بوده و واحدهای بلوکهای مختلف متفاوت باشند. این روش کارایی مقایسهای درون هربلوک را حفظ میکند و متفاوت بودن شرایط در بلوکهای مختلف را نیز اجازه میدهد. این طرح نمونهگیری به وسیلة زوجهای جور شده یا مقایسه زوجی نامیده میشود.

مقایسه زوجی:

واحدهای آزمایش               زوج

1        2                           1                 واحدها در هر زوج شبیه هستند

2        1                           2                 واحدهای زوجهای مختلف ممکن است 

                                                          بیشباهت باشند

1        2                           n                

ساختار دادهها برای یک مقایسه زوجی

تقاضل                              تیمار2                    تیمار1                    زوج

زوجهای  مستقل هستند.

چون تفاضلهای  از اثرهای بلوکی آزاد شدهاند معقول است که فرض کنیم آنها تشکیل نمونهای تصادفی از جامعهای با میانگین  و واریانس  را میدهند.

آزمون  مبتنی برآمارة آزمون زیر است.

               ,                 

مثال: ادعا شده است که یک برنامه ایمنی صنعتی که کاهش تضییع ساعات کار ناشی از نقص در ماشینهای کارخانه موثر است. دادههای زیر مربوط به ضایع شدن ساعتهای کار هفتگی به واسطه نقض در 6دستگاه است که قبل و دیگری بعد از اجرای برنامه ایمنی جمعآوری شدهاند.

دستگاه

6

5

4

3

2

1

15

28

37

16

29

12

قبل

16

25

35

17

28

10

بعد

1-

3

2

1-

1

2

d=(x-y)

ناحیه رو فرض                                                            

باتوجه به اینکه  فرض صفر رد نمیشود بنابراین میتوان نتیجه گرفت که برنامه ایمنی صنعتی در کاهش تضییع ساعات کار ناشی از نقص در ماشینهای کارخانه بیتأثیر است.

روشهای ناپارامتری

آمار ناپارامتری بخش اساسی از شیوه های استنباطی است که تحت دامنة وسیعتری از شکلهای توزیع جامعه معتبر است. اصطلاح استنباطی ناپارامتری از این واقعیت نتیجه میشود که کاربرد این شیوهها به مدلبندی جامعه برحسب یک شکل پارامتری معین منحنیهای چگالی، مثل توزیعهای نرمال، نیازی ندارد. در آزمون فرضها آمارههای آزمون ناپارامتری نوعاً بعضی جنبه های سادة دادههای نمونه را موارد استفاده قرارمیدهند مثل علامتهای اندازهها، رابطههای ترتیب، یا فراوانیهای دستهای، این طرحهای کلی، وجود یک مقیاس عددی معنیدار را برای اندازهها لازم ندارد. به طور مستمر بزرگ یا کوچک بودن مقیاس در آنها تغییری نمیدهد.


نمونههای مستقل:

برای مطالعه مقایسه دو تیمار B , A مجموعه ای از  واحد آزمایشی به طور تصادفی به دو گروه بترتیب با حجمهای  تقسیم میشوند. تیمار A در  و تیمار B در  واحد به کار میرود. اندازههای پاسخ، که مختصری متفاوت با نمادگذاری قبل نوشته میشوند عبارتاند از:

این دو گروه تشکیل نمونههای تصادفی مستقل از دوجامعه را میدهند. با فرض اینکه پاسخهای بزرگتر نمایشگر یک تیمار بهترند مایلیم این فرض صفر را که بین دو اثر تیمار اختلافی وجود ندارد در برابر فرض مقابل یک طرفهای که تیمار A موثرتر از تیمار B است آزمون کنیم.

مدل: هر دو توزیع پیوستهاند.

فرضها:

آزمون مجموع رتبهای و شکل و یلکاکسن

فرض کنید  بترتیب نمونههای تصادفی مستقل از جامعههای پیوسته A و B باشند، برای آزمون : جامعه‌‌ها یکی هستند.

1)  مشاهده نمونه ترکیبی را به ترتیب افزایش مقدار رتبهبندی کنید.

2) برای نمونه اول مجموع رتبهای  را پیدا کنید.

3) الف: برای : جامعه A به سمت راست جامعه B انتقال یافته است؛ ناحیه رد را در دنباله بالایی      

   قراردهید.

   ب: برای : جامعه A به سمت چپ جامعه B انتقال یافته است؛ ناحیه رد را در دنباله پایین  

   قراردهید.

   ج: برای : جامعهها مختلفاند؛ ناحیة رد را در هردو دنباله  با احتمالهای برابر قراردهید.

آماره آزمون مجموع رتبهای و یلکاکسن

وقتی که حجمهای نمونهای برابرند، مجموع رتبههای یکی از نمونهها را بگیرید.

جدول ……… ضمائیم احتمالهای دنبالة بالایی و هم چنین دنبالة پایینی را میدهد.

احتمال دنباله بالایی:

احتمال دنباله پایینی:

اگر  بیان کنید که جامعة متناظر با :

الف) به سمت راست جامعه دیگر انتقال یافته است؛ ناحیه رد را به صورت  اختیار کنید و C را به عنوان کوچکترین مقدار x بگیرید که برای آن  

ب) به سمت چپ یا به سمت راست جامعه دیگر انتقال یافته است؛ ناحیه رد را به صورت  بگیرید و  را از ستون x* و C2 را از ستون x به دست آورید به طوری که  

مثال: دو لایه از زمین ازنظر فنی بودن محتوای موادمعدنی آنها مقایسه میشوند. محتوای موادمعدنی هفت نمونه سنگ معدن جمعآوری شده از لایة 1 و پنج نمونه جمعآوری شده از لایه 2 به وسیله تجزیه و تحلیل شیمیایی اندازهگیری شدهاند داده زیر به دست آمدهاند.

1/15

1/6

4/9

8/9

8/6

1/11

6/7

لایه 1

9/3

7/3

1/4

4/6

7/4

لایه 2

آیا محتوای مودمعدنی لایة 1 بیشتر از لایة 2 است؟

1/15

1/11

8/9

6/7

8/6

4/6

1/6

9/4

7/4

1/4

9/3

7/3

مقادیر ترکیبی مرتب

13

12

11

10

9

7

6

5

4

3

2

1

رتبهها

مقدار مشاهده شده آمارة مجموع رتبهای عبارت است از:

با استخراج از جدول .. وقتی حجم نمونه کوچکتر مساوی 5 و حجم نمونه بزرگتر مساوی 7 است به دست میآوریم.

(فرض مقابل جامعه دوم متناظر با  در سمت چپ جامع اول قراردارد).


تقریب بزرگ نمونهای:

وقتی که حجمهای نمونهای بزرگ باشند توزیع صفر آماره مجموع رتبهای تقریباً نرمال است و بنابراین آزمون را میتوان با استفاده از جدول نرمال اجرا کرد.

تحت              میانگین  

                          واریانس  

تقریب بزرگ نمونهای برای آماره مجموع رتبهای و یلکاسن:

وقتی  درست است توزیع  تقریبا N(0,1) است.

نمونههای وابسته:

مقایسههای خروجی

ساختار دادههای نمونهگیری زوجی

N                     ………..                             2

1                                 زوج

x1n                   .……….                             x12

x2n                  ………..                              x22

x11                              تیمار A

x21                              تیمار B

Dn                   ……….                               D2

D1                               تفاضل

(A-B)


آزمون رتبة علامتدار و یلکاکسن

در آزمون رتبة علامت دارد تفاضلهای زوجی برطبق مقادیر عددیشان بدون توجه به علامته مرتب میشوند و سپس برای تشکیل آماره آزمون، رتبههای مربوط به مشاهدات مثبت جمع میشوند.

مراحل آزمون رتبة علامت‌دار:

الف) تفاضلهای  ،  را محاسبه کنید.

ب) با مرتب کردن مقادیر مطالق ها به ترتیب افزایش، رتبهها را به آنها نسبت دهید، همچنین علامتهای متناظر را ثبت کنید.

ج) آماره رتبة علامتدار ، مجموع رتبههای تفاضلهای مثبت ، را محاسبه نمایید.

د) برحسب اینکه تیمار A ، تحت فرصض مقابل، بیان میکند که دارای پاسخ بالاتر، یا پائینتر ویا متفاوت از تیمار B است ناحیه رد را در دنباله بالایی یا پایینی و یا در هردو دنبالة  قراردهید.

مثال:

برای مقایسه یک شمع جدید ماشین درمقابل یک شمع معمولی به وسیله اندازهگیری مسافت طی شده برحسب کیلومتر یک نمونه متشکل از 12 ماشین، از ماشینهای کوچک گرفته تا ماشینهای بزرگ در این مطالعه آمدهاند مسافت طی شده با مقدار معینی از بنزین برای هرماشین، یک بار با شمع معمولی و بار دیگر با شمع جدید، ثبت میشوند نتایج درجدول زیر داده شدهاند.

12

11

10

9

8

7

6

5

4

3

2

1

شماره ماشین

4/9

6/8

3/27

5/25

6/12

6/11

9/12

1/13

1/30

6/28

1/22

4/22

3/8

9/7

5/32

5/30

5/16

2/17

8/15

9/16

3/10

8/9

4/26

3/24

A جدید

B معدلی

8/0

8/1

1

2/0-

5/1

3/0-

4/0

2

7/0-

1/1-

5/0

1/2

تفاضل

(A-B)

ما مرتب کردن این تفاضلها بر ترتیب افزایش مقادیر مطلقشان به آنها رتبهها را نسبت میدهیم و علامتهای متناظر را ثبت میکنی، آماره رتبة علامتدار  به صورت زیر محاسبه میشود:

مجموع رتبههای مربوطه به تفاضلهای مثبت

½

12

2

11

8/1

10

5/1

9

1/1

8

1

7

8/0

6

7/0

5

5/0

4

4/0

3

3/0

2

2/0

1

مقادیرمطلق مرتب شده رتبهها

+

+

+

+

-

+

+

-

+

+

-

-

غلامتها

احتمالهای دنباله انتخاب شدة توزیع صفر  در جدول …… برای 3=n تا 15=n داده شدهاند. دراین جدول مقدار مشاهده شده  را برابر با 62 (برای 12=n) به دست میآوریم  بنابراین فرض صفر در سطح معنیدار بودن  رد میشود که برافزایش معنیداری درطول مسافت برحسب کیلومتر با استفاده از نوع جدید شمع دلالت دارد.

درمحاسبه آماره رتبة علامتدار، هم رتبهها به دو طریق ممکن است رخ دهند. بعضی از تفاضلهای Di ممکن است صفر باشند یا بعضی از تفاضلهای غیرصفر Di ممکن است دارای قدرمطلق برابر باشند. نوع اول همرتبه را با حذف مقادیر صفر و اصلاح همزمان حجم نمونه با تقلیل آن به مقدار تعداد صفر n=n- رفع و رجوع میکند. نوع دوم همرتبه را به نسبت دادن رتبة متوسط به هرمشاهده دریک گروه مشاهدات همرتبه با تفاضلهای غیرصفر Di درمحاسبات وارد میکنند. تقریب بزرگ نمونهای برای آماره رتبة علامتدار:

با افزایش حجم نمونهای n تحت فرض صفر، متغیر

تقریباً دارای توزیع نرمال با میانگین صفر و واریانس 1 میباشد.

درمواقع وجود همرتبه

تعداد عناصر در j امین گروه همرتبه= qI

تعداد گروههای همرتبه= Ls

آزمونهای تک نمونهای

فرض کنید x یک متغایر تصادفی با میانگین و واریانس نامعلوم  دراین صورت برای تعیین  میتوان از استفاده کرد.

آماره آزمون:                  

فرض مقابل:

                       

                       

                       

مقایسه واریانسها:

حال به بررسی آزمون فرضیه در مورد واریانس توزیع نرمال میپردازیم. فرض کنید میخواهیم ببینیم که آیا واریانس یک توزیع نرمال برابر با مقدار ثابتی نظیر  است یا خیر در این صورت فرضیههای موردنیاز عبارتند از:

آماره آزمون برای این فرضیه به صورت زیر است.

اگر  و یا  باشد فرضیه خنثی رد میشود. مقادیر مربعکای از جدول توزیت مربعکای با درجه آزادی  تعیین میشوند.

حال آزمون تساوی واریانسهای دوجامعه نرمال را درنظر گیرید. اگر نمونههای تصادفی  به ترتیب از جامعههای 1و2 انتخاب شوند آنگاه آماره آزمون برای فرضیه زیر:

نسبت واریانسهای دو نمونه خواهد بود.

مقایسه دو نسبت دوجملهای:

اکنون به استنباطهای آماری مربوط به مقایسة بین نرخهای وقوع یک مشخصه در دو جامعه میپردازیم. نسبت نامعلوم عناصری که مشخصه مخصوصی را در جامعه 1 و جامعه 2 دارند به ترتیب به وسیلة  نشان میدهیم. نمونهای تصادفی به حجم  از جامعه 1 میگیریم و تعداد موفقیها را به وسیلة X نشان میدهیم. نمونهای تصادفی مستقل به حجم  از جامعه 2 انتخاب میکنیم و تعداد موفقیتها را به وسیلة  نشان میدهیم.

پارامتر: (نسبت در جامعه 2) – (نسبت در جامعه 1)= 

نسبتهای نمونه:

                                   و      

برای آزمون فرض صفر  نسبت نامعین جامعه مشترک را به وسیلة P نشان میدهیم.

آمارة آزمون:

                                     

z تحت شرط فرض  تقریباً N(0,1) است. برای حجمهای نمونهای بزرگ  

فرض مقابل:                                               ناحیه رد در سطح معنیداری

مثال:در فرآیند متفاوت آهنگری برای تولید قطعاتی که در بالا یک نوع هواپیما کاربرد دارند استفاده میشود از 200قطعه آهنگری شده به وسیلة فرآیند 1 تعداد 10قطعه با مشخصات موردنیاز برای استحکام تطابق ندارد در حالیکه از 300قطعه آهنگری شده به وسیلة فرایند 2تعداد 20قطعه فاقد مشخصات لازم هستند آیا میتوان نتیجه گرفت که نسبت قطعات آهنگری شده معیوب از دو فرآیند مساوی هستند؟

                                           

                                     

باتوجه به z بدست آمده  بنابراین میتوان نیتجه گرفت که نسبت قطعات آهنگری شده معیوب از دو فرآیند مساوی هستند.

دریک نمونه تصادفی که شامل 500میله فلزی است 65معیوب مشاهده شده است آیا میتوان نتیجه گرفت که  است.

                                     

                                     

                  

                                

                                                                                                                                                                  

                           

                                                            

فرض  رد میشود اگر  باشد. بنابراین میتوان نیتجه گرفت که  است.

تعداد نقطهای که در بطریهای شیشهای ظاهر میگردند از توزیع پواسون پیروی میکنند دریک نمونه تصادفی که شامل 100بطری است تعداد 1 نقص شده است. آیا میتوان نتیجه گرفت که میانگین تعداد نقطهای مشاهده شده  است.

فرضیه:

آماره آزمون:  اگر  باشد آنگاه  رد میشود.

                                     

مقایسه میانگینهای بیش از دو گروه (آنالیز واریانس)

مطالعهای را درنظر بگیرید که جهت مقایسه توانایی دو گروه، انجام شده باشد. در صورتی که دادهها دارای خصوصیات مشخصی باشد. (توزیع تقریباً نرمال باشد) میتوان برای آزمون فرضیه صفر  برابر بودن میانگینهای دو جامعه از آزمون t با نمونههای مستقل استفاده نمود. اگر آزمون معنیدار شد. نیتجه میگیریم که بین میانگینهای دو جامعه تفاوت معنیداری وجود دارد. که این نتیجهگیری معادل آن است که عامل مورد مطالعه موثر است. همین فرضیه را میتوان توسط روشهای آنالیز واریانس آزمون کرد. درحقیقت اگر در مورد دادههای مربوط به یک مطالعه دو گروهی از آنالیز واریانس یا آزمون t استفاده شود نتایج یکسانی بدست میآید. ولی آنالیز واریانس کاربردهای متنوعتری وارد. به طورمثال مطالعهای را درنظربگیرید که اثرات روشهای تقویت حافظه را مورد بررسی قرار میدهد. سه گروه از موردها به شرح ذیل مورد مطالعه قرارگرفتهاند.

الف)یک گروه؛ روش تقویت حافظه A

ب) یک گروه؛ با روش تقویت حافظه B

ج) یک گروه؛ با روش تقویت حافظه C

این حالت را به عنوان مطالعه تجربی کاملاً تصادفی شده نیز مینامند. از چنین مطالعهای سه نمونه مستقل از امتیازات (یک نمونه برای هرگروه) به دست میآید. آنالیز واریانس یک طرفه میتواند فرضه صفر برابر بودن سه میانگین جامعه را آزمون کند. برخلاف آنالیز واریانس نمیتوان از آزمون  t برای بررسی یک فرضیه در مدرسه میانگین یا بیشتر استفاده نمود و تنها در حالتی که دو گروه وجود داشته باشد. می‌‌توان از آن آزمون t جهت مقایسه میانگینهای سه گروه باید سه آزمون t جهت مقایسه گروه C با A گروه C با B و گروه A با B انجام شود. درحقیقت اگر تعداد زیادی میانگین جهت مقایسه وجود داشته باشد. احتمال اینکه حداقل یکی از آزمونهای معنیدار شود نزدیک به یک است که به همین دلیل نمیتوان از آزمون t استفاده کرد.

میانگین یک گروه برآوردی از سطح عملکرد عادی افراد تحت یک وضعیت خاص است. اما عملکرد هرفرد میتواند بسیار متغیر باشد و گاهی به طور بارزی از میانگین گروه مربوطه فاصله داشته باشد. این پراکندگی درون گروهی (withing group) را به عنوان خطاهای آزمایشی (error) درنظر بگیرید. از طرف دیگر ممکن است گروههای A و B به طور متوسط به سطوح بالاتری از عملکرد حافظه درمقایسه با گروه C برسند. به عبارت دیگر پراکندگی بین گروهها (between group) زیاد است.

واریانس بین گروهی واریانس درون گروهیآماره F آنالیز واریانس از تقسیم برآوردی از پراکندگی بین گروهها به پراکندگی درون گروهها محاسبه میشود:

                            

اگر تفاوت زیادی بین میانگین درمانهای مختلف وجود داشته باشد. صورت F (و در حقیقت خود F) بزرگ شده و احتمالاً فرضیه صفر رد میشود. اما اگر اثری وجود نداشته باشد صورت و مخرج مقادیر شبیه هم خواهد داشت و مقدار F نزدیک به یک میشود.

نمودار تصمیمگیری برای انتخاب آزمون مناسب برای بررسی تفاوتهای موجود بین میانگینها بررسی تفاوتهای موجود بین میانگینها


سریهای زمانی

TIME SERIES ANALYSIS

مقدمه:

تجزیه و تحلیل سریهای زمانی موضوعی است با دامنه وسیع و توسعه تاریخی آن به دو منبع اصلی مهندی ارتباطات و آمار ریاضی برمیگردد. موضوع مهندسی ارتباطات به روش قلمرو فرکانس، موضوع آمار ریاضی به دو روشهای قلمرو زمان مربوطه میشود؛ امروزه تجزیه و تحلیل سریهای زمانی به طور وسیع در بسیاری از شاخههای مهندسی، علوم، فیزیک و اقتصاد مورد استفاده واقع میشود. یک سری زمانی مجموع مشاهداتی است که برحسب زمان مرتب شده باشند.

اهداف تجزیه و تحلیل سریهای زمانی

الف) توصیف: وقتی یک سری زمانی ارائه میشود. معمولاً اولین مرحله در تجزیه و تحلیل این است که نمودار دادهها را رسم کرده و اندازههای توصیفی ساده ای از خواص اصلی سری بدست آوریم.

ب) تشریح: وقتی مشاهدات روی دو متغیر یا بیشتر اختیار شوند؛ شاید بتوانیم از تغییرات یک سری زمانی برای بیان تغییرات در سری دیگر استفاده کنیم.

ج) پیشبینی: یک سری زمانی مشاهدات داده شده است. میخواهیم مقادیر آینده سری را پیشبینی کنیم این کار در پیشبینی فروش و در تجزیه و تحلیل سریهای زمانی صنعت از اهمیت زیادی برخوردار است.

استراتژی الگوسازی

پیدا کردن الگوهای مناسب برای سریهای زمانی کاریست مهم در این روش سه مرحله عمده وجود دارد.

1) تشخیص (یا شناسایی) الگو

2) برازش الگو

3) تشخیص درستی الگو

در انتخاب الگو اصل امساک را درنظر میگیریم یعنی الگوی که بکار برده میشود باید به کمترین تعداد ممکن پارامترها که بطور قابل قبول دادهها را مشخص میکند نیاز داشته باشند.

مفاهیم اساسی

ناهمبسته گام برداری تصادفی میانگین رکوواریانس

       ایستائی:

مفهوم اساسی ایستائی این است که قوانین احتمالی حاکم برفرآیند با زمان تغییر نمیکند یعنی فرآیند در تعادل آماری است. در یک سری زمانی تابع میانگین تابعی دلخواه از زمان است اگر سری ایستا باشد. تابع میانگین نسبت به زمان ثابت است. ولی در بعضی مواقع تابع میانگین نسبت به زمان ثابت نیست و دارای روند میباشد.

الگوهای سریهای زمانی ایستا:

1- فرآیند خطی کلی:                                     

2- فرآیند اتورگرسیو:                         

                                        

          شرط ایستائی

                                                 

شرایط ایستائی قدرمطلق جواب بزرگتر از 1                 

                                                            

                                               

                                               

                                               

3- فرآیندهای میانگین متحرک:

                                       

فرآیند میانگین متحرک همیشه ایستا است.                          

                                                       

4- الگوی مرکب اتورگرسیوـ میانگین متحرک

                  

                                                           

ایستائی و ناایستائی:

مفهوم اساسی ایستائی این است که دریک سری زمانی تابع میانگین  نسبت به زمان ثابت باشد در یکسری زمانی ناایستا  نسبت به زمان ثابت نمی باشد.

ایستائی باتوجه به تفاضل کردن:

         

مدل عمومی گام برداری تصادفی سری ایستا الگوی (1و1) IMA (2و2) IMA الگوی (1و1) AR1         

         

         

         

         

         

         

تابع خود همبستگی (ACF) و خود همبستگی جزئی (PACF)

                   تابع خود همبستگی نمونهای                

          تابع خود همبستگی جزئی          

بررسی ایستائی سری از طریق  و  بطور مثال اگر  

اگر تابع ACF و PACF به صورت دو شکل A و B باشند نشاندهنده این است که سری ایستا نمیباشد. و احتیاج به تفاضل کردن دارند.

تشخیص الگو:

1- انتخاب مقادیر مناسب q,d,p برای سری زمانی معلوم.

برازش الگو:

2- برآورد پارامترهای الگو ARIMA(p,d,q)

تشخیص درستی الگو:

بررسی مناسب بودن الگوی برازش شده
تشخیص الگو: برای تشخیص الگو باید مقادیر q,d,p را بدست آورد. اگر سری ایستا نباشد با استفاده از تفاضلی کردن میتوان سری را ایستا نمود که بدین وسیله d  (تعداد دفعات تفاضل) تعیین کرد. اگر سری AR(p) (اتورگرسیو) باشد خود همبستگی جزئی برآورد شده در تأخیرهای بزرگتر از p تقریباً دارای توزیع نرمال مستقل با میانگینهای صفر و واریانس  است لذا برای آزمون این فرض که الگو AR(p) است میتوانیم از حدود بحرانی  برای  وقتی که k>p میباشد استفاده نمود.

در الگوی سری AR(p) خود همبستگیهای برآورد شده بطورنمایی به صفر میل میکنند.

اگر سری MA(q) باشد خود همبستگیهای برآورد شده درتأخیرهای بزرگتر از q تقریباً دارای توزیع نرمال مستقل با میانگینهای صفر و واریانس  است.

در الگوی  رفتاری مشابه ACF برای AR(p) دارند.

در الگوی PAR را میتوان از PACF بدست آورد.

برآورد پارامترها:

پس از تعیین مدل (تعیین q,d,p) برآورد پارامترها مطرح میباشد.

روشهای برآورد پارامترها:

1- روش گشتاورها: در این روش برای MA نمیتوان  را برآورد کرد.

2- روش کمترین مربعات

3- روش درست نمایی ماکزیمم

تشخیص درستی الگو:

پس از تعیین الگو و پارامترهای آن مسالهای که مورد بحث است تشخیص درستی الگو است. در این مرحله دو روش وجود دارد.

1- تجزیه و تحلیل باقیمانده

2- تجزیه و تحلیل الگوهائی که پارامترهای بیشتری دارند. یعنی الگوهائی که کلیتر از الگوی مشخص شده است.

                   مقدار پیشبینیشده – مقدار واقعی = باقیمانده


1- تجزیه و تحلیل باقیماندهها:

1- ثابت بودن واریانس: اگر در نمودار باقیمانده درمقابل مقادیر فیت شده مقادیر حول خط صفر پراکندگی تصادفی داشته باشند میتوان نتیجه گرفت که واریانس ثابت است.

2- نرمال بودن باقیماندهها: اگر در نمودار اندازههای نرمال باقیماندهها درمقابل باقیماندهها نقاط روی یک خط راست قرارگیرند و یا اینکه هیستوگرام باقیماندهها به شکل منحنی نرمال باشد نرمال بودن باقیماندهها را میتوان نتیجه گرفت.

3- مستقل بودن باقیماندهها: اگر در نمودار باقیماندهها درمقابل زمان نقاطی دارای شکل خاصی نباشند و پراکندگی تصادفی داشته باشند در اینصورت باقیماندهها مستقل میباشند.

2- تجزیه و تحلیل الگوهایی که پارامتر بیشتری دارند:

بعد از شناسایی و برازش الگوئی که بنظر مناسب میآید الگوی کلیتری را برازش میدهیم یعنی الگوی اولیه را به عنوان موردخاص در برمیگیرد برای مثال اگر یک الگوی MA(1) مناسب به نظر برسد میتوان یک الگوی (MA(2) را برای برازش بیشتر در نظربگیریم الگوی MA(1) مورد تائید است اگر:

1- برآورد پارامتر اضافی  بطور معنیداری با صفر اختلاف نداشته باشد.

2- برآورد پارامترهای  (مشترک) اختلاف یعنی معنیداری با هم نداشته باشند.

قواعد کلی:

1- الگوی اولیه را به دقت شناسایی میکنیم. اگر یک الگوی سادهتر رضایتبخش بنظر میرسد قبل از امتحان یک الگوی پیچیدهتر آن بررسی شود.

2- هنگام برازش بیشتر مرتبههای قسمتهای AR و MA الگو همزمان افزایش داده نشود.

3- الگو را در جهتی که بوسیله تجزیه و تحلیل باقیماندهها پیشنهاد شده بسط باید داد.

پیشبینی کمترین مربعات خطا:

برمبنای تاریخچه قابل دسترس سری تا زمان t یعنی  میخواهیم مقدار  را برای L واحد زمانی در آینده پیشبینی کنیم. زمان t را مبداء پیشبینی L   را زمان تقدم پیشبینی مینامند.

پیشبینی کمترین مربعات خطا که به  نشان داده میشود بصورت زیر است.

پیشبینی بوسیله ARMA :

(1)AR

به عنوان مثال یک الگو (1)AR با 7/0= . 2/10= را در نظر بگیرید که مقدار مشاهده فصلی برابر 6/10= است. در این صورت:

در زمان تقدم 10         

درحالت . برای L بزرگ

الگوی (1) MA

 که اغتشاش خالص است یک سری ایستا است که تمام مقادیر  حول صفر قراردارند.
 
 نسبت به زمان ثابت است.                           نسبت به زمان ثابت نیست.
  
   
 
 نمیتوان فرض  را رد کرد بنابراین میتوان نتیجه گرفت که تعدد نقطهای مشاهده شده 15/0 است.
 را آزمایش کنیم دراین مثال یک نمونهن شامل 100 مشاهده  است انتخاب گردیده شده چون  دارای توزیع پواسون است  نیز دارای توزیع پواسون با پارامتر  خواهد بود. با توجه به اینکه  بزرگ است تقریباً دارای توزیع نرمال با میانگین  و واریانس  است.

                                         
                                               
                                        
                         برآورد ادغامی:  
 اگر  یا  از جدول توزیع  به ازای درجه آزادیهای  تعیین میگردد.
 
  
 و  بنابراین ناحیة رد با  به صورت  بنا میشود. چون مقدار مشاهده شده در این ناحیه قرارمیگیرد فرض صفر در سطح  رد میشود. یعنی محتوای معدنی لایه 1 بیشتر از لایه 2 است.
= مجتمع رتبههای نمونة کوچکتر در رتبهبندی نمونه ترکیبی
: توزیع جامعه A به سمت راست توزیع جامعه B انتقال یافته است.
: توزیعهای درجامعه یکساناند.
         تیمار B
           تیمار A
                      
                     
                                                  
                                  
              ،                 
                                                               n
                                                               2
                                                                1
 
    
 فرض برابری دو برنامه آموزشی در برابر فرض رو میشود میتوان نتیجه گرفت که آموزش به وسیله روش دوم بهتر ازروش اول میباشد.
                               
                             
 
 
 
نظرات 0 + ارسال نظر
برای نمایش آواتار خود در این وبلاگ در سایت Gravatar.com ثبت نام کنید. (راهنما)
ایمیل شما بعد از ثبت نمایش داده نخواهد شد