CLT হল একটি পরিসংখ্যানগত অনুমান যে, একটি সীমিত স্তরের ভিন্নতা সহ একটি জনসংখ্যা থেকে যথেষ্ট বড় নমুনার আকার দেওয়া হলে, একই জনসংখ্যা থেকে নমুনা করা সমস্ত ভেরিয়েবলের গড় সমগ্র জনসংখ্যার গড়ের প্রায় সমান হবে। কেন্দ্রীয় সীমা উপপাদ্য অনুসারে, ডেটার প্রকৃত বন্টন নির্বিশেষে নমুনার আকার বৃদ্ধির সাথে সাথে ডেটার নমুনার গড় প্রশ্নে থাকা সমগ্র জনসংখ্যার গড়ের কাছাকাছি হয়ে যাবে। আসুন কেন্দ্রীয় সীমা উপপাদ্যটি কী, এটি কীসের জন্য এবং এর মূল উপাদানগুলি দেখুন।
কেন্দ্রীয় সীমা উপপাদ্য কি (CLT)
সম্ভাব্যতা তত্ত্বে, সেন্ট্রাল লিমিট থিওরেম (CLT) বলে যে একটি নমুনা ভেরিয়েবলের বন্টন একটি স্বাভাবিক বন্টন (অর্থাৎ, একটি "বেল বক্ররেখা") এর কাছে আসে কারণ নমুনার আকার বৃদ্ধি পায় এবং অনুমান করে যে সমস্ত নমুনা আকারে অভিন্ন জনসংখ্যা বন্টনের প্রকৃত আকৃতি। অন্য কথায়, CLT হল একটি পরিসংখ্যানগত অনুমান যে, একটি সীমিত স্তরের ভিন্নতা সহ একটি জনসংখ্যার যথেষ্ট বড় নমুনা আকার দেওয়া হলে, একই জনসংখ্যা থেকে নমুনা করা সমস্ত ভেরিয়েবলের গড় হবে সমগ্র জনসংখ্যার গড়ের প্রায় সমান। তদ্ব্যতীত, এই নমুনাগুলি একটি সাধারণ বন্টনের কাছে যায় এবং বৃহৎ সংখ্যার আইন অনুসারে নমুনার আকার বৃদ্ধির সাথে সাথে তাদের বৈচিত্রগুলি জনসংখ্যার বৈচিত্র্যের প্রায় সমান। যদিও এই ধারণাটি প্রথম 1733 সালে আব্রাহাম ডি মোইভের দ্বারা বিকশিত হয়েছিল, তবে এটি 1920 সাল পর্যন্ত আনুষ্ঠানিক রূপ পায়নি, যখন বিখ্যাত হাঙ্গেরিয়ান গণিতবিদ জর্জ পোলিয়া এটিকে কেন্দ্রীয় সীমা উপপাদ্য নাম দিয়েছিলেন।
কেন্দ্রীয় সীমা উপপাদ্য (CLT) কিসের জন্য?
কেন্দ্রীয় সীমা উপপাদ্য অনুসারে, ডেটার প্রকৃত বন্টন নির্বিশেষে নমুনার আকার বৃদ্ধির সাথে সাথে ডেটার নমুনার গড় প্রশ্নে থাকা সমগ্র জনসংখ্যার গড়ের কাছাকাছি হয়ে যাবে। অন্য কথায়, বন্টন স্বাভাবিক বা বিপর্যস্ত কিনা তা সঠিক। একটি সাধারণ নিয়ম হিসাবে, 30 এবং 50 এর মধ্যে একটি নমুনার আকার CLT পূরণের জন্য যথেষ্ট বলে বিবেচিত হয়, যার অর্থ নমুনার অর্থ বিতরণ মোটামুটি স্বাভাবিক। অতএব, যত বেশি নমুনা নেওয়া হবে, তত বেশি ফলাফল একটি স্বাভাবিক বিতরণের অনুরূপ হবে। উল্লেখ্য, তবে, কেন্দ্রীয় সীমা উপপাদ্য এখনও অনেক ক্ষেত্রে অনেক ছোট নমুনার আকারের জন্য আনুমানিক হবে, যেমন n=8 on=5.3
কেন্দ্রীয় সীমা উপপাদ্যের মূল উপাদান
কেন্দ্রীয় সীমা উপপাদ্যটি বেশ কয়েকটি মূল বৈশিষ্ট্য নিয়ে গঠিত। এই বৈশিষ্ট্যগুলি মূলত নমুনা, নমুনার আকার এবং ডেটা জনসংখ্যার চারপাশে ঘোরে।
- নমুনা ক্রমাগত হয়. এর মানে হল যে কিছু নমুনা ইউনিট আগের অনুষ্ঠানে নির্বাচিত নমুনা ইউনিটগুলির সাথে সাধারণ।
- স্যাম্পলিং এলোমেলো. সমস্ত নমুনা অবশ্যই এলোমেলোভাবে নির্বাচন করা উচিত যাতে তাদের নির্বাচিত হওয়ার একই পরিসংখ্যানগত সম্ভাবনা থাকে।
- নমুনা স্বাধীন হতে হবে. একটি নমুনা থেকে নির্বাচন বা ফলাফল ভবিষ্যতের নমুনা বা অন্যান্য নমুনার ফলাফলগুলিকে প্রভাবিত করবে না।
- নমুনা সীমিত হতে হবে. এটা প্রায়ই বলা হয় যে একটি নমুনা জনসংখ্যার 10% এর বেশি হওয়া উচিত নয় যদি প্রতিস্থাপন ছাড়াই নমুনা নেওয়া হয়। সাধারণভাবে, বৃহত্তর জনসংখ্যার আকার বৃহত্তর নমুনা আকারের ব্যবহারকে সমর্থন করে।
- নমুনার আকার বৃদ্ধি পায়. কেন্দ্রীয় সীমা উপপাদ্যটি প্রাসঙ্গিক হয়ে ওঠে কারণ আরও নমুনা নির্বাচন করা হয়।