সাধারণ ভাবে তিন রকম মিথ্যার কথা আমরা জানি – ‘Lies, Damn Lies and Statistics’ -- মার্ক টোয়েন এর এই বিখ্যাত উক্তিটি সর্বতো ভাবে সত্য। খুব কম জনই সঠিক ভাবে স্ট্যাটিস্টিক্সের প্রয়োগ পদ্ধতি জানেন কাজেই সাধারণভাবে স্ট্যাটিস্টিক্সের সহায়তায় মিথ্যা বলা সম্ভব।
জর্জ কর্লিন এক বার বলেছিলেন Think about how stupid the average person is; now realise half of them are dumber than that.
দু’ একটা উদাহরণ দিলে স্ট্যাটিস্টিক্সের অপপ্রয়োগের ব্যাপারটি পরিষ্কার হবে:
interpolation এবং extrapolation : দুই সময়ের জ্ঞাত তথ্যের ভিত্তিতে তার মাঝের সময়ের তথ্য নিরূপণ চলতে পারে কিন্তু ভবিষ্যতের জন্য তার ব্যবহারের আগে অনেক চিন্তাভাবনা দরকার।
Relationship (সম্পর্ক) এবং Causality (কারণ): দু’টি ঘটনা সম্পর্কিত হতে পারে, কিন্তু একমাত্র কারণ হিসেবে দেখানো অনুচিত।
একটা অপরটি ঘটার কারণ হতে পারে, আবার কাকতলীয় হওয়া অসম্ভব নয়। Statistically Significant, Non Significant এবং important: Statistically Significant মানেই important এমন নাও হতে পরে; এগুলি sample size, variability ইত্যাদির উপরে অতিমাত্রায় নির্ভরশীল।
আসলে অনেক সময় নিজেদের উপযোগী সংখ্যার/তথ্যের দরকার হয়। তখন নিজের মতো করে তথ্য সংগ্রহ করে ব্যাখ্যা করে জনসাধারণকে পরিবেশন করা হয়। কিছু দিন আগে আন্দামান ও নিকোবর দ্বীপসমূহে সুনামি দুর্গতদের সম্পর্কে একটি প্রতিবেদনে দেখা যায় - মহিলা ও শিশুদের মধ্যে মৃতের সংখ্যা অনেক বেশি : sex ratio অভূতপূর্ব কমে গেছে - ইত্যাদি ইত্যাদি। ঐ রিপোর্টে দেওয়া অন্য তথ্যের সঙ্গে সঙ্গতি খুঁজতে গিয়ে দেখা গেল ৫০% মহিলার সঙ্গে সঙ্গে ৪৭% পুরুষও মৃত। এখানে ইচ্ছে করে একপেশে তথ্য পরিবেশন করা হয়েছে।
সূত্র: http://en.wikipedia.org/wiki/Lies,_damned_lies,_and_statistics
সর্বশেষ সংশোধন করা : 7/11/2020