সাধারণ ভাবে তিন রকম মিথ্যার কথা আমরা জানি – ‘Lies, Damn Lies and Statistics’ -- মার্ক টোয়েন এর এই বিখ্যাত উক্তিটি সর্বতো ভাবে সত্য। খুব কম জনই সঠিক ভাবে স্ট্যাটিস্টিক্সের প্রয়োগ পদ্ধতি জানেন কাজেই সাধারণভাবে স্ট্যাটিস্টিক্সের সহায়তায় মিথ্যা বলা সম্ভব। জর্জ কর্লিন এক বার বলেছিলেন Think about how stupid the average person is; now realise half of them are dumber than that. দু’ একটা উদাহরণ দিলে স্ট্যাটিস্টিক্সের অপপ্রয়োগের ব্যাপারটি পরিষ্কার হবে: (ক) মহিলারা পুরুষদের তুলনায় ভালো ড্রাইভার : দুর্ঘটনার জন্য দায়ী অথবা দুর্ঘটনাগ্রস্ত গাড়ির ড্রাইভারের সংখ্যার তুলনামূলক বিচার করলে হয়তো দেখা যাবে সত্যিই মহিলা ড্রাইভারের হাতে দুর্ঘটনা কম হয়েছে। কিন্তু এখানে একটি তথ্য পরিবেশন করা হচ্ছে না, যে মহিলা ড্রাইভারের সংখ্যা (যাঁরা নিয়মিত গাড়ি নিয়ে বেরোন) পুরুষ ড্রাইভারের সংখ্যার তুলনায় নগণ্য। সে জন্য এখানে এই তথ্য মিথ্যা। (খ) কাপড়ের টুপি বনাম মেটালের টুপি : এটি একটি বিখ্যাত ভুলের গল্প। প্রথম বিশ্বযুদ্ধে যখন পরীক্ষামূলক ভবে সৈন্যদের ব্যবহারের জন্য কাপড়ের টুপির বদলে টিনের টুপির প্রচলন করা হল তখন দেখা গেল আহত সৈন্যের সংখ্যা অনেক বেড়ে গেছে। কেউই এর সঠিক ব্যাখ্যা দিতে পারছেন না। পরে বোঝা গেল আহত সৈন্যের সংখ্যা এ ভাবে তুলনীয় নয়। আসলে টিনের টুপি সৈন্যদের মৃত্যুর সম্ভাবনা নিশ্চিত ভাবে কমিয়েছে, তাই আহত সৈন্যের সংখ্যা বেড়ে গেছে। এ দু’টি উদাহরণ থেকে স্পষ্ট বোঝা যাচ্ছে, শুধুমাত্র সংখ্যা/তথ্য পরিবেশনই শেষ কথা নয়। সেই তথ্যকে সঠিক ভাবে ব্যাখ্যাই পারে সঠিক চিত্র তুলে ধরতে। নচেৎ ভুল ব্যাখ্যা (মিসইন্টারপ্রিটেশন) ‘হয় কে নয়’ বানিয়ে দিতে পারে। তবে নিরপেক্ষ দৃষ্টিতে খোলা মন নিয়ে পুরো ব্যাপারটা দেখলে স্ট্যাটিস্টিকসের অপব্যাখ্যা ধরে ফেলা সম্ভব। কিছু কিছু সাধারণ ভুলের পরিচয় দেওয়া যাক - % বৃদ্ধি এবং পার্থক্যের %: ৩০০ হল ২০০ এর তুলনায় ৫০% বড়, ২০০ কিন্তু ৩০০ এর তুলনায় ৫০% ছোট নয়। interpolation এবং extrapolation : দুই সময়ের জ্ঞাত তথ্যের ভিত্তিতে তার মাঝের সময়ের তথ্য নিরূপণ চলতে পারে কিন্তু ভবিষ্যতের জন্য তার ব্যবহারের আগে অনেক চিন্তাভাবনা দরকার। Relationship (সম্পর্ক) এবং Causality (কারণ): দু’টি ঘটনা সম্পর্কিত হতে পারে, কিন্তু একমাত্র কারণ হিসেবে দেখানো অনুচিত। একটা অপরটি ঘটার কারণ হতে পারে, আবার কাকতলীয় হওয়া অসম্ভব নয়। Statistically Significant, Non Significant এবং important: Statistically Significant মানেই important এমন নাও হতে পরে; এগুলি sample size, variability ইত্যাদির উপরে অতিমাত্রায় নির্ভরশীল। আসলে অনেক সময় নিজেদের উপযোগী সংখ্যার/তথ্যের দরকার হয়। তখন নিজের মতো করে তথ্য সংগ্রহ করে ব্যাখ্যা করে জনসাধারণকে পরিবেশন করা হয়। কিছু দিন আগে আন্দামান ও নিকোবর দ্বীপসমূহে সুনামি দুর্গতদের সম্পর্কে একটি প্রতিবেদনে দেখা যায় - মহিলা ও শিশুদের মধ্যে মৃতের সংখ্যা অনেক বেশি : sex ratio অভূতপূর্ব কমে গেছে - ইত্যাদি ইত্যাদি। ঐ রিপোর্টে দেওয়া অন্য তথ্যের সঙ্গে সঙ্গতি খুঁজতে গিয়ে দেখা গেল ৫০% মহিলার সঙ্গে সঙ্গে ৪৭% পুরুষও মৃত। এখানে ইচ্ছে করে একপেশে তথ্য পরিবেশন করা হয়েছে। সূত্র: http://en.wikipedia.org/wiki/Lies,_damned_lies,_and_statistics