เคยได้ยินเมื่อสมัยเรียนมาว่า "Correlation does not imply causation" เรื่องนี้ก็เป็นประเด็นนึงที่ต้องเล่าสู่กันฟัง เอาล่ะครับ มาเริ่มกันเลยดีกว่ากับบทความในวันนี้ "Correlation: simple but not easy"
1. Correlation คืออะไร
บางคนคงทราบกันดีกว่า correlation คือ การวิเคราะห์ความสัมพันธ์ระหว่าง 2 ตัวแปร เช่น รายได้กับความพึงพอใจ ซึ่งทั้งสองตัวแปรนั้นต้องเป็นระดับ interval/ ratio หรือเรียกรวมๆ ว่า continuous (อ่านเพิ่มเติมบทความเกี่ยวกับเรื่องระดับตัวแปร)
แต่ correlation นั้น ยังไม่ได้เอาไว้แค่วิเคราะห์ความสัมพันธ์ระหว่าง 2 ตัวแปรเท่านั้น แต่ในหลายๆ กรณี correlation จะถูกนำไปใช้ในการตรวจสอบความสัมพันธ์ต่างๆ ที่มีหลายตัวแปร แม้ว่าจะเป็นผลความสัมพันธ์เพียง 2 ตัวแปรก็ตาม เช่นนี้ เนื่องจากว่า ทำเพื่อดูความสัมพันธ์ในแต่ละคู่ตัวแปร หรือดูความสัมพันธ์ระหว่างตัวแปรอิสระ กับ ตัวแปรตาม แต่นำเสนอให้อยู่ในตารางเดียว ดังภาพตัวอย่าง
จากภาพจะเห็นได้ว่ามี 4 ตัวแปร ผลของความสัมพันธ์จะแสดงกันเป็นคู่ๆ นับได้ 6 คู่ โดยฝั่งขวาบน กับ ซ้ายล่าง คือผลเดียวกัน จะดูฝั่งไหนก็ได้ และแน่นอนว่า ไม่ใช่ความสัมพันธ์ของทั้งหมดพร้อมกัน แต่มันคือความสัมพันธ์ในแต่ละคู่เท่านั้น ลองดูอีกภาพ เป็นภาพ scatter diagram
จากภาพ scatter diagram เป็นความอีกหนึ่งความสัมพันธ์ระหว่างตัวแปร แต่แสดงผลแบบกราฟ จากภาพจะเห็นว่าชุดข้อมูลระหว่าง 2 ตัวแปร จะกระจายๆ กันไป แต่ยังสามารถมองทิศทางได้ ว่าไปทางเดียวกัน ก็คือ จากซ้ายล่างขึ้นไปขวาบน แบบนี้ เราเรียกว่า "สัมพันธ์ในทิศทางบวก หรือ positive direction" และแม้ว่ารูปกราฟจะแสดงออกมาหลายคู่ แต่มันก็ยังเป็นความหมายเดิมคือ ความสัมพันธ์ในแต่ละคู่เท่านั้น
สรุปในประเด็นที่ 1 correlation คืออะไร ก็คือความสัมพันธ์ของตัวแปร ซึ่งแสดงผลเป็นคู่ๆ และถ้ามีหลายตัวแปรก็มักจะแสดงผลออกมาในรูปของ matrix
2. Correlation does not imply causation
ในประเด็นนี้ สามารถแปลได้ตรงตัวเลย ก็คือ มีความสัมพันธ์กันไม่ได้แปลว่าจะเป็นเหตุเป็นผลกันได้ ที่กล่าวเช่นนี้เพราะว่า เมื่อก่อน มักนำการวิเคราะห์ correlation ไปใช้เพื่อสรุปความเป็นเหตุเป็นผล หรือ causation ซึ่งมันไม่เพียงพอ ไม่ใช่ไม่ถูกต้องนะ แต่มันไม่เพียงพอ เพราะถ้าเราไปดูสถิติที่ใช้สำหรับการวิเคราะห์ความเป็นเหตุเป็นผล อย่าง regression จะพบว่า 1 ในหลายๆ ข้อตกลงเบื้องต้น ก็คือ ตัวแปรอิสระต้องมีความสัมพันธ์กับตัวแปรตาม นั่นก็คือ correlated กันนั่นเอง ดังนั้น
มีความสัมพันธ์กัน (correlated กัน) ไม่ได้แปลว่าจะเป็นเหตุเป็นผลกัน
จะมีความเป็นเหตุเป็นผลกันได้นั้น จะต้องมีความสัมพันธ์กันด้วย
จากภาพนี้จะเห็นได้ชัดว่า มีความสัมพันธ์กันมากๆ แต่กลับมีผลให้เกิดความเป็นเหตุเป็นผลกันเพียงครึ่งเดียว และเช่นเดียวกัน จะเป็นเหตุเป็นผลกันได้นั้น ก็ต้องมีความสัมพันธ์กันด้วย
สรุปในประเด็นที่ 2 Correlation does not imply causation ต้องไม่เข้าใจผิดว่าหากมีความสัมพันธ์กันแล้วจะสามารถอ้างได้ว่าเป็นเหตุเป็นผลกัน สถิติ correlation ก็คือเน้นเรื่องความสัมพันธ์ หากต้องการทดสอบความเป็นเหตุเป็นผลก็ต้องไปใช้ตระกูล regression
3. Correlation สำหรับเรื่องอื่น
ในประเด็นที่ 3 คำว่าสำหรับเรื่องอื่นๆ นั้น ก็ยังเน้นที่ความสัมพันธ์ อย่างที่กล่าวไปข้างต้นว่า correlation มักนำไปใช้ในหลายกรณี ประเด็นนี้จึงมาเล่าเป็นเบื้องต้นว่า ใช้ในกรณีใดบ้าง
Multicollinearity
Summary data
Linearity
ความสอดคล้องของข้อมูลในภาพรวม
เหล่านี้เป็นต้น ดังนั้น correlation จะว่าง่ายก็ง่าย จะว่ายากก็ยากได้ แต่ทั้งนี้ทั้งนั้นการวิเคราะห์ correlation นั้นดูเหมือนธรรมดาๆ แต่ก็ไม่ง่ายเลย ที่จะทำความเข้าใจ
สนใจเรียนสถิติพื้นฐานสำหรับการวิจัย Basic Statisitc by SPSS หรือสถิติขั้นสูงสมการโครงสร้าง Advanced Statistic SEM ติดต่อสอบถามได้ในทุกช่องทาง
ร่วมติดตามได้ทุกช่องทาง
follow or subscribe in any channel
tel.086-555-5949
line: @SmartResearchThai
Youtube: SmartResearchThai
Facebook: SmartResearchThai
ยกตัวอย่างเช่น ติดตาม Smart Research Thai บ่อยๆ แล้วจะปลอดภัยจากโควิด 555