ในหลายครั้งที่วิเคราะห์สถิติ กลุ่ม Regression แล้วอาจเจอกับปัญหาค่ามาตรฐานมีค่ามากกว่า 1 ซึ่งเป็นสิ่งที่ไม่ควรเกิดขึ้น คำถามคือ มันเกิดจากอะไร และจะแก้ไขอย่างไร วันนี้เรามีคำตอบเบื้องต้นให้ครับ
สวัสดีครับ บันทึกวันนี้เราจะมาว่ากันด้วยเรื่อง Standardized มีค่ามากกว่า 1 เนื่องจาก บางครั้งเวลาที่เราวิเคราะห์สถิติกลุ่ม Regression แล้ว เกิดปัญหาว่า ค่าอิทธิพลที่แสดงในรูปค่ามาตรฐานนั้น มีค่าเกิน 1
เนื่องจากการแสดงค่าอิทธิในรูปของค่ามาตรฐานจะต้องมีค่าระหว่าง 0-1 ดังนั้น หากค่าเกิน 1 แสดงว่าเกิดปัญหา
ทีนี้ลองมาดูว่าปัญหาเกิดจากอะไรได้บ้าง
การคีย์ข้อมูลผิด บางครั้งการคีย์ข้อมูลอาจไม่ส่งผลอะไรมากนัก แต่กลายเป็นว่า เมื่อสเกลของข้อมูลมันต่างกันแบบแปลกๆ ไม่คล้องจองกันในแต่ละตัวแปร ก็อาจส่งผลได้
ข้อมูลมีความสัมพันธ์กันมากเกินไป หรือที่เรียกว่า Multicollinearity ซึ่งปัญหานี้ ถือว่าเป็นข้อตกลงเบื้องต้นที่สำคัญในการวิเคราะห์ Regression
จากตัวอย่างจะเป็นการนำเสนอการวิเคราะห์ด้วย AMOS ซึ่งส่วนใหญ่ถ้าใช้ SPSS มักจะไม่พบปัญหานี้ แต่ใน AMOS มีโอกาสพบเจอได้
จากภาพ เป็นตัวอย่างผลการวิเคราะห์ เมื่อวิเคราะห์ด้วย AMOS แล้วค่าอิทธิพลมีค่ามากกว่า 1 เมื่อเลือกแสดงด้วยค่ามาตรฐาน ซึ่งเป็นสิ่งที่ไม่ควรเกิดขึ้น
ทีนี้ลองมาดูข้อมูลดิบว่าเกิดปัญหาอะไรขึ้นกันแน่ (ต้องบอกก่อนว่า ข้อมูลนี้เป็นข้อมูลสมมติ และ สร้างประเด็นขึ้นมาให้ค่ามันเกิน 1 ดังนั้น เวลาแก้ไขปัญหาจริง ต้องระมัดระวังมากขึ้น)
จากตัวอย่างข้อมูล ตัวแปรที่ใช้คือ USEF USE และ EOU โดยมี USEF กับ EOU เป็นตัวแปรต้น และ USE เป็นตัวแปรตาม
ทีนี้ได้สร้างตัวแปร "ซ้ำ" ขึ้นมา คือ USEUSEF กับ EOUEOU เพื่อแสดงให้เห็นว่า เมื่อไหร่ที่ตัวแปรมีข้อมูลซ้ำกันจะทำให้เกิดปัญหานี้ได้
อาจมีบางกรณี ที่ตัวแปรมีความคล้ายกัน มีข้อมูลที่สัมพันธ์กันมาก จนโปรแกรมมองว่า "เอ้ย" มันคือตัวเดียวกันนะ ทั้งที่ข้อมูลนั้นไม่ได้เป็นซ้ำกัน แต่โปรแกรมกลับมองว่าซ้ำกัน ก็เป็นปัญหาที่คล้ายๆกัน
ทีนี้ อาจมีคำถามว่า แล้วทำไมตัวอย่างนี้ข้อมูลเหมือนกันเป๊ะ แต่ทำไมไม่ขึ้น error ที่ว่านี้ ก็เป็นไปได้ว่าข้อมูลจำนวนไม่เยอะ เพราะตัวอย่างนี้มีเพียง 100 เคส และตัวแปรนั้นไม่ได้ส่งผลต่อตัวแปรอื่นมากนัก
เรากลับมาที่ประเด็นหลักของเรื่องนี้ คือ ความสัมพันธ์กันเองมากเกินไป หรือ Multicollinearity คำตอบง่ายๆ คือ ตัวแปร USEF กับ USEFUSEF มีความสัมพันธ์กันมากเกินไป และในขณะเดียวกัน USEF ก็ยังมีความสัมพันธ์หรืออิทธิพลที่สูง ต่อ USE ด้วยเช่นกัน จึงทำให้ ค่าอิทธิพลมีค่าเกิน 1 นั่นเอง
แล้วจะแก้ไขอย่างไร
วิธีการแก้ไข อธิบายกว้างๆก่อนก็คือ จัดการตัวแปรที่มีปัญหาซะ ไม่ว่าจะเป็นการ "ตัดทิ้ง" หรือ "รวมตัวแปร" รวมทั้ง "จัดการข้อมูลดิบ"
ตัดทิ้ง : ง่ายๆเลย ตัวแปรไหนสร้างปัญหา ก็ตัดทิ้งไป แต่ก็อาจจะตัดสินใจยากว่า ถ้า 2 ตัวที่มันคล้ายกัน จะเลือกตัดตัวไหนละ อาจจะแนะนำว่า ให้ตัดตัวแปรที่มีผลน้อยกว่า หรือมีค่าเฉลี่ยน้อยกว่า ต้องตัดสินใจให้ดี
รวมตัวแปร : ในกรณีที่มีเหตุผลเพียงพอ ว่า 2 ตัวแปรนั้นมีความสัมพันธ์กันมากพอ จนเชื่อว่าน่าจะเป็นตัวเดียวกัน ก็ทำการรวมตัวแปร หรือสร้างเป็น factor score ก็ได้
จัดการข้อมูลดิบ : อาจมีบางกรณีที่ ผู้ตอบบางคน ตอบหลายๆ ข้อคล้ายกัน ทำให้ผลออกมาสัมพันธ์กันมากไป ทีนี้ ถ้าไปเช็คดีดี อาจพบว่าเป็น Outlier ได้ หรือก่อนการคีย์ข้อมูลถ้ามีคนไหนที่ตอบข้อเดียวกันทุกข้อคำถาม ก็อาจจะจัดการทิ้งไปตั้งแต่ต้นได้
ลองแก้ปัญหา
ในบล็อคนี้ จะแนะนำการแก้ปัญหาด้วยการ "ตัดตัวแปรทิ้ง"
เมื่อตัดตัวแปร USEFUSEF ออกไปแล้ว จะเห็นว่า USEF มีค่าอิทธิพลต่อ USE น้อยกว่า 1 เมื่อแสดงเป็นค่ามาตรฐานแล้ว กลับมาเป็นปกติที่ควรจะเป็น
สรุป
โดยสรุป ปัญหาค่ามาตรฐานมากกว่า 1 นั้น อาจเกิดขึ้นไม่บ่อย แต่เมื่อเกิดขึ้นแล้ว สิ่งสำคัญคือข้อมูลดิบ ของตัวแปรใด ตัวแปรนึง ในโมเดลมีความสัมพันธ์กันเองมากเกินไป หรือบางทีคีย์ข้อมูลผิดก็เป็นได้
ดังนั้น ต้องไปแก้ให้ข้อมูลดิบไม่สัมพันธ์กันมากไป ในกรณีที่ไม่สามารถตัดสินใจได้จริงๆ ก็คงต้องยอมตัด หรือ เลือกตัวแปรเดียวที่มีความสำคัญมากกว่าให้คงไว้ หรือ มองในแง่เทคนิคก็คือลองตัดก่อน ตัวไหนตัดแล้วทำให้ตัวที่เหลือมีค่าอิทธิพลสูง ก็ตัดตัวนั้นได้เลย
ต้องการเรียนสถิติ อยากปรึกษาสถิติทั้งเรื่อง Factor Analysis, CFA, SEM หรือเรื่องอื่นๆ สามารถติดต่อสอบถามเข้ามาได้เลย
'นึกถึงสถิติ นึกถึงเรา Smart Research Thai'
ร่วมติดตามได้ทุกช่องทาง
follow or subscribe in any channel
.
tel.086-555-5949
line: @SmartResearchThai
Blockdit: SmartResearchThai
Youtube: SmartResearchThai
Facebook: SmartResearchThai
Comments