Kanth's Playbook | เลิกใช้ DMRT เถอะ

แม้ วงการสถิติได้พยายามลดการใช้ Duncan’s Multiple Range Test (DMRT) มานานหลายสิบปีแล้ว แต่ที่ในไทย (และหลายประเทศในเอเชีย) ยังเป็นที่นิยมอย่างมาก มีเหตุผลหลัก 2 ข้อ:

มันให้ trt ต่างกันง่าย (High Power): DMRT “ใจดี” มาก มันออกแบบมาให้จับความแตกต่างได้ง่ายกว่าวิธีอื่น ๆ ในกลุ่มเดียวกัน ทำให้เวลาผู้วิจัยใช้ DMRT มักจะได้ตัวอักษร a, b, c, d สวยงาม แบ่งกลุ่มได้เยอะ (ซึ่งนักวิจัยชอบ เพราะดูเหมือนงานวิจัยประสบความสำเร็จ ทรีตเมนต์ให้ผลต่างกันชัดเจน)
ความคุ้นเคยและตำราเก่า: อาจารย์รุ่นก่อน ๆ เรียนและสอนกันมาแบบนี้ และวารสารวิชาการในไทยหลายแห่งก็ยังคุ้นเคยกับการอ่านผล DMRT อยู่ ซึ่งความเคยชินนี้ทำให้นักวิจัยยังคงใช้วิธีนี้ต่อไป

warning ข้อควรระวัง

ความ “ใจดี” ทำให้ trt ต่างกันง่ายของมัน แลกมากับ Type I Error (ผลบวกปลอม - สรุปว่าต่าง ทั้งที่จริงไม่ได้ต่าง) ที่สูงมากเมื่อเทียบกับวิธีอื่น

4 สถานการณ์ที่ไม่แนะนำให้ใช้ DMRT อย่างเด็ดขาด

การทดลองที่มี “จำนวนทรีตเมนต์ (Treatments) เยอะเกินไป”

นี่คือจุดบอดที่ใหญ่ที่สุดของ DMRT ครับ DMRT ไม่สามารถควบคุม Experiment-wise Error Rate ได้ดีเท่าวิธีอื่น
- ทำไมถึงห้าม: ยิ่งคุณมีทรีตเมนต์เยอะ (เช่น เทียบข้าว 10 สายพันธุ์) โอกาสที่ DMRT จะบอกว่า “พันธุ์ที่ 1 กับพันธุ์ที่ 10 ต่างกัน” ทั้งที่จริงๆ มันแค่บังเอิญ จะพุ่งสูงขึ้นทะลุหลัก 10-20% (ทั้งที่คุณตั้ง $\alpha$ ไว้ที่ 0.05)
- ทางออกที่ถูกต้อง: ถ้ามีทรีตเมนต์เยอะ (เกิน 5-6 กลุ่มขึ้นไป) Tukey’s HSD คือมาตรฐานทองคำ (Gold Standard) ที่นักสถิติทั่วโลกยอมรับครับ เพราะ Tukey ควบคุม Type I Error ได้ชะงัดนัก
ข้อมูลที่มี “จำนวนซ้ำไม่เท่ากัน” (Unbalanced Data)

สมมติว่าคุณวางแผนไว้ 4 ซ้ำ (Replications) เท่ากันหมด แต่ตอนเก็บข้อมูลดันมีหนูกัดต้นข้าวตายไป 1 แปลง ทำให้บางทรีตเมนต์เหลือ 3 ซ้ำ
- ทำไมถึงห้าม: สูตรดั้งเดิมของ DMRT ถูกสร้างมาบนสมมติฐานว่าตัวอย่างต้องเท่ากันเป๊ะ (Balanced design) แม้ซอฟต์แวร์บางตัวจะยอมคำนวณให้ (โดยใช้ Harmonic mean มาชดเชย) แต่ค่าความคลาดเคลื่อนจะสูงมาก และผลมักจะเพี้ยน
- ทางออกที่ถูกต้อง: ควรใช้ Least Square Means (LSMeans) หรือ Tukey-Kramer Test ซึ่งออกแบบมาเพื่อจัดการกับ Unbalanced data โดยเฉพาะ
เมื่อเปรียบเทียบทุกกลุ่มกับ “กลุ่มควบคุม (Control)” เท่านั้น

ถ้าจุดประสงค์ของงานวิจัยคุณ ไม่ได้อยากรู้ว่า ปุ๋ยสูตร A ต่างกับ B ไหม แต่อยากรู้แค่ว่า ปุ๋ยสูตร A, B, C, D ต่างจาก “ไม่ใส่ปุ๋ย (Control)” ไหม
- ทำไมถึงห้าม: การใช้ DMRT (หรือ Tukey) จะเป็นการเปรียบเทียบแบบ “จับคู่ทุกคู่” (All pairwise) ซึ่งเป็นการสูญเสีย Power ของสถิติไปโดยเปล่าประโยชน์ และทำให้ตรวจสอบความต่างกับ Control ได้ยากขึ้น
- ทางออกที่ถูกต้อง: ต้องใช้ Dunnett’s Test ครับ สถิติตัวนี้เกิดมาเพื่อเทียบ Treatment ทุกตัวกับ Control โดยเฉพาะ และให้ผลที่แม่นยำกว่ามาก
งานวิจัยสายการแพทย์ หรือที่ต้องการความเข้มงวดสูง (Strict Control)

ถ้าคุณเอา DMRT ไปใช้ในการทดสอบยารักษาโรค หรือการทดสอบสารเคมีตกค้างที่มีผลต่อความปลอดภัยของมนุษย์ เปเปอร์ของคุณมีโอกาสถูกตีตกสูงมากครับ
- ทำไมถึงห้าม: เพราะวงการนี้รับความเสี่ยงเรื่อง Type I Error ไม่ได้ การที่ DMRT บอกว่ายาสองตัวให้ผลต่างกัน ทั้งที่ความจริงไม่ต่าง อาจหมายถึงความเป็นความตายหรือต้นทุนมหาศาล
- ทางออกที่ถูกต้อง: ใช้ Bonferroni correction หรือ Tukey’s HSD ครับ