Kanth's Playbook | วิธีการทดสอบ Paired T-Test และ Wilcoxon Signed-Rank Test ในงานเกษตร

บ่อยครั้งในทางการเกษตร เมื่อเราทำการทดลองเพื่อเปรียบเทียบ “วิธีการใหม่” กับ “วิธีการดั้งเดิมของเกษตรกร” ในระดับการประเมินเทคโนโลยี (Technology Verification)มักเผชิญปัญหาความแปรปรวนของพื้นที่

เนื่องจากสภาพแวดล้อมในแปลงของเกษตรกรแต่ละรายมีความแตกต่างกัน (เช่น แปลงที่ 1 ดินอุดมสมบูรณ์มาก แปลงที่ 10 เป็นดินทรายไม่อุ้มน้ำ) การนำค่าเฉลี่ยของผลผลิตหรือการเจริญเติบโตของทั้ง 12 รายมาเทียบกันโดยตรง อาจทำให้เกิดความคลาดเคลื่อนจากปัจจัยสภาพพื้นที่ได้ นักวิจัยจึงนิยมเลือกใช้ การทดสอบแบบจับคู่ (Paired Comparison) เพื่อลดอคติจากความแตกต่างทางสภาพแวดล้อมเหล่านี้

เลือกใช้สถิติแบบไหนดี?

ในการวิเคราะห์ข้อมูลแบบจับคู่ เรามักจะเลือกระหว่างสถิติ 2 ตัวหลักๆ ขึ้นอยู่กับลักษณะการแจกแจงของข้อมูล (Data Distribution):

Paired T-test (Parametric): หากข้อมูลที่เก็บมา (เช่น ผลผลิตต่อไร่, ความสูงของต้น) มีการกระจายตัวแบบปกติ (Normal Distribution) สถิติตัวนี้จะช่วยให้นักวิจัยมองเห็น “ส่วนต่างเฉลี่ย” ที่เพิ่มขึ้นหรือลดลงอย่างชัดเจน
Wilcoxon Signed-Rank Test (Non-parametric): หากข้อมูลเป็นประเภทลำดับขั้น (Ordinal) เช่น คะแนนความเข้มของสีใบ (ระดับ 1-6) หรือข้อมูลที่มีการแจกแจงไม่ปกติ (Non-normal Distribution) เพราะสามารถช่วยยืนยันได้ว่า “วิธีใหม่” ให้ผลลัพธ์ที่ดีกว่า “วิธีของเกษตรกร” อย่างมีนัยสำคัญหรือไม่ โดยไม่ต้องสนใจ assumption เรื่องการแจกแจงปกติ

ตัวอย่างการวิเคราะห์ด้วย R (R Code Example)

ด้านล่างนี้คือตัวอย่างการจำลองข้อมูลเปรียบเทียบคะแนนความเข้มสีใบพืช (ระดับ 1-6) ระหว่างวิธีของเกษตรกรและวิธีการใหม่ พร้อมการแสดงผลด้วยกราฟและการตั้งสมมติฐานทางสถิติ

# โหลดแพ็กเกจที่จำเป็นสำหรับการจัดการข้อมูลและสร้างกราฟ
library(dplyr)
library(tidyr)
library(ggplot2)

# 1. เตรียมข้อมูลจำลอง (Mockup Data)
# สมมติเราลงพื้นที่ประเมินเกษตรกร 12 ราย วัดค่าความเข้มสีใบ (คะแนน 1-6)
set.seed(123) # ล็อคค่าสุ่มเพื่อให้ผลรันเหมือนเดิมทุกครั้ง

data <- data.frame(
  Farmer_ID = paste0("Farmer_", 1:12),
  Farmer_Method = c(3, 4, 3, 2, 4, 3, 3, 4, 2, 3, 4, 3), # วิธีของเกษตรกร
  Our_Method = c(4, 5, 4, 3, 5, 4, 4, 6, 3, 4, 5, 4)     # วิธีการทดลองใหม่
)

# 2. จัดรูปแบบข้อมูลดิบจาก Wide เป็น Long format สำหรับสร้างกราฟ
data_long <- data %>%
  pivot_longer(cols = c("Farmer_Method", "Our_Method"),
               names_to = "Method",
               values_to = "Score") %>%
  mutate(Method = factor(Method, levels = c("Farmer_Method", "Our_Method"),
                         labels = c("วิธีเกษตรกร", "วิธีใหม่")))

# 3. สร้างกราฟแสดงผลแบบคู่ (Slope Graph / Paired Plot)
# ช่วยให้เห็นแนวโน้มการเปลี่ยนแปลงของเกษตรกรแต่ละรายได้ชัดเจนขึ้น
ggplot(data_long, aes(x = Method, y = Score, group = Farmer_ID)) +
  geom_point(aes(color = Method), size = 4, alpha = 0.8) +
  geom_line(color = "gray60", alpha = 0.6, linewidth = 0.8) +
  theme_minimal(base_size = 14) +
  labs(title = "เปรียบเทียบระดับความเข้มสีใบของพืช (รายแปลง)",
       subtitle = "เส้นเชื่อมแสดงความแตกต่างภายในแปลงของเกษตรกรรายเดียวกัน",
       x = "วิธีการปลูก",
       y = "คะแนนความเข้มสีใบ (1-6)") +
  scale_color_manual(values = c("วิธีเกษตรกร" = "#E69F00", "วิธีใหม่" = "#009E73")) +
  theme(legend.position = "none")

# 4. การประเมินผลทางสถิติ
# เนื่องจากข้อมูลลักษณะนี้เป็นระดับคะแนน (Ordinal score 1-6)
# การใช้ Wilcoxon Signed-Rank Test แบบจับคู่จึงเป็นวิธีที่เหมาะสมที่สุด
wilcox_result <- wilcox.test(data$Our_Method, data$Farmer_Method, paired = TRUE)
wilcox_result

# อย่างไรก็ตาม หากข้อมูลเป็นตัวเลขความต่อเนื่อง (เช่น น้ำหนัก, ส่วนสูง)
# และแจกแจงแบบปกติ สามารถใช้ Paired t-test ได้ดังนี้
t_result <- t.test(data$Our_Method, data$Farmer_Method, paired = TRUE)
t_result

การแปลผลลัพธ์ (Interpretation)

จากโค้ดด้านบน หากค่า p-value ที่ได้จากสถิติ wilcox.test หรือ t.test มีค่าน้อยกว่าระดับนัยสำคัญที่เราตั้งไว้ (เช่น p < 0.05) สามารถสรุปได้ว่า “วิธีการใหม่” ทำให้พืชมีแนวโน้มความเข้มสีใบสูงกว่า “วิธีการของเกษตรกร” อย่างมีนัยสำคัญทางสถิติ ซึ่งเป็นหลักฐานที่ช่วยยืนยันความสำเร็จของการทดสอบเทคโนโลยีนี้ได้อย่างเป็นรูปธรรม