Content:

  1. จะเชื่อการพยากรณ์จำนวน COVID-19 ค่ายไหนดี
  2. วิธีการพยากรณ์ที่เป็นวิทยาศาสตร์ มีกี่วิธี
  3. ตัวอย่างการพยากรณ์ด้วยวิธี Linear Regression โดยใช้ข้อมูลจริง

จะเชื่อการพยากรณ์จำนวน COVID-19 ค่ายไหนดี

แนวทางการพิจารณา
  1. เขาใช้วิธีการใดหรือใช้สูตรใดในการคำนวณ ซึ่งแต่ละวิธีจะมีสมมุติฐานของวิธีการนั้น เช่น ถ้าคำนวณด้วยวิธีวิเคราะห์ความถดถอย (Regression Analysis) จะมีสมมุติฐานว่าแบบแผนของอนาคตจะเหมือนกับแบบแผนในอดีต เป็นต้น
  2. เขาคำนวณอย่างไร และข้อมูลดิบที่นำมาใช้ นำมาใช้แหล่งใด เป็นแหล่งที่มีความเชื่อถือได้มากน้อยเพียงไร
  3. ถ้าอ่านวิธีการหรือสูตรที่เขานำมาใช้แล้วไม่เข้าใจ ให้ดูความน่าเชื่อถือของแหล่งข้อมูล ว่ามีความน่าเชื่อถือมากน้อยเพียงไร เช่น ถ้าแหล่งข้อมูล คือ องค์การอนามัยโลก หรือ กระทรวงสาธารณสุข หรือมหาวิทยาลัยที่ได้รับการยอมรับ ก็มีความน่าเชื่อถือมากกว่า แหล่งข้อมูลที่ไม่รู้จัก เพราะปกติองค์กรที่น่าเชื่อถือเหล่านี้จะมีระบบการคัดกรอง ตรวจสอบ คุณภาพของเอกสารก่อนที่จะเผยแพร่โดยใช้ชื่อขององค์กร
  4. ถ้าแหล่งข่าวเป็นหนังสือพิมพ์ นอกจากจะอ่านที่พาดหัวข่าวแล้ว ให้อ่านเนื้อความข้างในด้วย เพราะหลายครั้ง หัวข้อข่าวจะพาดให้น่าตื่นเต้น โดยบอกไม่หมด แต่ไปบอกรายละเอียดที่เนื้อในข่าว เช่น หัวข้อข่าวหนังสือพิมพ์ต่างประเทศ พาดหัวข่าวว่า WHO ศึกษาพบว่า COVID-19 สามารถติดต่อแบบ Airborne เตือนบุคลากรทางการแพทย์ให้ระวัง และมีรูปของ ผู้อำนวยการใหญ่องค์การอนามัยโลก แต่พออ่านเนื้อใจกลับพบว่า คนให้สัมภาษณ์ไม่ใช้ ผู้อำนวยการใหญา WHO แต่เป็นหัวหน้าคนหนึ่งในงานควบคุมโรค อ้างการวิจัยว่ามีการทดลอง โดยใช้เครื่องพ่นละอองฝอย พบว่า virus สามารถอยู่ในอากาสได้นาน 3 ชั่วโมง ถ้าอ่านข่าวพาดหัวที่มีรูปของผู้อำนวยการใหญ่องค์การอนามัยโลก ก็จะเชื่อตามนั้น พอไปอ่านรายละเอียดด้านใน กลับเป็นว่า ไวรัสสามารถที่จะแพร่กระจายแบบ Airborne ได้ในบาง Setting ได้แก่ การทำหัตการที่ทำให้เกิด Aerosal generation เช่น การพ่น Neubulizer หรือการทำหัตถการทางทันตกรรม
  5. ถ้าแหล่งข่าวเป็นตัวบุคคล ให้ดูว่าบุคคลดังกล่าว ทำงานเกี่ยวข้องกับเรื่องนั้นๆหรือไม่ และมีความน่าเชื่อถือมากน้อยเพียงไร
  6. ถ้าประเมินจากทุกวิธีดังกล่าวข้างต้นแล้ว ยังไม่แน่ใจ ให้เชื่อสามัญสำนึกและวิจารณญาณของตัวเอง เช่น
    1. มีคนทำนายว่า COVID-19 จะถึงหลักล้าน ในอีก 15 วันข้างหน้า ขณะนี้พบแค่หลักพันต้นๆ จากสามัญสำนึกหรือวิจารณญาณของเราจะบอกว่ามันไม่น่าเป็นไปได้ จากนั้นลองตามไปดูอีกระยะ ผ่านไป 7 วันมันก็แค่หลักพัน เพราะฉะนั้นเวลาที่เหลือคงไม่ถึงหลักล้านแน่
    2. ถ้าวันที่ 1 เมย.63 มีจำนวน COVID-19 จำนวน 1800 ราย จากข้อมูล 6 วันที่ผ่านมี มีผู้ป่วยรายใหม่ 100 คนต่อวัน จากวันที่ 2-15 เมย.63 มีจำนวน 14 วัน ก็น่าจะเพิ่มขึ้น 14 * 100 = 1400 คน ถ้ารวมของเดิม 1800 คน เพิ่มขึ้นอีก 1400 คน ก็น่าจะมีผู้ป่วยสะสมในวันที่ 1 5 เมย.63 จำนวน 3200 ราย ถ้ามีพยากรณ์ว่าจะมีผู้่ติดเชื้อเป็นแสน แต่จากการคำนวณคร่าวๆ มันแค่ 3200 คน วิจารณญาณของเราน่าจะชั่งได้ว่าจะเชื่อข้อมูลใด

วิธีการพยากรณ์ที่เป็นวิทยาศาสตร์ มีกี่วิธี

เทคนิคการพยากรณ์อย่างน้อย มี 3 วิธีคือ
  1. ใช้ diff equation ในวิชา calculus เพื่อพยากรณ์ไปข้างหน้าว่าถ้ามีตัวแปรหนึ่งเปลี่ยนไป ตัวแปรอีกตัวจะเปลี่ยนไปเท่าไร จากนั้นก็สร้าง model ขึ้นมา พอใส่ตัวแปรต่างๆที่เป็นตัวแปรต้นเข้าไป ก็จะคำนวณหาตัวแปรตามออกมาได้ พอมันใช้คณิตศาสตร์ขั้นสูง ประกอบความเป็นจริง ตัวแปรต้นมันก็มีมากมาย และไม่ใช่ว่าตัวแปรต้นนั้นจะคงที่ไปตลอดเวลา การจะพิสูจน์ว่า model ที่นำมาใช้ fit กับสถานการณ์จริงหรือไม่ก็ตอบยาก
  2. Regression analysis เป็นการทำนายที่ง่ายขึ้น ว่าถ้าตัวแปรต้น (x) เปลี่ยนไป ตัวแปรตาม (y) จะเปลี่ยนไปเท่าไร เพื่อหาสมการ y = a+bx มีข้อดีคือง่าย แต่อยู่บนสมมุติฐาน 2 ข้อ คือ 1.ค่าในอนาคตจะเดินไปในทำนองเหมือนอดีต (Futue will follow the past) 2.ต้องเป็นสมการแบบเส้นตรง (y = a+bx ) หรือสมการกำลังสอง (y=a+bx+bx2 ) ถ้าเป็นสมการ Exponential ก็อนุโลมให้ Take logarithm เพื่อปรับให้เป็น Linear แล้วค่อยหาสมการที่เรียกว่า Linear equation การหาค่า a และ b เพื่อนำมาใช้ในสมการ ทำได้ 2 แบบคือ
    1. แบบ static คือนำชุดข้อมูลที่มีอยู่ เช่น ผู้ติดเชื้อ covid-19 ตั้งแต่ วันที่ 1 มีค.63 จนถึง 22 มีค.63 แล้วหาค่า a กับ b แล้วสร้างสมการ
      y = a+bx
      โดย y เป็นจำนวนรายของการติดเชื้อ covid-19, x คือ จำนวนวัน , จากนั้นทำนายไปในอนาคต ว่าอีก 30 วัน 60 วัน น่าจะมีผู้ติดเชื้อเท่าไร โดยไม่มีการเปลี่ยนค่า a และ b หรือ ให้ a และ b คงที่ไปตลอด
    2. แบบ dynamic คือ เมื่อวันที่เพิ่มขึ้น ก็นำเอาข้อมูลที่เพิ่มเข้ามานั้นเข้าไปหาค่า a และ b ใหม่ทุกครั้ง เพื่อสร้างสมการใหม่ ถ้า update ข้อมูลทุกวัน Regression equation ก็เปลี่ยนไปทุกวัน โดยอยู่บนสมมุติฐานว่า ตัวแปรที่มีผลต่อจำนวนรายของ Covid-19 ที่มีมากมายและวัดยาก อีกทั้งมีการแปรเปลี่ยนไปตามพื้นที่และเวลาด้วย เช่น กินร้อน ช้อนกลาง ล้างมือ ใส่ mask ,social Distancing ,Immunity ของชุมชน ทั้งหมดที่กล่าวมาส่งผลโดยรวมทำให้เกิดจำนวนรายของ covid-19 ในแต่ละวันแล้ว ไม่จำเป็นต้องเสียเวลาไปคำนวณหา ยิ่งมีข้อมูลที่มาก (จำนวน n) และ update ค่าให้ค่าในอดีตให้ล่าสุดที่สุด การคำนวณค่าก็จะใกล้เคียงความจริงมากขึ้นปราบใดที่ อนาคตจะเป็นไปตามแบบแผนของอดีตที่ผ่านมา (Future will follow the past trend) กราฟที่อยู่ใน web ของสมาคมส่งเสริมความรอบรู้ด้านสุขภาพไทย (THLA คำนวณด้วยวิธีนี้)
  3. การคำนวณโดยใช้ Technical analysis ใช้มากในตลาดหุ้น ราคาหุ้นจะขึ้นหรือลงมีการทำนาย 2 แบบ
    1. แบบแรกเรียกว่า Fundamental Analysis โดยใส่ค่าตัวแปรพื้นฐานของหุ้นเช่น ภาวะเศรษฐกิจ (GDP) อัตราดอกเบี้ย ฯลฯ จากนั้นก็คำนวณหาราคาหุ้นว่าควรเป็นเท่าไร ในทางปฏิบัติที่สถานการณ์มีการเปลี่ยนแปลงรวดเร็วมากและมีตัวแปรมากมายที่มีผลต่อราคาหุ้น โดยเฉพาะ mass pyschology ที่ไม่รู้จะหาอย่างไร
    2. แบบที่ 2 เรียกว่า Technical Analysis ภายใต้สมมุติฐานว่า ตัวแปรทั้งหมดได้สะท้อนไปที่ราคาปิดของหุ้นในวันนั้น อย่าไปเสียเวลาหาให้มันยุ่งยาก เอาข้อมูลราคาปิดของหุ้นมาวิเคราะห์ ก็สามารถคาดการณ์ราคาหุ้นได้ Technical analysis แนวคิดก็เหมือน Regression คือ Future will follow the past trend

ตัวอย่างการพยากรณ์ด้วย Regression

  1. คำนวณด้วยวิธี Linear Regression โดยเก็บข้อมูลจำนวนผู้ป่วย COVID-19 ของประเทศไทย แหล่งข้อมูลจาก WHO Situation report ที่ประเทศต่างๆต้องรายงาน WHO ทุกวัน โดยให้จำนวนวันที่มีผู้ป่วย COVID-19 สะสม 100 รายเป็นวันที่ 1 (ประเทศไทยวันที่ 14 มีค 63 .พบ Covid-19 จำนวน 82 ราย วันที่ 15 มีค 63 พบ 114 ราย จึงใช้วันที่ 15 มีค 63 เป็นวันที่ 1 วันที่ 16 มีค 63 เป็นวันที่ 2 ไปเรื่อยๆ จนถึงวันปัจจุบันคือวันที่ 1 เมย.63 เป็นวันที่ 18
  2. นำข้อมูลมา plot กราฟ โดยแกน x คือวันที่ , แกน Y เป็นจำนวนผู้ป่วยสะสมของ COVID-19 , แบบแผนของกราฟเป็นแบบ Exponetial ไม่ใช้ Linear ซึ่งผิดสมมุติฐานของ Linear Regression จึงทำการ Take natural Log (Ln) ค่าจำนวนรายผู้ป่วย COVID-19 นำมา plot กราฟระหว่างจำนวนวีน (x) และ ln(y) เส่นกราฟเป็น Linear จึงเข้าได้กับสมมุติฐานของ Linear regression
  3. นำเข้าข้อมูลที่ประกอบด้วย x , y , ln(y) เข้าประมวลผลด้วยโปรแกรม SPSS โดยหา Linear Regression พบว่า
    1. ค่า ln(y) สัมพันธ์กับค่า x อย่างมีนัยสำคัญทางสถิติ (R2 = 0.957 หรือ ค่า x สามารถอธิบายค่า ln(y) ได้ 95.7%
    2. ค่า constant หรือค่า a = 4.805 ค่าสัมประสิทธิ์ หรือ ค่า b=0.165 เพราะฉะนัน Regression Equation จึงเป็น
      ln(y) = 4.805 + 0.165 x
  4. copy ข้อมูลจำนวนวัน (x) และจำนวนผู้ติดเชื้อ COVID-19 จาก SPSS มา paste ที่โปรแกรม excel (ดูภาพด้านล่างประกอบ)
    • Column A คือค่า Date
    • Column B คือค่า X (คือวันที่เริ่มจากวันที่ 1 คือวันที่พบ case ประมาณ 100 ราย)
    • Column C คือ ค่า y (จำนวนรายสะสมของ Covid-19)
    • Column D คือ Natural Log ของ y (ln y)
    • Column E 8nv ค่าที่ได้จาก Forecast โดยหาจาก สมการ ln(y) = 4.805 + 0.165 x.
    • Column F คำนวณโดยหาค่า Exp (ln(y))
    • Column G คือค่า Forecast เกินจริง โดยนำค่า Column F ลบด้วย Column C
  5. ทำการ Forecast จากวันที่ 2 เมย.63 ที่เป็นวันที่ถัดจากวันที่ใช้ข้อมูลจริงวันสุดท้าย ไปถึงวันที่ 15 เมย.63 ค่า x จะเพิ่มจากวันที่ 19 ถึงวันที่ 32 จากนั้น copy สูตรการหาค่า ln(y) และ Exp(ln(y)) เพื่อหาค่าพยากรณ์ของผู้ป่วย Covid-19 จนถึงวันที่ 15 เมย.63 ซึ่งพยากรณ์ไว้เท่ากับ 23,981 ราย
  6. ข้อจำกัดของการศึกษา (limitation) ว่า ค่าพยากรณ์ในวันสุดท้ายคือวันที่ 1 เมย.63 ที่คำนวณจาก Regression Equation = 2380 ราย โดยที่จำรวนรายที่แท้จริงเท่ากับ 1771 ราย หรือค่าพยากรณ์มากเกินไป 609 ราย ซึ่งมากไป 34.4% ซึ่งถ้ายังไม่มีการปรับค่า a และ b ในสมการ จะสะสมความคลาดเคลื่อนในทิศทางที่การพยากรณ์มากกว่าความเป็นจริงไปเรื่อยๆ ค่าพยากรณ์ที้ได้จึงไม่น่าสอดคล้องกับความเป็นจริง