ผ่าระบบ AI ทำงานแบบไหน? จะคัดกรองคนได้รับ 5,000 จาก 20 ล้านคนให้เหลือ 9 ล้านคนอย่างไร? ถ้าไม่มีฐานข้อมูลที่ถูกต้องหรือครบถ้วน ต่อให้ AI วิเศษที่ไหนก็ทำงานไม่ได้
สาระสำคัญ : หลัการสำคัญ AI จะทำงานได้ถูกต้องต้องมี ฐานข้อมูล และต้องเป็น ฐานข้อมูลที่ถูกต้องด้วย , ไม่มีฐานข้อมูล AI วิเศษที่ไหนก็ทำงานไม่ได้ , มีฐานข้อมูลผิด AI ก็ทำงานผิดได้ , คำถามคือรัฐมีฐานข้อมูลแค่ไหน เป็น Big Data หรือยัง? และ ถ้าไม่มีหรือมีบางส่วน AI ก็ทำได้แค่ จับคู่ (matching)ข้อมูลที่มี คนลงทะเบียน 20 ล้านคน อาจจะถูกเข้าเกณฑ์เยียวยาตามแผน 10 ล้านคนที่ตรวจสอบได้จากระบบพื้นฐานที่มี อีก10 ล้านจะเป็นแบบสุ่ม(มั่ว)
1.จากเดิมที่คลังประมาณตัวเลขจ่ายชดเชยในส่วนของผู้ประกอบอาชีพอิสระที่ 3 ล้านคน แต่พอประกาศให้ลงทะเบียนตัวเลขล่าสุดปรากฏที่ 20 ล้านคน มากกว่าที่กำหนดไว้ถึง 7 เท่า!! ก็เลยมีการขยับตัวเลขใหม่จาก 3 ล้านคนเป็น 9 ล้านคน
- ยกมือถาม 3 คำถาม : คำถามแรกผู้ประกอบอาชีพอิสระที่แท้จริงที่ได้รับผลกระทบ (ซึ่งเป็นกลุ่มเป้าหมายหลักที่ต้องการช่วยเหลือ)และไม่มีข้อมูลอยู่ในระบบประกันสังคม จะตรวจสอบกันอย่างไร , คำถามที่สอง ตัวเลข 3 ล้าน และ 9 ล้านคนที่เพิ่มขึ้นมาจากไหน? ประเมินกันอย่างไร? และคำถามที่สาม ข้อมูลของคนไทย 20 ล้านคน ซึ่งเป็นข้อมูลระดับ Bid Data ของประเทศจะอยู่ในมือของ”เอกชน” ที่มารับดูแลระบบหรือไม่? (คำถามนี้ยังไม่สำคัญตอนนี้แต่ต่อไปจะสำคัญมาก)
3.มีคำตอบว่า จะคัดกรองด้วยระบบ AI จาก 20 ล้านคน คัดกรองเหลือ 9 ล้าน จะมีคนไม่ได้ 11 ล้านคน ระบบที่ดีต้องไม่ให้เกิดกรณีต่อไปนี้ ก) ได้แบบไม่ควรได้ และ ข) ควรได้แต่ไม่ได้ จึงเกิดความสงสัยอีกว่าระบบ AI จะคัดกรองได้อย่างไร? ก็เลยต้องไปหาความรู้จากผู้รู้ว่าระบบ AI มีวิธีทำงานอย่างไร
- ระบบ AI (Artifitial Intelligent) มีระบบการทำงานดังต่อไปนี้ (โดยหลักการง่ายแบบที่ชาวบ้านเข้าใจได้) คือ 1. ระบบจัดเก็บข้อมูล (Big Data) (ในฐานข้อมูลที่รัฐมี) 2. ระบบจัดเก็บและคัดกรอง (Online) 3. ระบบวิเคราะห์ และ 4. ระบบแสดงผลวิเคราะห์
หลักการสำคัญ AI จะทำงานได้ถูกต้อง ต้องมีฐานข้อมูลและต้องเป็นฐานข้อมูลที่ถูกต้องด้วย ไม่มีฐานข้อมูล AI วิเศษที่ไหนก็ทำงานไม่ได้ มีฐานข้อมูลผิด AI ก็ทำงานผิดได้ การคัดกรองจะได้ผลดีหรือไม่ขึ้นอยู่กับข้อมูลในระบบจัดเก็บข้อมูลของรัฐ ว่า รัฐมีข้อมูลของผู้ได้รับผลกระทบของโควิด-19จริง ๆเพียงพอหรือเปล่า และข้อมูล Fact Data ทั้งหมดต้องจัดเรียงในรูปแบบของ Big Data ข้อมูลจะมีที่เก็บ 2 ถัง คือ ถัง 1 เป็นข้อมูลจริงที่รัฐมี (เช่น ประกันสังคม, ทะเบียนราษฏร์, สรรพากร, ชิมช้อปใช้, 30 บาท ฯลฯ) , ถัง 2 เป็นข้อมูลที่คนลงทะเบียนจากทางเว็บไซต์ และข้อมูลผ่านแพลตฟอร์มออนไลน์อื่น ๆ (จริง ๆไม่ว่าทางไหนระบบ AI จริง ๆจะสามารถดึงข้อมูลมาเก็บเปรียบเทียบได้) (ข้อมูลส่วนนี้นอกจาก เช่น ที่รัฐให้ลงทะเบียน 20 ล้านคน ก็สามารถมาจากข้อมูล Big Data ของเอกชน เช่น Facebook, Google, Youtube, IG, Twitter, Line, Pantip ฯลฯ) ข้อมูลในถังแรกของรัฐ คือ Fact Data แต่ข้อมูลในถังที่สอง อาจมีทั้ง Fact Data หรือ Fake Data (เช่น พวกอวตาร, account ปลอม)
การวิเคราะห์เพื่อหาข้อมูลผู้ที่ได้รับผลกระทบจริง ถ้าทั้งสองถังมีแต่ Fact Data จะไม่มีปัญหา AI จะสามารถดำเนินการในขั้นที่สาม คือวิเคราะห์ว่าข้อมูลนั้น ๆถูกต้องตรงตามที่ลงทะเบียนมาหรือไม่ได้ทันที แต่ถ้ามีทั้ง Fact Data และ Fake Data ก็จะยุ่งยากขึ้น เช่น คนที่กรอกข้อมูลว่าได้รับผลกระทบ แล้วไปโพสต์ในโซเซียลว่าตัวเองได้รับผลกระทบต่าง ๆนานา AI ก็อาจประเมินว่าเป็นผู้ได้รับผลกระทบที่เข้าเกณฑ์ทั้ง ๆ ที่จริง ๆ แล้วอาจไม่ได้รับผลกระทบตามที่รัฐอยากช่วยก็ได้
5.ประเด็นคือ “ระบบ AI” ที่รัฐเอามาทำ สามารถดึงข้อมูลเหล่านี้ ซึ่งส่วนมากเป็นของเอกชน (ต่างชาติ) เพื่อมาเปรียบเทียบและคัดกรองได้หรือไม่ ประเด็นต่อมาคือ มีช่องโหว่ตรงรายได้ของคนหาเช้ากินค่ำจริง ๆ คนที่ใช้ออนไลน์ไม่เป็น พูดง่ายคือ ข้อมูลในถังแรกว่า รัฐมีข้อมูลที่ทำเป็น Big Data ครบหรือไม่
ประเด็นทางเทคนิคปลีกย่อยก็คือ สำหรับถังที่สอง รัฐอาจจะไม่ดึงข้อมูลออนไลน์ด้วย AI ได้เนื่องจาก AI ที่มีอยู่ยังไม่รู้จักภาษาไทย 100% ซึ่งคนที่เขียนโปรแกรม AI จะต้องสอนเบื้องต้น แค่รู้จักตัวอักษรแต่ ยังไม่รู้ความหมาย.(จึงเป็นคำอธิบายว่าทำไมการตรวจสอบ Fake news ของกระทรวงดิจิทัลถึงล้มเหลวไม่เป็นท่า)
- เพราะฉะนั้น เป็นไปได้ที่ AI ในระบบนี้น่าจะเป็นแค่การจับ Matching คำเหมือน >> เช่น ชื่อ หรือ ตัวเลขรายได้ แล้วก็ให้ระบบมันวิเคราะห์ออกมาเลย ดังนั้นวิธีการทำงานของ AI ของรัฐ คือใช้วิธีการ Matching เช่น ถ้าเจอในระบบเสียภาษีหรือประกันสังคม แล้วคัดออกมา หรือตัดออก(กรณีซ้ำซ้อน) นอกจากนั้น คือ คนที่ไม่มีชื่อในฐานข้อมูล ก็จะเกิดความมั่ว และ ช่องทางมั่ว ๆ ส่วนที่ไม่มีฐานข้อมูล ใครจะพูดอะไรก็ได้ จะตอบอะไรได้ จะสามารถทุจริตได้เลย
- นอกจากนี้ระบบตรวจสอบคัดกรองผู้ได้รับผลกระทบจากโควิด19จริงๆ ต้องได้รับความร่วมมือข้อมูลจากหลายหน่วยงาน เช่น
1.) ฐานข้อมูลประกันสังคม เงื่อนไขที่คนที่มีสิทธิ์ได้รับ อันนี้ชัดเจนอยู่แล้ว ใครไม่เข้าสิทธิ์ตัดออก ระบบใช้วิธี matching
2.) ฐานข้อมูลกระทรวงพาณิชย์ เพื่อเช็ค คนที่เป็นเจ้าของกิจการ ถ้ามีชื่อมาลงทะเบียน ตัดออก เพราะจะไปอยู่ในมาตรการเยียวยาข้ออื่น
3.) เทศกิจ ที่มีรายชื่อของแม่ค้าแผงลอยทั่วประเทศ (ไม่แน่ใจว่าหน่วยงานไหนรับผิดชอบ) ต้องเอาข้อมูล Big Data มาลง เพื่อจะได้รู่ว่าคนเหล่านี้ได้รับผลกระทบจริง
4.) กระทรวงพัฒนาสังคม เช่น แผนที่เดินดิน จะมีข้อมูลของคนที่สังคมการปกครองส่วนท้องถิ่นอยู่ว่าคนนี้ทำอาชีพอะไร รายได้เท่าไหร่ เป็นข้อมูลที่กระทรวงพัฒฯควรทำไว้
5.) กรมขนส่ง เช่น พวกรถแท็กซี่ ได้รับผลกระทบด้วยหรือไม่ หรือกรณีลงทะเบียนรับสิทธิ แต่มีชื่อเป็นเจ้าของรถหรูนำเข้า
6.) กรมสรรพากร ที่มีตัวเลขแน่นอนที่สามารถ match ได้
7.) ฐานข้อมูลทะเบียนราษฎร์จากกระทรวงมหาดไทย
ทีนี้ในทั้งหมดทุกกระทรวง หน่วยงานที่ต้องร่วมมือกันทำฐานข้อมูลตรงนี้ขึ้นมา คำถามคือข้อมูลเหล่านี้เป็น Big Data หรือไม่
8.ถ้าไม่มีหรือมีบางส่วนเช่น คนลงทะเบียน 20 ล้านคน อาจจะถูกเข้าเกณฑ์เยียวยาตามแผน 10 ล้านคนที่ตรวจสอบได้จากระบบพื้นฐานที่มี อีก 10 ล้านจะเป็นแบบสุ่ม(มั่ว)
อีกไม่กี่วันก็คงเป็นที่ประจักษ์ว่า จะเห็นประชาชนได้รับความช่วยเหลือ หรือได้รับเคราะห์ซ้ำกรรมซัดเพราะการวางแผนงานที่ไม่เป็นระบบและไม่ได้คิดให้ครอบคอบก่อนลงมือปฏิบัติ