อะไรอยู่เบื้องหลังการวิเคราะห์ข้อมูลที่ดี

106 views
7 mins
July 3, 2024

          ‘Data is the new oil.’ หรือ ‘ข้อมูลคือทรัพยากรที่แสนมีค่าอันใหม่’ เป็นประโยคอันโด่งดังที่ ไคลฟ์ ฮัมบี (Clive Humby) นักคณิตศาสตร์ชาวอังกฤษพูดไว้เมื่อปี 2006 ในวันที่ข้อมูลกลายมาเป็นทรัพยากรใหม่อันมีค่า ใครมีอยู่ในครอบครองก็เปรียบเหมือนประเทศที่มีน้ำมันให้ขุดอยู่ใต้ดิน

          หลังจากนั้นประโยคนี้ก็ถูกยกมาพูดซ้ำๆ เพื่อตอกย้ำถึงความสำคัญและมูลค่าของข้อมูลอยู่เสมอ ถึงแม้ว่ามนุษยชาติจะใช้ข้อมูลเพื่อประกอบการตัดสินใจมาตั้งแต่โบราณกาล แต่ด้วยข้อจำกัดทางเทคโนโลยีจึงทำให้การใช้ประโยชน์จากข้อมูลเป็นไปได้อย่างจำกัด ลองนึกถึงกรณีของ ฟลอเรนซ์ ไนติงเกล ที่ใช้ข้อมูลผู้ป่วยมาช่วยออกแบบการจัดการในโรงพยาบาลสนาม แต่ลองนึกภาพว่าถ้าเธอต้องออกแบบระบบสาธารณสุขทั้งประเทศ ทั้งภูมิภาค การทำโดยปราศจากเครื่องทุ่นแรงอย่างคอมพิวเตอร์จึงแทบเป็นไปไม่ได้

          จนกระทั่งเมื่อเวลาผ่านไป ทุกภาคส่วนไม่ว่าจะเป็นภาครัฐหรือภาคเอกชนก็เริ่มเก็บสะสมข้อมูลในฐานะทรัพยากรที่แสนสำคัญ ด้วยความหวังว่าการมีข้อมูลจะทำให้สามารถตัดสินใจสิ่งต่างๆ ได้อย่างถูกต้อง แต่ก็พบว่าแค่มีข้อมูลอย่างเดียวนั้นไม่พอ การมีข้อมูลจำนวนมากอยู่ในมือแต่ไม่สามารถใช้มันได้อย่างมีประสิทธิภาพนั้นไม่มีความหมายอะไร จนทำให้มีประโยคใหม่ที่ถูกพูดถึงกันมากขึ้นแทนความเชื่อเรื่อง ‘ข้อมูลคือทรัพยากรที่แสนมีค่า’ ว่า ‘Data was the new oil, analysis is’ หรือแปลว่า ข้อมูลเคยเป็นทรัพยากรที่แสนมีค่า แต่ตอนนี้ทรัพยากรที่แสนมีค่านั้นกลายเป็นการวิเคราะห์ต่างหาก

          พีระมิด DIKW ถูกใช้เพื่ออธิบายขั้นตอนการวิเคราะห์ข้อมูลตั้งแต่เริ่มต้นหลังจากได้ข้อมูลมา โดยเราเริ่มต้นจากข้อมูล (Data, D) คือพื้นฐานที่สุด มันคืออะไรก็ได้ที่ถูกเก็บมาดิบๆ สมมติว่านักเรียนกำลังทำสนใจเรื่องปริมาณขยะของแต่ละห้องเรียน แล้วทำการเก็บค่าปริมาณขยะของห้องเรียนแต่ละห้อง สิ่งนี้คือข้อมูลซึ่งเป็นฐานของพีระมิด คือเก็บมาเฉยๆ ต่างคนต่างจดลงกระดาษเป็นตัวเลขเยอะแยะไปหมด ยังไม่ได้ถูกจัดระเบียบ เอาไปใช้ตัดสินใจหรือสร้างประโยชน์อะไรไม่ได้

อะไรอยู่เบื้องหลังการวิเคราะห์ข้อมูลที่ดี
Photo: Davoy

          ขั้นต่อมาคือสารสนเทศ (Information, I) ซึ่งคือการเอาข้อมูลมาจัดให้เป็นระบบระเบียบ เช่น การเอาข้อมูลปริมาณขยะที่ต่างคนต่างจดมาได้นั้น ทำเป็นตารางชัดเจนแยกเป็นห้อง เป็นชั้น จัดกลุ่มตามวันเวลา การมีสารสนเทศจะทำให้เราเริ่มเห็นแนวโน้มหรือพฤติกรรมบางอย่างมากกว่าตอนที่มันเป็นเพียงข้อมูลเฉยๆ 

          ขั้นต่อมาคือความรู้ (Knowledge, K) ความรู้คือสิ่งที่เราได้จากวิเคราะห์สารสนเทศ มันอาจจะเป็นความเข้าใจใหม่ๆ ที่เราไม่เคยรู้มาก่อน หรือสิ่งที่ช่วยตอกย้ำสมมติฐานที่เราตั้งไว้ เช่น จากข้อมูลอาจจะพบว่าในวันศุกร์นั้นห้องเรียนจะมีขยะเยอะเป็นพิเศษ หรือนักเรียนชั้นมัธยมปลายมีแนวโน้มจะแยกขยะได้ไม่ถูกต้องเท่ามัธยมต้น สิ่งเหล่านี้ไม่สามารถมองเห็นได้ทันทีจากการมองข้อมูล แต่ต้องเกิดจากการวิเคราะห์ และสกัดมันออกมา

          และขั้นสุดท้ายซึ่งเป็นยอดของพีระมิดนั่นคือปัญญา (Wisdom, W) ซึ่งคือการนำความรู้ที่ได้จากการวิเคราะห์ไปลงมือแก้ปัญหา การพบขยะจำนวนมากในวันศุกร์อาจนำไปสู่การเพิ่มจำนวนถังหรือถุงขยะ และการพบว่านักเรียนมัธยมปลายไม่ค่อยแยกขยะอาจจะนำมาสู่การเพิ่มความเข้มข้นของการรณรงค์ เราอาจพูดให้เห็นภาพขึ้นก็ได้ว่าขั้นนี้คือการออก action หรือตัดสินใจบางอย่างบนฐานของข้อมูล ซึ่งถ้ามองด้วยกรอบความคิดแบบพีระมิดนี้ ลำพังแค่ข้อมูลก็คงไม่ใช่ทรัพยากรจริงๆ อย่างที่หลายคนพูดเอาไว้ ยิ่งในโลกที่ข้อมูลมีอยู่มหาศาล การสกัดเอาความรู้และปัญญาออกมาจากมหาสมุทรข้อมูลที่มีอยู่ได้นั้นต้องอาศัยการวิเคราะห์ที่ดีมากพอ

          เครื่องมือวิเคราะห์ข้อมูลที่ดีที่สุดที่เรามีคือสถิติ แม้ว่าทุกวันนี้จะมีการใช้การเรียนรู้ด้วยเครื่อง (machine learning) หรือปัญญาประดิษฐ์ (artificial intelligence) เข้ามาช่วยวิเคราะห์ข้อมูลแต่สุดท้ายพื้นฐานของมันก็คือสถิติทั้งนั้น ในอดีตเราอาจจะต้องคำนวณค่าทางสถิติด้วยมือ แทนค่าลงในสูตร บวกลบคูณหาร ก่อนจะได้คำตอบออกมา แต่ทุกวันนี้เรามีโปรแกรมสำเร็จรูปต่างๆ ที่ช่วยให้การวิเคราะห์ข้อมูลนั้นง่ายขึ้นกว่าแต่ก่อนมาก ไม่ว่าจะเป็นโปรแกรมพื้นฐานอย่าง Excel ไปจนถึงโปรแกรมที่พวกนักวิเคราะห์ข้อมูลอาชีพเขาใช้กันอย่าง SQL หรือการเขียนภาษา Python ที่ช่วยให้ใครสักคนสามารถเป็นนักวิเคราะห์ข้อมูลได้อย่างง่ายดาย แต่ความง่ายดายนี้เองก็เป็นดาบสองคม

          ทุกวันนี้ไม่น่ามีใครไม่เคยใช้แอปพลิเคชันแผนที่และระบบนำทางในโทรศัพท์ มันง่ายและแสนสะดวก ต่างจากสมัยก่อนที่ต้องอ่านแผนที่บนกระดาษลิบลับ แค่เพียงใส่จุดเริ่มต้นและปลายทาง ระบบก็จะแนะนำเส้นทางที่ดีที่สุดออกมาให้เรา ทุกอย่างง่าย สะดวก สบาย ผมเองก็เคยคิดแบบนั้นจนกระทั่งครั้งหนึ่งที่ผมให้แอปพลิเคชันแผนที่แนะนำเส้นทางเดินไปสถานที่ท่องเที่ยวใจกลางเมืองหนึ่งในยุโรป ตอนนั้นผมเมื่อยสุดๆ จากการเดินมาทั้งวันจนคิดว่า “หรือควรจะรอรถเมล์…” แต่แอปพลิเคชันแผนที่บอกว่าเดินแค่นิดเดียว เพียงพ้นโค้งนี้ไปก็ถึงที่หมายแล้ว ผมจึงเชื่อและตัดสินใจเดิน ผลคือผมคิดผิด ระยะทางมันใกล้จริง แต่ทางเดินชันมาก ผมลืมเสียสนิทเลยว่าเมืองที่ผมเที่ยวอยู่นั้นมันเต็มไปด้วยเนินเขา และใช่ฮะ ทางที่แผนที่เลือกให้ผมเป็นทางที่ต้องเดินขึ้นเนินเขาที่แสนจะชัน

อะไรอยู่เบื้องหลังการวิเคราะห์ข้อมูลที่ดี

          คำถามที่เกิดขึ้นในหัวผมทันทีเลยก็คือ แอปพลิเคชันไม่มีข้อมูลเรื่องความชันของเส้นทางหรือ และเมื่อลองค้นหาในอินเทอร์เน็ต พบว่าชาวเน็ตเองก็เสียงแตก บางคนบอกว่าไม่มี แอปพลิเคชันไม่รู้เรื่องความสูงต่ำ ในขณะที่บางคนก็บอกว่ามันรู้ เขาเคยลองกดดูเมื่อเดินขึ้นเขาลงเขาไปกลับด้วยเส้นทางเดียวกัน แต่แอปพลิเคชันกลับบอกเวลาไม่เท่ากัน สรุปคือผมก็ไม่รู้อยู่ดีว่าแอปพลิเคชันนำความสูงไปประมวลผลตอนที่เลือกเส้นทางให้ผมด้วยรึเปล่า ถ้านำไปใช้จริง มันเอาข้อมูลไปใช้อย่างไร ปัญหานี้เกิดจากการที่แอปพลิเคชันบอกเราแค่ผลลัพธ์ นั่นคือเส้นทางที่ดีที่สุด แต่ไม่ได้บอกว่าไอ้เจ้าเส้นทางที่ดีที่สุดนั้นคิดมาจากอะไร

          การวิเคราะห์ข้อมูลด้วยโปรแกรมสำเร็จรูปก็เช่นกัน หลายคนใช้โปรแกรมเหล่านี้เหมือนกับตอนที่ผมใช้แอปพลิเคชันนำทาง นั่นคือโปรแกรมบอกอะไรมาก็เชื่อ และทึกทักว่าสิ่งนั้นเป็นสิ่งที่ดีที่สุดไปเสียหมด ทั้งที่ความจริงแล้วมันอาจไม่เป็นอย่างนั้น สิ่งเดียวที่ต่างกันระหว่างแอปพลิเคชันนำทางกับการวิเคราะห์ข้อมูลด้วยโปรแกรมสำเร็จรูปก็คือ อันแรกเราไม่มีทางแงะข้างในมันออกมาดูได้ เพราะเป็นความลับของแอปเขา ในขณะที่อย่างหลังนั้นจริงๆ แล้วเราแงะออกมาทำความเข้าใจได้

          การหาค่าเฉลี่ยเป็นเครื่องมือการวิเคราะห์ข้อมูลอย่างแรกๆ ที่นักเรียนมักจะถูกสอนให้ใช้ ประโยชน์ของมันคือช่วยสรุปข้อมูลจำนวนมากๆ ให้เหลือตัวเลขเพียงตัวเดียวเพื่อเอาไปเปรียบเทียบและตีความต่อได้ ไม่ใช่แค่ในบทเรียนการวิเคราะห์ข้อมูล แต่ค่าเฉลี่ยเป็นค่าที่ทุกคนดูจะสนใจเป็นพิเศษ รายได้เฉลี่ย ปริมาณขยะอาหารโดยเฉลี่ย ขนาดครัวเรือนโดยเฉลี่ย อัตราการเสียชีวิตเฉลี่ย คำพวกนี้ปรากฏอยู่ในหน้าสื่ออยู่เสมอ ราวกับว่าค่าเฉลี่ยเป็นของวิเศษที่ใช้บอกค่ากลางของข้อมูลทุกชุดในโลกนี้ได้แบบครอบจักรวาล ซึ่งเป็นความเข้าใจที่ผิด

          เมื่อปี 1997 กรมอุตุนิยมวิทยาของสหรัฐอเมริกาคาดการณ์ว่าแม่น้ำเรดของรัฐนอร์ทดาโคตาจะมีระดับน้ำสูงสุดที่ 49 ฟุต ซึ่งเป็นระดับน้ำที่สูงที่สุดที่เคยเกิดขึ้นในเหตุการณ์น้ำท่วมครั้งล่าสุดในปี 1979 เจ้าหน้าที่ในแกรนด์ฟอร์กส์จึงวางแผนการจัดการน้ำท่วมอิงตามตัวเลขเดียวนี้โดยไม่ได้พิจารณาถึงความผันผวนที่จะเกิดขึ้น ผลที่เกิดคือบางจุดของแม่น้ำนั้นสูงไม่ถึง 49 ฟุตจริง แต่ระดับน้ำในแม่น้ำสูงสุดที่แกรนด์ฟอร์กส์อยู่ที่ 54 ฟุต ส่งผลให้นายแพทย์โอเวนส์ นายกเทศมนตรีเมืองแกรนด์ฟอร์กส์ ต้องสั่งอพยพประชาชนกว่า 50,000 คน เนื่องจากพื้นที่ขนาดใหญ่ถูกน้ำท่วม  เกิดเพลิงไหม้ครั้งใหญ่ใจกลางเมืองแกรนด์ฟอร์กส์  ไฟไหม้กินพื้นที่อาคาร 11 หลังคาเรือนและห้องพักอาศัย 60 ยูนิต แม้ในท้ายที่สุดผู้ที่ได้รับผลกระทบจากน้ำท่วมในสหรัฐฯ ได้รับเงินบริจาคจากทั่วประเทศ รวมถึงความช่วยเหลือด้านการเงินจากรัฐบาลกลางเป็นมูลค่าหลายพันล้านดอลลาร์ แต่เจ้าหน้าที่เมืองและผู้พยากรณ์น้ำท่วมถูกวิพากษ์วิจารณ์ถึงความแตกต่างระหว่างการประมาณการและระดับน้ำท่วมที่เกิดขึ้นจริง

Photo: Tony Mutzenberger/U.S. Geological Survey
Photo: Tony Mutzenberger/U.S. Geological Survey

          เรื่องนี้ไม่มีอะไรซับซ้อนไปมากกว่าการตกหลุมพรางของค่าเฉลี่ย ถ้าเราย้อนไปดูวิธีการคำนวณค่าเฉลี่ยให้ดี ๆ จะพบว่ามันคือการเอาข้อมูลทุกค่ามาบวกกันแล้วหารด้วยจำนวนข้อมูล ดังนั้นค่าที่ได้ออกมาจะอยู่ตรงกลางในเชิงระยะห่างจากข้อมูลตัวอื่นๆ ดังนั้นชัดเจนว่าการที่ค่าเฉลี่ยของระดับแม่น้ำเท่ากับ 49 ฟุตนั้น แปลว่าจะมีบางส่วนของแม่น้ำที่ระดับน้ำสูงกว่า และบางส่วนที่ต่ำกว่านั้น ค่าเฉลี่ยจึงอยู่ที่ 49 ฟุตได้ ดังนั้นการสร้างคันกันน้ำสูง 49 ฟุตเท่ากันตลอดแนวแม่น้ำจึงไม่ใช่คำตอบที่ดีเอาเสียเลย นี่คือตัวอย่างของการมีข้อมูลที่ดี มีสารสนเทศที่ดี แต่ไม่สามารถนำมาสร้างเป็นความรู้ที่ถูกต้องได้ จนนำไปสู่ปัญญาหรือวิธีการป้องกันน้ำท่วมที่ผิด ทำให้เราเห็นว่าการวิเคราะห์ข้อมูลที่ดี ซึ่งแปลว่าเหมาะสมกับลักษณะของข้อมูลนั้นสำคัญแค่ไหน และสิ่งนี้โปรแกรมสำเร็จรูปก็ทำให้เราไม่ได้

          มาลองหาทางแก้ปัญหานี้กัน ตอนนี้เราพบว่าการสร้างคันกั้นน้ำสูง 49 ฟุตซึ่งคือค่าเฉลี่ยนั้นไม่เวิร์กเพราะน้ำอาจสูงกว่านั้นในบางบริเวณ ดังนั้นเราอาจจะสร้างให้สูงกว่านั้นหน่อย แต่คำถามคือเท่าไรดี บางคนอาจจะบอกว่า น้ำท่วมถึง 54 แต่อย่าลืมว่าตอนสร้างกำแพงเราไม่รู้เลข 54 นะฮะ เลขนี้เรารู้หลังน้ำท่วมไปแล้ว ดังนั้นบนฐานของข้อมูลในอดีตที่เฉลี่ยเท่ากับ 49 เราอาจจะต้องสร้างกำแพงเผื่อไว้หน่อยสำหรับน้ำที่สูงกว่านั้น แต่เผื่อเยอะเกินไปก็ไม่ดี เปลืองงบประมาณ ด้วยความรู้ทางสถิติเราอาจจะต้องเอาค่าอื่นมาช่วย เช่น ค่าส่วนเบี่ยงเบนมาตรฐาน (standard deviation, s.d.) ที่บอกว่าข้อมูลแต่ละตัวนั้นห่างจากค่าเฉลี่ยไปโดยเฉลี่ยเท่าไร เราอาจสร้างกำแพงที่สูง 49+s.d. หรือ 49+2s.d. อันนี้ก็ต้องไปคำนวณทางสถิติที่ซับซ้อนขึ้นต่อไป 

          กับดักของค่าเฉลี่ยเป็นแค่ตัวอย่างหนึ่งที่แสดงให้เห็นถึงความสำคัญของการเข้าใจเครื่องมือการวิเคราะห์ข้อมูลที่เราใช้ ความจริงก็คือทุกเครื่องมือมีจุดเด่นและจุดด้อยเสมอ ไม่มีเครื่องมือวิเคราะห์ข้อมูลใดที่ดีเลิศครอบจักรวาลอย่างที่บางคนมักจะคิด ดังนั้นการสอนให้ผู้เรียนวิเคราะห์ข้อมูลโดยเข้าใจเครื่องมือที่ตัวเองกำลังใช้อยู่จึงเป็นเรื่องจำเป็นอย่างมาก เอาแค่ค่าเฉลี่ยซึ่งเป็นค่าที่แสนจะพื้นฐานยังมีความเข้าใจผิดๆ กันได้ แล้วนับประสาอะไรกับเครื่องมือที่ซับซ้อนกว่านี้

Sample of geocoded Radarsat SAR image of 1997 Upper Midwest U.S. and Canada Flooding.  May 1, 1997.  Republication permitted without restirction:  cite A. B. Miller and G. R. Brakenridge, Dartmouth Flood Observatory.  SAR image data courtesy Alaskan SAR Facility, University of Alaska with support from NASA-MTPE; 1:100,000 DLG vectors are from USGS, EROS Data Center.  This is a draft, in preparation image map prepared at the Dartmouth Flood Observatory.

          นอกจากการใช้เครื่องมือและรู้จักเลือกเครื่องมือที่เหมาะสมแล้ว อีกหนึ่งทักษะที่สำคัญในการเป็นนักวิเคราะห์ข้อมูลที่เก่งคือการตั้งคำถาม คำถามที่ถูกต้องจะนำไปสู่การวิเคราะห์ข้อมูลที่ถูกต้องเช่นกัน มีคำกล่าวที่ว่า การตั้งคำถามที่ดีจะทำให้คำถามนั้นถูกตอบไปแล้วครึ่งหนึ่ง อย่างล่าสุดผมเพิ่งเจอข้อมูลที่น่าสนใจจากโพสต์ในเฟซบุ๊ก เป็นข้อมูลเงินเดือนเฉลี่ยบัณฑิตปริญญาตรีจุฬาลงกรณ์มหาวิทยาลัยรุ่นปีพ.ศ. 2561 จากรายงานการสำรวจ ภาวะการหางานทำของบัณฑิต รุ่นปีการศึกษา 2561 ซึ่งสรุปออกมาเป็นข้อมูลได้ดังแผนภูมิและตารางข้างล่างนี้

อะไรอยู่เบื้องหลังการวิเคราะห์ข้อมูลที่ดี
Photo: Candid Data

          สมมติว่าคำถามที่เราตั้งคือคณะไหนที่เงินเดือนเฉลี่ยสูงสุด จากแผนภูมิก็เห็นชัดเจนว่าคณะแพทย์คือคำตอบ เพราะเงินเดือนเฉลี่ยสูงกว่าคณะอื่นๆ อย่างเห็นได้ชัด มิหนำซ้ำเงินเดือนเฉลี่ยของแพทยศาสตรบัณฑิตยังทิ้งห่างคณะอันดับสองมากถึงหมื่นกว่าบาท เป็นคณะเดียวที่เงินเดือนเฉลี่ยสูงเกินกว่าคณะลำดับถัดไปมากขนาดนี้ แต่ความมั่นคงเท่ากับเงินเดือนเฉลี่ยที่สูงแค่นั้นเลยจริงหรือเปล่า ถ้าเรามาดูที่ส่วนเบี่ยงเบนมาตรฐาน เราจะพบว่าส่วนเบี่ยงเบนมาตรฐานของเงินเดือนคณะแพทย์นั้นสูงเป็นอันดับสองรองมาจากคณะวิศกรรมศาสตร์เท่านั้น และการที่ส่วนเบี่ยงเบนมาตรฐานสูงก็แปลว่ามีการกระจายของเงินเดือนสูง แปลไทยเป็นไทยได้ว่า มีคนจบคณะแพทย์ที่เงินเดือนต่ำมากๆ และสูงมากๆ ยิ่งถ้าไปดูค่าต่ำสุดกับสูงสุดในตารางฝั่งขวาประกอบด้วย จะเห็นว่าเงินเดือนต่ำสุดของคณะแพทย์กับทันตแพทย์นั้นไม่ต่างกันเท่าไร ในขณะที่เงินเดือนสูงสุดนั้นต่างกันเป็นอย่างมาก สิ่งนี้อาจกำลังบอกเราว่าแม้เงินเดือนตั้งต้นของทั้งสองอาชีพคุณหมอนี้จะพอๆ กัน แต่เส้นทางการเติบโตในสายอาชีพทั้งสองนี้ต่างกันลิบลับ

          แต่ในความเป็นจริงแล้ว อาจจะยังมีความจริงซ่อนอยู่เบื้องหลังรายได้ของสองอาชีพนี้ที่ไม่ได้แสดงอยู่ในแผนภูมิและตารางอยู่ การที่รายได้สูงสุดของคนจบคณะแพทย์สูงกว่าของทันตแพทย์ขนาดนั้นแต่ค่าเฉลี่ยกลับสูงกว่าไม่เท่าไหร่ อาจบ่งชี้ว่ามีจำนวนคนที่เงินเดือนสูงอยู่เพียงหยิบมือเท่านั้น คล้ายกับข้อมูลรายได้คนไทยที่มีความต่างของเงินเดือนสูงและมีคนในระดับท็อปอยู่เพียงไม่มาก เพื่อตรวจสอบว่าสมมติฐานของเราถูกต้องไหมเราอาจต้องใช้ข้อมูลเพิ่มเติมอย่างเช่นมัธยฐาน หรือค่าความเบ้เป็นต้น ซึ่งทั้งหมดนี้จะเกิดขึ้นไม่ได้เลยหากเราไม่ถามอะไรไปให้ไกลกว่าแค่คณะไหนเงินเดือนเฉลี่ยสูงที่สุด

          เราสามารถตั้งคำถามจากข้อมูลชุดหนึ่งได้มากมายมหาศาล บางคำถามอาจเป็นแค่การสนองความอยากรู้ บางคำถามอาจจะพาเราไปผิดทาง แต่บางคำถามอาจนำไปสู่การเปลี่ยนแปลงที่ดีขึ้นได้ เช่น ถ้าบริษัทโทรศัพท์แห่งหนึ่งกำลังประสบปัญหาลูกค้าย้ายไปใช้บริการค่ายอื่น แค่การเปลี่ยนคำถามจาก “เราจะออกโปรโมชันลับอะไรมารั้งลูกค้าไว้กับเราดี” เป็น “ลูกค้าย้ายออกเพราะปัญหาอะไร และเราจะแก้มันอย่างไรดี” ก็สามารถนำไปสู่ทิศทางของการวิเคราะห์ข้อมูลและแนวทางการแก้ปัญหาที่ต่างกันไปคนละโลกแล้ว

          การตั้งคำถามที่ดีจะนำไปสู่การวิเคราะห์ที่ดี ซึ่งจะช่วยให้เราสามารถเปลี่ยนข้อมูลและสารสนเทศที่มีอยู่ในมือให้กลายเป็นความรู้ที่สามารถเอาไปใช้สร้างเป็นปัญญาเพื่อตอบคำถาม ตัดสินใจ หรือวางนโยบายที่ตรงจุดในท้ายที่สุด ดังนั้นการฝึกให้นักเรียนตั้งคำถามที่ดีอาจจะสำคัญเสียยิ่งกว่าการสอนให้รู้จักเครื่องมือทางสถิติซึ่งทำได้ง่ายกว่ามากด้วยซ้ำ


ที่มา

บทความ “Data was, Analytics is, the New Oil” จาก geospatialworld.net (Online)

บทความ “The DIKW model for knowledge management and data value extraction” จาก i-scoop.eu (Online)

บทความ “The Flaw of Averages”จาก hbr.org (Online)

บทความ “Are we literally losing our way by relying on GPS devices?” จาก washingtonpost.com (Online)

บทความ “HAVE YOU FALLEN INTO THE TRAP OF BEING AVERAGE?” จาก beabrandrebel.com (Online)

บทความ “How To Ask The Right Questions As A Data Scientist” จาก towardsdatascience.com (Online)

บทความ “Asking the right questions of data is a lost art” จาก thedataliteracyproject.org (Online)

บทความ “Data Analytics: It’s about Asking the Right Questions” จาก iss.nus.edu.sg (Online)

RELATED POST

แหล่งชุมนุมความคิดเรื่องพื้นที่สาธารณะเพื่อการเรียนรู้
และห้องสมุดกับการเปลี่ยนแปลงสังคม

                                                                                            

The KOMMON มีการใช้คุกกี้ เพื่อเก็บข้อมูลการใช้งานเว็บไซต์ไปวิเคราะห์และปรับปรุงการให้บริการที่ดียิ่งขึ้น คุณสามารถศึกษารายละเอียดได้ที่ นโยบายความเป็นส่วนตัว และสามารถจัดการความเป็นส่วนตัวเองได้ของคุณได้เองโดยคลิกที่ ตั้งค่า

Privacy Preferences

คุณสามารถเลือกการตั้งค่าคุกกี้โดยเปิด/ปิด คุกกี้ในแต่ละประเภทได้ตามความต้องการ ยกเว้น คุกกี้ที่จำเป็น

อนุญาตทั้งหมด
Manage Consent Preferences
  • คุกกี้ที่จำเป็น
    Always Active

    ประเภทของคุกกี้มีความจำเป็นสำหรับการทำงานของเว็บไซต์ เพื่อให้คุณสามารถใช้ได้อย่างเป็นปกติ และเข้าชมเว็บไซต์ คุณไม่สามารถปิดการทำงานของคุกกี้นี้ในระบบเว็บไซต์ของเราได้

  • คุกกี้สำหรับการวิเคราห์

    คุกกี้นี้เป็นการเก็บข้อมูลสาธารณะ สำหรับการวิเคราะห์ และเก็บสถิติการใช้งานเว็บภายในเว็บไซต์นี้เท่านั้น ไม่ได้เก็บข้อมูลส่วนตัวที่ไม่เป็นสาธารณะใดๆ ของผู้ใช้งาน

บันทึก