Big Data คืออะไร

บิ๊กดาต้า (Big Data)

คือเทคโนโลยีและสถาปัตยกรรมไอทีรุ่นใหม่ ที่ได้รับการออกแบบให้สามารถรองรับการจัดเก็บ การวิเคราะห์ และการใช้งานดาต้าที่มีปริมาณมหาศาล (volume) มีการเปลี่ยนแปลงอย่างรวดเร็วในระดับนาทีหรือวินาที (velocity) และมีความหลากหลาย ทั้งจากประเภทของตัวดาต้าเอง และจากแหล่งที่มาของดาต้าที่แตกต่างกัน (variety) ด้วยต้นทุนที่ต่ำกว่าเมื่อเทียบกับเทคโนโลยีและสถาปัตยกรรมไอทีแบบเดิม

Big Data ควรใช้เมื่อไร

ไม่ใช่ทุกองค์กรจำเป็นต้องใช้งานเทคโนโลยีนี้เสมอไป องค์กรที่สมควรพิจารณาการนำเทคโนโลยีบิ๊กดาต้ามาใช้งานคือองค์กรที่มีความประสงค์จะจัดเก็บ วิเคราะห์ และใช้งานดาต้าที่มีลักษณะดังต่อไปนี้

ดาต้าที่จะนำมาใช้งานมีปริมาณมากกว่า 100 เทระไบต์ (TB) หรือมีอัตราการเติบโตสูงว่าร้อยละ 60 ต่อปี ดาต้าที่จะนำมาใช้งานเป็นดาต้าแบบเรียลไทม์ ที่ความเร็วในการเปลี่ยนแปลงมากกว่า 60 Gbps ดาต้าที่จะนำมาใช้งานมาจากแหล่งที่มาที่แตกต่างกันมากกว่า 2 ประเภท หรือแหล่งส่งดาต้าความเร็วสูง เช่น ดาต้ารายละเอียดพฤติกรรมลูกค้าในอินเทอร์เน็ต (clickstream) หรือดาต้าการทำงานของเครื่องจักร เป็นต้น

 

ขั้นตอนการนำ Big Data มาประยุกต์ใช้ให้ประสบความสำเร็จ

เทคโนโลยีบิ๊กดาต้าเป็นเทคโนโลยีใหม่ที่มีแนวโน้มจะวิวัฒนาการอย่างรวดเร็ว ดังนั้นหนึ่งในประเด็นสำคัญที่สุด คือการเตรียมการเพื่อรองรับทั้งการเปลี่ยนแปลงของเทคโนโลยีและการเปลี่ยนแปลงของความต้องการในการใช้งานดาต้าขององค์กรเอง ซึ่งควรพิจารณาการดำเนินการให้สอดคล้องกับขั้นตอนต่าง ๆ ดังต่อไปนี้

 

ขั้นตอนที่ 1: ระบุประเภทของดาต้าที่มีประโยชน์ต่อองค์กร

องค์กรต้องเริ่มต้นจากการระบุว่าดาต้าประเภทใดมีประโยชน์กับวัตถุประสงค์ของงาน ซึ่งอาจจะเป็นดาต้าที่องค์กรจัดเก็บอยู่แล้ว หรือดาต้าที่มีอยู่แล้วแต่ยังไม่ได้รับการจัดเก็บหรือบริหารจัดการก็เป็นได้ โดยเป็นได้ทั้งดาต้าจากภายนอก เช่น กระแสดาต้า (streaming data) จากพันธมิตรทางธุรกิจ ดาต้าจากอุปกรณ์อินเทอร์เน็ตออฟธิงส์ (IoT) เป็นต้น และเป็นได้ทั้งดาต้าจากภายใน เช่น ดาต้าจากอีเมลที่ช่วยให้เข้าใจความรู้สึกของลูกค้า ดาต้าจากเฮลป์เดสก์ (help desk) ที่ช่วยวัดประสิทธิภาพของการแก้ไขปัญหาหรือระบุถึงตำหนิของสินค้าได้ เป็นต้น

ขั้นตอนที่ 2: วางแผนการนำดาต้าไปใช้

ทั้งแผนกที่ต้องการใช้งานดาต้าและแผนกไอทีจำเป็นต้องทำการศึกษาดาต้าที่องค์กรมีอยู่ เพื่อวางแผน ค้นหาวิธีวิเคราะห์ดาต้าที่เหมาะสม และกำหนดวิธีการติดตามผลของการใช้งานดาต้า โครงการที่เกี่ยวข้องกับบิ๊กดาต้าที่ได้รับการออกแบบให้สร้างประโยชน์อย่างชัดเจนและต่อเนื่อง (หรือสร้างประโยชน์ให้กับหลายแผนก) มักมีแนวโน้มที่จะได้รับการตอบรับที่ดีกว่าจากฝ่ายบริหารและมักได้รับการจัดสรรงบประมาณให้มากกว่า ซึ่งการต่อยอดโครงการจะเป็นไปได้ง่ายขึ้นหากองค์กรมีวิสัยทัศน์และแผนงานที่ชัดเจนตั้งแต่เริ่มต้น

 

ขั้นตอนที่ 3: เลือกใช้เทคโนโลยีที่เหมาะสม

การเปลี่ยนดาต้าให้การเป็นข้อมูลเชิงลึก (insight) เพื่อนำไปใช้งานนั้น ต้องการเครื่องมือที่เหมาะสม ทั้งเทคโนโลยีที่รวบรวมดาต้าจากแหล่งต่าง ๆ ซึ่งฮาดูป (Hadoop) เป็นเครื่องมือที่ใช้งานอย่างแพร่หลายในขั้นตอนนี้ โดยเป็นเครื่องมือสร้างแหล่งจัดเก็บดาต้าเชิงไม่สัมพันธ์ (nonrelational data store) จึงสามารถรองรับดาต้าได้ในปริมาณไม่จำกัดและมีความน่าเชื่อถือสูง แต่ในบางกรณีระบบบริหารจัดการฐานข้อมูลเชิงสัมพันธ์อาจเป็นเครื่องมือที่เหมาะสมกว่าก็เป็นได้ เช่น ในกรณีที่มุ่งเน้นการใช้งานดาต้าที่มีโครงสร้างชัดเจน เป็นต้น นอกจากนี้องค์กรยังต้องการเทคโนโลยีที่ใช้คัดกรองและเรียบเรียงดาต้าเพื่อสร้างดาต้าที่มีคุณภาพและมีความถูกต้อง เครื่องมือในการสร้างโมเดลเพื่อใช้งานดาต้าผ่านอัลกอริทึมต่าง ๆ เครื่องมือนำเสนอดาต้าในเชิงภาพในรูปแบบของกราฟิก และอาจต้องการเครื่องมือในการเชื่อมต่อดาต้าหรือผลการวิเคราะห์ดาต้าเข้ากับแอปพลิเคชันอื่น ๆ อีกด้วย สิ่งสำคัญคือต้องเลือกเทคโนโลยีให้เหมาะสมกับการใช้งานและประเภทของดาต้า และวางแผนเพื่อรองรับการใช้งานในอนาคตต่อไป

 

ขั้นตอนที่ 4: จัดทำกระบวนการและนโยบายที่เกี่ยวข้องกับดาต้าที่เหมาะสม

สิ่งสำคัญที่องค์กรต้องพิจารณาคือการสร้างความมั่นใจว่า ดาต้านั้นพร้อมใช้งานในเวลาที่ต้องการ สามารถนำไปใช้งานได้จริง มีคุณภาพ และนำมาใช้งานร่วมกันได้อย่างมีประสิทธิภาพ ส่งผลให้องค์กรต้องกำหนดนโยบายการกำกับดูแลด้านดาต้า (data governance) เพื่อควบคุมการเข้าใช้งาน การรักษาความเป็นส่วนตัว และควบคุมให้เป็นไปตามกฎข้อบังคับที่มี ให้ครอบคลุมทุกมิติของระบบและการใช้งาน ยิ่งไปกว่านั้นองค์กรยังจำเป็นต้องสร้างกรอบการทำงานที่ชัดเจนในการกำกับดูแลการเคลื่อนที่ของดาต้า การจัดการสิทธิการเข้าถึงดาต้า กฎระเบียบต่าง ๆ กระบวนการบริหารจัดการดาต้าตลอดช่วงอายุ กำหนดเกณฑ์การวัดคุณภาพของดาต้า และสื่อสารประเด็นเหล่านี้ให้กับพนักงานที่เกี่ยวข้องอย่างชัดเจน

 

ขั้นตอนที่ 5: จัดตั้งทีมงานที่มีความสามารถที่เหมาะสม

หนทางสู่ความสำเร็จของโครงการบิ๊กดาต้าอนาไลติกส์ต้องอาศัยความร่วมมือและความเข้าใจอย่างต่อเนื่องระหว่างแผนกที่ใช้งานดาต้าและแผนกไอที ซึ่งโดยทั่วไปทีมงานบิ๊กดาต้าอนาไลติกส์จะประกอบด้วย เจ้าหน้าที่จากแผนกไอที ซึ่งเข้าใจธรรมชาติของแหล่งกำเนิดดาต้า นักวิเคราะห์ธุรกิจ ซึ่งมีประสบการณ์ในการทำงานกับดาต้าที่เคลื่อนย้ายจากฐานข้อมูลธุรกรรมไปยังคลังข้อมูล ผู้บริหารของแผนกที่ใช้งานดาต้า ซึ่งสามารถกำหนดวิธีการประเมินความสำเร็จและผลที่ได้รับจากโครงการ และมักเป็นผู้ที่สามารถตัดสินใจในการจัดสรรงบประมาณมาลงทุนในโครงการได้ นักวิทยาศาสตร์ดาต้า ซึ่งสามารถอธิบายได้ว่าดาต้าจะได้รับการวิเคราะห์และใช้ประโยชน์ได้อย่างไร และที่ปรึกษาจากภายนอก ซึ่งจะช่วยสร้างความแข็งแกร่งและเติมเต็มช่องว่างที่ยังขาด รวมถึงการถ่ายโอนความรู้ความชำนาญให้กับบุคลากรของทีมงานอย่างเหมาะสม

 

ขั้นตอนที่ 6: บริหารความคาดหวังและความพยายามของแผนกไอทีและแผนกที่ใช้งานดาต้า

การลงทุนในโครงการบิ๊กดาต้าอนาไลติกส์ที่มาพร้อมกับเป้าหมายที่ชัดเจนย่อมมาพร้อมกับความคาดหวัง ซึ่งจำเป็นต้องได้รับการบริหารจัดการที่เหมาะสมตามช่วงเวลาต่าง ๆ ของการดำเนินงาน และการเริ่มการทดสอบ (pilot) จะช่วยให้สามารถกำหนดประโยชน์ที่ได้รับ เวลาในการดำเนินโครงการที่เป็นไปได้ และงบประมาณที่อาจต้องใช้ในโครงการต่อเนื่องในอนาคต โดยในช่วงแรกของการดำเนินโครงการนั้น ความคาดหวังที่มีต่อโครงการควรถูกจำกัดให้อยู่ในระดับต่ำ เพื่อรองรับความไม่แน่นอนของงบประมาณและเวลาที่ใช้ในการดำเนินโครงการ และหลังจากที่เริ่มเห็นความสำเร็จของโครงการแล้ว ทีมงานควรแจ้งให้กับผู้ที่เกี่ยวข้องทราบ เพื่อสร้างความมั่นใจซึ่งจะนำไปสู่การต่อยอดโครงการในอนาคต

 

ขั้นตอนที่ 7: ยกระดับความก้าวหน้า ประสิทธิภาพ และนวัตกรรม

เมื่อองค์กรมีความก้าวหน้าด้านบิ๊กดาต้าอนาไลติกส์ในระดับหนึ่งแล้ว ควรพิจารณาจัดตั้งศูนย์ความเป็นเลิศด้านอนาไลติกส์ขึ้น เพื่อเพิ่มการใช้งานอนาไลติกส์ในวงกว้างให้กับแผนกหรือหน่วยธุรกิจต่าง ๆ อีกทั้งยังเป็นหน่วยงานที่กำกับดูแลดาต้าขององค์กรอย่างต่อเนื่อง เพื่อให้สามารถดำเนินโครงการด้านดาต้าที่สอดประสานกันได้ดีขึ้น นอกจากนี้องค์กรยังควรตรวจสอบการใช้งานและประโยชน์ของการใช้งานบิ๊กดาต้าอนาไลติกส์เป็นประจำ

องค์กรที่เล็งเห็นประโยชน์และโอกาสจากการนำเทคโนโลยีบิ๊กดาต้ามาใช้เพื่อยกระดับองค์กร สามารถติดต่อขอรับบริการปรึกษาจากสำนักงานส่งเสริมเศรษฐกิจดิจิทัล (depa) ได้ที่ 0-2026-2333 หรือที่ This email address is being protected from spambots. You need JavaScript enabled to view it.

ขอบคุณบทความดี ๆ จาก https://www.depa.or.th/