สำนักบริการวิชาการ มหาวิทยาลัยบูรพา สนใจนำบทความมาออกอากาศ ติดต่อ ฝ่ายส่งเสริมและเผยแพร่วิชาการ สำนักบริการวิชาการ ม.บูรพา โทร.038-102292ดาวน์โหลดแบบฟอร์มเพื่อขอหนังสือรวมเล่มบทความตอบแบบสอบถาม โครงการเผยแพร่วิชาการทางวิทยุกระจายเสียงเพื่อดาวน์โหลดหนังสือรวมเล่มบทความอิเล็กทรอนิกส์
สำนักบริการวิชาการ มหาวิทยาลัยบูรพา
หน้าแรก | แก้ไขข้อมูล | หัวข้อล่าสุด | สมาชิก | ค้นหา | FAQ
Username:
Password:
Save Password
 All Forums
 รวมบทความวิชาการน่ารู้
 บทความรายการวิทยาศาสตร์เพื่อประชาชน
 การทำเหมืองข้อมูล เทคโนโลยีเพื่อการจัดการข้อมูลทาง
 ตั้งหัวข้อใหม่  ตอบกลับหัวข้อนี้
 พรินต์ส่งให้เพื่อน
Author Previous Topic Topic Next Topic  

admin
Forum Admin

5557 Posts

Posted - 11 Mar 2017 :  10:32:24  Show Profile  Click to see admin's MSN Messenger address  Reply with Quote
ปีงบประมาณ 2560


การทำเหมืองข้อมูล เทคโนโลยีเพื่อการจัดการข้อมูลทางชีวภาพที่มีขนาดใหญ่
จิดาภา สอนศิริ และ พิทักษ์ สูตรอนันต์


กดปุ่ม > เพื่อเล่นไฟล์เสียง


                ในปัจจุบันมีข้อมูลขนาดใหญ่ (Big Data) ปรากฏอยู่อย่างมากมาย เช่น สถิติของการเช็คอินใน เฟซบุ๊คตามสถานที่และร้านค้าต่างๆ ซึ่งเป็นข้อมูลขนาดใหญ่ที่ก่อให้เกิดประโยชน์ต่อการพัฒนาธุรกิจร้านอาหาร เป็นต้น แต่ข้อมูลขนาดใหญ่เหล่านี้มีความซับซ้อนและมีความหลากหลาย จึงทำให้ต้องมีการประยุกต์ใช้เทคโนโลยีสารสนเทศเข้ามาช่วยในการจัดการกับข้อมูลให้เป็นระบบมากยิ่งขึ้น เพื่อค้นหารูปแบบ แนวทาง และความสัมพันธ์ที่ซ่อนอยู่ในชุดข้อมูล โดยอาศัยหลักสถิติและหลักคณิตศาสตร์ ซึ่งเรียกกระบวนการสำหรับจัดการกับข้อมูลขนาดใหญ่นี้ว่า การทำเหมืองข้อมูล หรืออาจเรียกอีกชื่อหนึ่งว่าดาต้าไมนิ่ง (Data Mining) นอกจากนี้การทำเหมืองข้อมูลยังทำให้สามารถค้นพบรูปแบบความสัมพันธ์ที่ไม่เคยมีมาก่อน จนกลายเป็นการค้นพบองค์ความรู้ใหม่ (Knowledge Discovery) โดยมีการศึกษาเรื่องของการทำเหมืองข้อมูลกันมาอย่างต่อเนื่องตั้งแต่ช่วงปีพุทธศักราช 2503 เริ่มจากการนําข้อมูลมาจัดเก็บอย่างเป็นระบบ แล้วสร้างความสัมพันธ์เชื่อมโยงระหว่างกันของข้อมูลในระบบเพื่อประโยชน์ในการนําไปวิเคราะห์ และช่วยในการตัดสินใจอย่างมีคุณภาพ รวมไปถึงการรวบรวมข้อมูลที่ผ่านการวิเคราะห์แล้วมาจัดเก็บลงไปในฐานข้อมูลขนาดใหญ่ ต่อมาในปีพุทธศักราช 2543 การพัฒนาการทำเหมืองข้อมูลประสบผลสำเร็จโดยมีการนําข้อมูลจากฐานข้อมูลมาวิเคราะห์และประมวลผล โดยอาศัยการสร้างแบบจําลองและความสัมพันธ์ทางสถิติเพื่อนำมาช่วยในการอธิบายหรือคาดเดาสถานการณ์ที่สนใจ จากการพัฒนาเทคโนโลยีสารสนเทศทำให้การศึกษาการทำเหมืองข้อมูลในปัจจุบันถูกนำไปประยุกต์ใช้ในงานหลายประเภท ทั้งในด้านธุรกิจที่ช่วยในการตัดสินใจของผู้บริหารหรือเจ้าของกิจการในการดำเนินธุรกิจ ด้านวิทยาศาสตร์และเทคโนโลยีในการวิจัยเพื่อการทำนายผลการวิจัยก่อนลงมือทำการทดลอง ทางด้านการแพทย์สำหรับการวิเคราะห์และตรวจสอบข้อมูลทางคลินิก รวมทั้งด้านเศรษฐกิจและสังคมเพื่อวางรากฐานการดำเนินชีวิตของประชากรในสังคม นอกจากนี้ยังใช้ในการค้นหารูปแบบที่น่าสนใจจากกลุ่มข้อมูลและค้นหารูปแบบความสัมพันธ์หรือลักษณะที่เชื่อมโยงกันของข้อมูลทางชีวภาพที่มีขนาดใหญ่ซึ่งถูกสร้างขึ้นมาด้วยเทคโนโลยีที่ให้ผลผลิตสูง (High throughput technology)
                ข้อมูลทางชีวภาพเป็นข้อมูลหรือการตรวจวัดที่ได้จากการเก็บรวมรวมผลจากการทดลองในห้องปฏิบัติการทางชีวภาพของการศึกษาโมเลกุลของดีเอ็นเอ อาร์เอ็นเอ และโปรตีน ภายใต้การตรวจสอบข้อมูลทางพันธุกรรม ลำดับเบสระดับจีโนม การแสดงออกของยีน และการตรวจวัดปริมาณและปฏิสัมพันธ์ของโปรตีน เป็นต้น จากการพัฒนาเทคโนโลยีที่ให้ผลผลิตสูงทำให้การตรวจวัดข้อมูลทั้งดีเอ็นเอ อาร์เอ็นเอ โปรตีน และโมเลกุลทางชีวภาพอื่นๆ สามารถทำได้เป็นจำนวนมากในช่วงเวลาเดียวกัน จากเดิมที่ต้องทำการทดลองเป็นพันครั้ง ก็เหลือการทำการทดลองเพียงครั้งเดียว ทำให้เกิดการสร้างข้อมูลทางชีวภาพที่มีขนาดใหญ่ซึ่งถูกผลิตขึ้นมาได้ในเวลาอันรวดเร็ว ตัวอย่างของเทคโนโลยีที่ให้ผลผลิตสูงเหล่านี้ ได้แก่ เทคโนโลยีการหาลำดับเบสยุคใหม่ หรือ เอ็นจีเอส (NGS, Next generation sequencing technology) ซึ่งเป็นเทคโนโลยีของการหาลำดับเบสบนชิ้นดีเอ็นเอได้เป็นจำนวนนับล้านชิ้นในเวลาเดียวกัน ทำให้การหาลำดับเบสระดับจีโนมของมนุษย์ที่มีขนาดใหญ่เป็นพันล้านเบสสามารถทำได้อย่างรวดเร็วและมีประสิทธิภาพ เทคโนโลยีไมโครอาร์เรย์ (Microarray technology) ซึ่งเป็นเทคนิคที่ถูกพัฒนาขึ้นมาเพื่อใช้ในการตรวจสอบการแสดงออกยีนนับหมื่นยีนได้ในเวลาเดียวกัน โดยอาศัยการจับกันอย่างจำเพาะของสายดีเอ็นเอสองสายที่เป็นคู่กันบนแผ่นอาร์เรย์ที่เต็มไปด้วยโพรบนับแสนโพรบซึ่งออกแบบมาจากยีนทั้งหมดที่พบในจีโนมของสิ่งมีชีวิต หรือเทคโนโลยีวายทูเอช (Y2H, Yeast two-hybrid technology) ที่ตรวจสอบการจับกันของโปรตีนที่ทำให้ทราบถึงข้อมูลปฏิสัมพันธ์ระหว่างโปรตีนได้เป็นจำนวนนับหมื่นคู่ของโปรตีนภายใต้การทดลองเดียวกัน ซึ่งข้อมูลทางชีวภาพที่มีขนาดใหญ่ที่ถูกผลิตขึ้นจากเทคโนโลยีเหล่านี้ไม่สามารถวิเคราะห์ได้ด้วยตาหรือกระบวนการทางสถิติพื้นฐาน แต่ต้องอาศัยเทคโนโลยีเพื่อการจัดการข้อมูลขนาดใหญ่หรือการทำเหมืองข้อมูลมาประยุกต์ใช้ในการวิเคราะห์ข้อมูลเหล่านี้ เพื่อการค้นพบองค์ความรู้ใหม่ๆ ที่สามารถนำไปใช้ประโยชน์ต่อไปได้
                เทคโนโลยีเพื่อการจัดการข้อมูลหรือการทำเหมืองข้อมูลกับข้อมูลทางชีวภาพที่มีขนาดใหญ่ ประกอบด้วยกระบวนการที่สำคัญ ตัวอย่างเช่นในการทำเหมืองข้อมูลของข้อมูลการแสดงออกของยีนโดยเทคโนโลยีไมโครอาร์เรย์ จะอาศัยการคัดเลือกยีน (Gene selection) ในการคัดเลือกกลุ่มยีนที่มีลักษณะการแสดงออกที่สอดคล้องกับลักษณะหรือสภาวะที่สนใจ โดยกลุ่มยีนที่ถูกคัดเลือกเหล่านี้สามารถนำไปใช้เป็นยีนเครื่องหมายเพื่อใช้ในการจำแนกกลุ่มข้อมูล (Classification) ในการจัดจำแนกกลุ่มตัวอย่างด้วยคุณลักษณะต่างๆ ที่ได้มีการกำหนดไว้แล้ว เช่น การจำแนกกลุ่มผู้ป่วยกับคนปกติโดยอาศัยระดับการแสดงออกของยีนที่แตกต่างกันของกลุ่มยีนเครื่องหมายที่ถูกคัดเลือก หรือการใช้การจัดกลุ่มข้อมูล (Clustering) ในการจัดกลุ่มข้อมูลที่มีลักษณะคล้ายกันไว้ในกลุ่มเดียวกัน เช่น การจัดกลุ่มยีนที่มีการแสดงออกในรูปแบบเดียวกันไว้ด้วยกันเพื่อทำให้ทราบถึงรูปแบบการตอบสนองของกลุ่มยีนที่สามารถนำมาใช้ในการอธิบายกลไกระดับโมเลกุลที่เกี่ยวข้อง หรือใช้การค้นหากฎความสัมพันธ์ของข้อมูล (Association rule) ในการสร้างความเชื่อมโยงของข้อมูลหรือกลุ่มข้อมูลที่เกิดขึ้นในเหตุการณ์เดียวกันเข้าด้วยกัน ซึ่งช่วยในการค้นหาความสัมพันธ์ของการแสดงออกยีนที่มีการแสดงออกร่วมกัน และการสร้างภาพ (Visualization) ที่ช่วยในการแสดงผลเพื่อนำเสนอข้อมูลในรูปแบบของกราฟิกที่จะทำให้ผู้ใช้สามารถค้นพบองค์ความรู้ได้โดยง่าย เช่น การสร้างภาพกราฟิกที่แสดงข้อมูลการแสดงออกของยีนเพื่อช่วยในการตัดสินใจเพื่อคัดเลือกกลุ่มยีนเป้าหมายที่มีความสำคัญต่อการเกิดโรคที่สนใจ หรือถ้าหากพิจารณาถึงการนำไปใช้กับโรค เช่น โรคมะเร็ง เทคโนโลยีการทำเหมืองข้อมูลก็สามารถนำมาใช้ในการวินิจฉัยได้รวดเร็วขึ้น หรือมีแนวทางในการรักษาที่จำเพาะกับยีนหรือโปรตีนของเซลล์มะเร็งมากขึ้น ทำให้การรักษามีประสิทธิภาพเพิ่มมากขึ้น ซึ่งจะเห็นได้ว่าการทำเหมืองข้อมูลเป็นเครื่องมือที่สำคัญและมีความน่าสนใจ สำหรับนำมาประยุกต์ใช้ในการค้นหาองค์ความรู้ที่สำคัญได้หลากหลายสาขา รวมถึงสาขาทางวิทยาศาสตร์ชีวภาพและทางการแพทย์ ซึ่งการทำเหมืองข้อมูลเป็นแนวโน้มของการศึกษาวิจัยในอนาคตภายใต้ข้อมูลทางชีวภาพที่มีขนาดใหญ่ซึ่งถูกผลิตขึ้นมาอย่างต่อเนื่องและมีจำนวนเพิ่มมากขึ้นอย่างไม่มีที่สิ้นสุด

แหล่งอ้างอิง
Bellazzi R, Zupan B. (2007). Towards knowledge-based gene expression data mining. Journal of Biomedical Informatics. 40(6): 787-802.
Fayyad U, Stolorz P. (1997). Data mining and KDD: Promise and challenges. Future Generation Computer Systems. 13: 99-115.
Wilantho A, Praditsup O, Charoenchim W, Kulawonganunchai S, Assawamakin A, Tongsima S. (2012). Next generation sequencing (NGS) technologies and their applications in omics-research. Thai Journal of Genetics. 5(2) : 104-129.
อานนท์ ศักดิ์วรวิชญ. (2559). เทคโนโลยีการจัดการข้อมูลขนาดใหญ่ ใหญ่ตรงไหน? ยากตรงไหน? ทำไมต้องรู้? (ออนไลน์). ใน ผู้จัดการ Online. วันที่ค้นข้อมูล 17 สิงหาคม 2559, เข้าถึงได้จาก http://www.manager.co.th/Daily/ViewNews. aspx?NewsID=9590000063416
  Previous Topic Topic Next Topic  
 ตั้งหัวข้อใหม่  ตอบกลับหัวข้อนี้
 พรินต์ส่งให้เพื่อน
Jump To:
สำนักบริการวิชาการ มหาวิทยาลัยบูรพา © สำนักบริการวิชาการ มหาวิทยาลัยบูรพา Go To Top Of Page
This page was generated in 0.03 seconds. Snitz Forums 2000