• Canate Dew

เรียน Data Science 3 เทอมที่ NIDA อย่างสะบักสะบอม (ยังเหลืออีก 1 เทอม)

อัปเดตเมื่อ 24 ก.ย. 2564

ห่างหายกันไปหลายเดือนเลยกับเรื่องราวการเรียนในคณะสติถิประยุกต์ที่นิด้า สาขาวิทยาศาตร์ข้อมูล (DADS NIDA) ถ้าใครที่จิดจามกันมานะครับ ผมจะบอกในเกือบทุกบทความว่าการเรียนในสาขานี้มันใช้พลังมหาศาลและเหน็ดเหนื่อยมากถ้ายิ่งเป้นการเรียนภาคพิเศษ ยิ่งคนที่ไม่รู้เลขและโค้ด ต้องก้าวสู่โลกของ Data Science (ตอนที่ 1) อย่างผมก็ทำเอาสะบักสะบอมมีอารมณ์เหนื่อยบ้างท้อบ้าง แต่ทุกครั้งที่ผ่านมาผมก็ผ่านมาได้ด้วยดี พร้อมกับเพื่อนๆในสาขาที่ช่วยเหลือกันอย่างดีมาตลอดรวมถึงในเทอมที่ 3 นี้ด้วยเช่นกัน ซึ่งในเทอมที่ 3 นี้เหมือนเจอของแรงของจริงเข้าให้แล้ว

  • Social and Network Analytics

  • Big Data Analytics

  • Data Streaming and Real-time Analytics

  • Natural Language Processing (NLP)

ด้วยความเคราะห์ร้ายทำให้ต้องเจอ 3 วิชาในวันเสาร์ด้วยเช่นกัน Social and Network Analytics, Big Data Analytics, และ Natural Language Processing (NLP) เรียกได้ว่าวันเสาร์ตื่นมาเรียนตั้งแต่ 9 โมงเช้ายัน 1 ทุ่มเลยทีเดียว ซึ่งวิชาแต่ละวิชาในเทอมนี้จะเป็นขั้น Advanced หมดแล้วนั้นหมายความว่าพื้นฐานการเขียนโค้ดและพื้นฐานการคำนวนต้องแม่นในขั้นที่แบบฟังแล้วไม่ต้องกลับไปเปิดหนังสือทวน เพราะงานทุกวิชาต้องส่งเป็นการเขียนโค้ดทั้งหมด และมีสมการมาเกี่ยวข้องเต็มไปหมด ถ้าไม่ไหวก็ต้องไหวแล้วครับเทอมนี้


I'M NOT GONNA STOP, THAT'S WHO I AM


จากการเรียนที่ผ่านมาแล้วนั้นเทอมที่ 3 นั้นวิชา Social and Network Analytics และ Big Data Analytics สอนโดยอาจารย์อเล็ก ถ้าใครอยากรู้แบบละเอียดว่าเนื้อหาในวิชานี้เรียนอะไรบ้างสามารถไปดูได้ที่ช่องของอาจารย์เลยครับ Alex About Data ในบทความนี้ผมจะเล่าเพียงแบบเอาเท้าจุ่มขอบสระเท่านั้น ไม่เอาทั้งตัวลึกลงไปในแต่ละวิชาเพราะมันลึกมากเลยทีเดียว


Social and Network Analytics คือการวิเคราะห์ข้อมูลผ่านความสัมพันธ์ของกันและกันที่สามารถสร้างความสัมพันธ์ขึ้นมาเป็นเครือข่ายได้ ซึ่งวิชานี้จะใช้ความรู้เรื่องการสร้างกราฟความสัมพันธ์ หรือเน็ตเวิร์ค จะได้เรียนรู้การวาดกราฟตั้งแต่เบื้องต้นว่า Node คืออะไร Edge คืออะไรแล้วความสัมพันธ์มีรูปร่างหน้าตาเป็นอย่างไร ซึ่งทุกสิ่งที่เกิดขึ้นบนโลกแล้วล้วนแต่มีความสัมพันธ์ซึ่งกันและกัน และแต่กลุ่มความสัมพันธ์หรือ Community ก็จะมีเอกลักษณ์ที่จะทำให้เราสามารถวิเคราะห์ในแง่มุมต่างๆได้

วิชานี้จะมีประโยชน์อย่างมากในการจัดกลุ่มความสัมพันธ์ หรือการวิเคราะห์ว่าสิ่งที่เรากำหลังสนใจเนี่ยอยู่กลุ่มไหนในเน็ตเวิร์คนี้ ซึ่งจะมีหลักการคำนวนและอัลกอริทึมมากมายในการศึกษาและวิเคราะห์ ความรู้เรื่องเมทริกซ์ก็จะวนกลับมาใช้ในวิชานี้เช่นกัน เพราะเราต้องนำกราฟที่เราเห็นมาจัดอยู่ในรูปของตัวเลขหรือเมทริกซ์ให้ได้ เพื่อนำข้อมูลเหล่านั้นมาคำนวนต่อไปนั้นเอง และสุดท้ายเราก็จะได้เรียนรู้เรื่อพวกหลักการทำงานของพวก Graph Neural Network ซึ่ง Nueral Network เป็นอีกหนึ่งสิ่งที่ในปัจจุบันทุกคนในด้าน Data Science ให้ความสนใจไม่น้อยเลย


Big Data Analytics คือการเอาข้อมูลที่มีอยู่มากมายมหาศาลมาคำนวนให้ได้ ซึ่งในวิชานี้ก็ถือเป็นวิชาที่สำคัญเพราะในปัจจุบันข้อมูลมันเยอะขึ้นเยอะขึ้นเรื่อย การคำนวนข้อมูลที่มีจำนวนมากในคราวเดียวกันไม่สามารถทำได้ด้วยเครื่องคอมพิวเตอร์เพียงเครื่องเดียว ในวิชานี้ก็จะได้เรียนรู้หลักการจัดข้อมูลที่มีความคล้ายกันให้ไปอยู่หมวเดียวกัน มีการเรียนรู้วิธีการทำ Locality Sensitive Hashing (LSH) วิธีการจัดการกับข้อมูลที่ไหลเข้ามาเรื่อยๆ (Data Stream) ว่าเราต้องแบ่งการคำนวนมันอย่างไร การคำนวนมันทัั้งหมดไม่สามารถทำได้แน่นอน เพราะฉะนั้นหัวใจสำคัญในวิชานี้คือการวิเคราะห์แบบประมาณการเพื่อที่เราจะได้วิเคราะห์คร่าวๆถึงสิ่งที่กำลังเกิดขึ้นอยู่กับข้อมูลที่เรามีอยู่มหาศาลนั้นเอง และในวิชานี้เรายังได้เรียนรู้การทำ Recommender System ที่เป้นการนำข้อมูลมหาศาลมาทำนายผลสินค้าหรือบริการที่ถูกต้องกับกลุ่มแต่ละกลุ่มอีกด้วย



STICK TO THE STATUS QUO? NO!


ในระหว่างเรียนเทอมที่ 3 นี้เราก็จะเริ่มมีความสงสัยในตัวเองมากขึ้นกับ status quo (สถานภาพที่เป็นอยู่, ฐานะที่เป็นอยู่, สภานการณ์ที่เป็นอยู่) เราจะเริ่มคิดแล้วว่าที่เราเป็นอยู่มันก็ดีแล้วนี่ ความรู้เรามีก็สามารถอยู่รอดได้อยู่แล้ว เรียนสายภาษากับเรียนการตลาดมากระโดดมาด้านนี้เลยมันจะทำได้ดีไหม อันที่จริงแล้วถ้าเราอยู่ในด้านการตลาดต่อไปเราก็ถือว่ารู้เกือบทุกเรื่องที่เกี่ยวข้องกับการตลาดแล้ว ถ้าใครเคยดูหนังเรื่อง High School Musical Triology ยินดีด้วยคุณมีวัยเด็กช่วงเดียวกับผม (ถ้ายังไม่เคยดูต้องนี้มีใน Disney + ทั้งสามภาครวมถึงภาคย่อย ภาคเสริม ภาคเดี่ยวตัวละคร)

มันฟีลเดียวกับตัวเอกของตัวละครที่พระเอกเล่นบาสเก่งมากๆ นางเอกก็เรียนวิชาการเก่งมากๆ แต่ทั้งสองกลับอยากจะเข้าชมรมละคร อยากจะแสดงความสามารถทางด้านร้องเพลงแต่ก็ไม่กล้าที่จะก้าวข้ามสถานภาพของตัวเอง เพราะด้วยสังคมรอบข้างที่กดดันว่าพวกเขาทำไม่ได้หรอกอยู่เส้นทางเดิมรุ่งอยู่แล้ว ย้ายไปก็ไม่รอดแถมจะทำให้ตัวเองอับอายเสียเปล่า สิ่งเหล่านี้เรียกว่า Status quo bias

Status quo bias นี่แหละที่พยายามกั้นเราไว้ไม่ให้เราเปลี่ยนแปลงและมันยากมากที่เราจะสู้กับมัน เพราะสถานะที่เราเป็ยอยู่มันก็ดีอยู่แล้วเราจะเปลี่ยนไปทำไม เรามีความสุขในการที่เราเรียนรู้ด้านภาษา ด้านการตลาดอยู่แล้ว ทำไมเราต้องมาเริ่มต้นใหม่กับการเรียนเลขและการเรียนโค้ดด้วย ทำไมต้องเก่งไปเสียทุกอย่าง ในเมื่อสิ่งที่เรารู้เรามีมันพอเพียงแล้ว แต่คำว่าพอเพียงถือว่าเป็นกับดักสำคัญในการเรียนรู้เลยทีเดียว มันตรงกันข้ามกับความอยากได้ อยากมี อยากรู้ มันทำให้เราหยุดที่จะจินตนาการถึงสถานภาพในอนาคต หรืออาจจะหยุดสร้างสรรค์สิ่งใหม่เลยก็ว่าได้


ช่วงเทอมนี้มันเลยเป้นช่วงลังเลควรไปสุดหรือควรหยุดหรือควรทำพอผ่าน เป็นช่วงที่ทำให้ความพยายามในการเรีนหลายลดลงไป หรือบางครั้งก็หยุดพยายามไปชั่วครู่เสียดื้อๆ คนที่ติดตามผมอยู่จึงอย่าแปลกใจถ้าบางครั้งก็ไม่ได้เขียนบ่อยเหมือนแต่ก่อน เพราะหายไปพักผ่อนจิตใจ ไปทำการบ้าน ไปอ่านหนังสือ บางทีไปสู้กับ Status quo bias อยู่นั้นเอง


BOP TO THE TOP


ที่เล่ามาจนถึงตอนนี้ยังไม่ได้อธิบายถึงอีกสองวิชาที่เจอเลย แค่ย้อนกลับไปนึกถึงเทอมที่ 3 มันหนักหนาสาหัสมากจริงเนื้อหาแต่ละวิชาเจาะลึกซับซ้อน ต้องใช้พลังงานในการเรียนรู้อย่างมากอีก 2 วิชานั้นก็ใช้พลังงานไม่แพ้ 2 วิชาแรก (ขอตั้งสติสักพักก่อนเล่าถึงอีกสองวิชา)


gif

Natural Language Processing (NLP) คือการทำความเข้าใจข้อมูลประเภทตัวหนังสือเป็นหลัก เราจะให้คอมพิวเตอร์เข้าใจภาษาคนได้อย่างไร อย่างแรกเลยคือการทำให้ตัวอักษรอยู่ในตัวเลขเพื่อที่เราจะเอามาคำนวนต่อได้ แต่แค่เพียงเราจะทำให้ตัวหนังสือการเป็นตัวเลขได้นั้น เราต้องผ่านกระบวนการต่างๆนานา รวมถึงการมีความรู้พื้นฐานด้านโครงสร้างภาษา หน้าที่ของคำแต่ละคำในประโยค แค่คนพูดกันเองภาษาเดีวกันเองบางที่ยังเข้าใจไม่ตรงกันเลย การที่จะนับให้คอมพิวเตอร์เข้าใจภาษาได้จึงเป็นสิ่งที่ยากอย่างมาก หน้าที่ของเราคือต้องสอนให้คอมพิวเตอร์เรียนรู้สิ่งเหล่านี้ให้ได้

ในวิชานี้ก็จะได้เรียนรู้การแบ่งคำ การจัดหมวดหมู่ว่าคำแต่ละคำอยู่ในบริบทไหนได้บ้าง การเรียนรู้โมเดลที่สำคัญที่ใช้ในการทำ NLP ไม่ว่าจะเป็น Word2Vec, FastText, GloVe และอื่นๆอีกมากมาย ถ้าผ่านวิชานี้ไปได้เราจะเรียนรู้ถึงการจัดการข้อมุลที่มาเป็นข้อความตั้งแต่กระบวนการแรกถึงกระบวนการสุดท้ายอย่างการวิเคราะห์ประเภทลูกค้าผ่านการคอมเม้นท์ การสร้างโมเดลให้ช่วยสรุปใจความสำคัญ หรือแม้กระทั่งการช่วยให้โมเดลเขียนบทความให้เองเลยก็ยังได้


Data Streaming and Real-time Analytics คือการวิเคราะห์ผลแบบทันทีทันใดเดี๋ยวนั้นเมื่อข้อมูลมันไหลเข้ามาหาเราในระบบ ซึ่งในหลายธุรกิจก็ต้องการการวิเคราะห์ผลเบื้องต้นอย่างทันที ไม่ว่าจะเป็นการแจ้งเตือนอันตราย การแจ้งเตือนเมื่อระบบผิดปกติ เป็นต้น ซึ่งในวิชานี้เราจะได้เรียนรู้การเก็บข้อมูลออนไลน์ในหลายรูปแบบทั้งการวิเคราะห์ข้อมูลที่ส่งผ่านมาทางมือถือ ณ ช่วงเวลานั้น หรือการคำนวนคะแนนของการเล่นเกมส์ออนไลน์เพื่อนำมาวิเคราะห์ประเภทผู้เล่นและหาผู้เล่นที่เก่งที่สุดเป็นต้น ก็เป็นอีกหนึ่งวิชาที่มีความท้าทาย แต่ก็มีความสำคัญที่จะเรียนรู้เพราะข้อมูลในปัจจุบันนั้นมันมาตลอดเวลาเหลือเกิน การคำนวนแบบเรียลไทม์ก็สามารถช่วยในหลายธุรกิจ หลายอุตสาหกรรมได้



เทอมนี้ถือเป็นเทอมที่โหดที่สุดเลยก็ว่าได้ยิ่งทำยิ่ง จึงขอมอบบทเพลงเสียงสะท้อนเป็นบทเพลงประจำเทอมนี้เลย "ใจหนึ่งก็ยังรัก ใจหนึ่งว่าพอแล้ว ตอนนี้ฉันควรทำตัวอย่างไร" แต่สุดท้ายผมก็ผ่านมาได้ด้วยความช่วยเหลือต่าๆนานาจากผู้คนรอบข้าง หลายคนที่เรียนก็คงรู้สึกเดียวกันแบบนี้ ใครที่กำลังจะเรียนก็ขอให้เตรียมใจให้พร้อมย้อนไปอ่านบทความการเตรียมตัวอย่าง ระวังตัวไว้ก่อนเริ่มเรียน Data Science ถ้าใครอยากติดตามบทความอื่นๆก็สามารถติดตามได้ที่แฟนเพจ Facebook Devvertory เลยนะครับ ผมมีบทความอะไรใหม่ๆก็จะอัพเดตผ่านแฟนเพจเช่นกันครับ



Something u don’t need to know:

I'm not gonna stop, that's who I am

Stick to the status quo

Bop to the top

ดู 718 ครั้ง0 ความคิดเห็น