• Devver

10th Day: เหนื่อยควรพักหรือควรฝืนต่อไป (10/365 to be Data Scientist)



เดวฟ์ตื่นขึ้นในเช้าที่ร้อนอบอ้าวสัญญาณหน้าร้อนมาถึงแล้วสินะ ที่ต้องถูกปลุกเพราะเหงื่อท่วมตัว เป็นวันที่เดวฟ์ไม่มีพลังเหลือในการฝึกทักษะอะไรเลย เดวฟ์จึงตัดสินใจจัดห้องที่ปล่อยให้รกหูรกตามาเกือบ 1 อาทิตย์ มันเต็มไปด้วยข้าวของที่กระจัดกระจายยากที่จะจินตนาการถึง เหมือนเดวฟ์ได้นำทุกอย่างมากองไว้ที่พื้น เสื้อผ้าใช้แล้วแทนที่จะอยู่ในตระกร้า เสื้อผ้าที่ยังไม่ใส่แทนที่จะอยู่ในตู้ เหรียญทุกประเภทกระจัดกระจายอยู่ทุกตารางเมตร ขวดน้ำสารพัด เสื่อออกกำลังกายกางอยู่กลางห้อง กระเป๋าเดินทางใบเล็กที่วางทับบนเสื่อ และกระเป๋าเดินทางใบใหญ่ที่เปิดอ้าซ่า


"แค่มองก็เหมือนพลังงานของวันนี้หมดไปแล้ว" เดวฟ์บ่นกับตัวเอง


เด็กหนุ่มใช้เวลาช่วงเช้าเคลียข้าวของทั้งหมดและทิ้งตัวลงบนเตียงเพียงเพื่อแค่จะพักผ่อนสักพักจากความเหนื่อยล้าที่ใช้ไปกับการจัดข้าวของให้เข้าที่เข้าทางทั้งหมด แต่เผลอไปเพียงแค่ไม่กี่นาทีกลายเป็นสองชั่วโมงที่เขาเผลอหลับไป เขายังอยากที่จะเรียนรู้บางอย่างในวันนี้ ไม่อยากให้ความตั้งมั่นที่เขามีต้องผ่านไปโดยเปล่าประโยชน์อีกวัน เขายังจะทบทวน Network Analytic ต่อจากเมื่อวาน วันนี้เขาพยายามที่จะเข้าใจเรื่อง Spectral Clustering


Spectral Clustering เป็นหนึ่งวิธีการที่จะช่วยแบ่งคอมมิวนิตี้ของเน็ตเวิร์คได้ แต่ก่อนหน้าที่จะได้เข้าใจถึงวิธีการนี้ เดวฟ์ได้เรียนรู้การแบ่งคอมมิวนิตี้ในเบื้องต้น Minimal Cut ที่จะแบ่งคอมมิวนิตี้ด้วยการดูเส้นเชื่อมที่น้อยที่สุดในเน็ตเวิร์คนั้นแต่ว่าการตัดแบบนี้นั้นมีปัญหาคือไม่สามารถหา Optimal Cut ได้


หากจะอธิบายให้ละเอียดเพื่อให้เห็นภาพมากขึ้นคือในการแบ่งกลุ่มหรือคอมมิวนิตี้นั้น เราสนใจอยู่ 2 อย่างคือ 1. ความสัมพันธ์ของโหนดในคอมมิวนิตี้กับคอมมิวนิตี้อื่นที่น้อย 2. ความสัมพันธ์ของโหนดภายในคอมมิวนิตี้เดียวกันที่มาก ซึ่ง Minimal Cut นั้นสนใจแค่ข้อ 1 เท่านั้นบางทีอาจจะตัดมาแล้วหลุ่มแรกมีสมาชิดอยู่ 10 โหนดแต่กลุ่มที่ 2 มีอยู่แค่ 1 โหนด นั้นจึงเป็นที่มาของ Conductance ที่จะเพิ่มข้อ 2 เข้าไปในการคำนวนด้วยซึ่งทำให้สามารถแบ่งเน็ตเวิร์คเป็นคอมมินิตี้ได้มากขึ้น


"อยากจะเข้าใจ Spectral Clustering ต้องเข้าใจเรื่อง Linear Algreba และ Matrix หรอเนี่ย" เดวฟ์ไม่ได้ถามใคร ไม่ได้ถามแม้กระทั่งตัวเองแต่เขากำลังตกใจกับสิ่งที่เข้ายังไม่ถนัด


เดวฟ์ต้องเข้าใจถึงและสร้างมันขึ้นมา Adjacency Matrix, Degree Matrix เพื่อนำมาสร้าง Laplacian Matrix แล้วต้องเข้าใจการหา Eigenvectors and Eigenvalues มันช่างยากสำหรับเดวฟ์ผู้ที่กำลังทบทวนเรื่องคณิคศาสตร์แต่ยังถึงแค่การแก้สมการง่ายๆเท่านั้นเอง เขาเพียงแค่พอจะเข้าใจพวกนี้บ้างแต่ยังไม่สามารถจำได้ทั้งหมด หลังจากนั้นก็เข้าสู่การทำ Spectral Clustering แต่เพียงแค่นี้ยังไม่จบ เขายังต้องเข้าใจการใช้ Mutiple Eigenvectors ในการหา Spectral Clustering ที่จะช่วยให้การแบ่งกลุ่มนั้นชัดเจนมากขึ้น กลุ่มที่ใกล้ก็จะเห็นความสัมพันธ์ที่เหนียวแน่น กลุ่มที่ไกลก็จะโดนผลักให้ไกลออกไปมากขึ้น เป็นแบบนี้แล้วมันดีกว่าการใช้ Eigenvectors แค่ตัวเดียวแน่นอน


"จำนวน Eigenvectors ที่จะเลือกต้องดูจาก Lambda Gap ที่มากที่สุด" เดวฟ์พยายามที่จะจำให้ได้มากที่สุดเท่าที่จะทำได้ แต่เขายังต้องตกตะลึงเมื่อรู้ว่ามันยังมีต่อสิ่งที่เขาเรียนมามันเป็นเพียงการแบ่งกลุ่มด้วยเส้นเท่านั้น เด็กหนุ่มยังต้องเข้าใจว่า Spectral Clustering ยังมีแบบที่ใช้แบ่งด้วย Motif อีกด้วย นั้นมันจำเป็นอย่างมากที่เขาจะต้องไม่ลืมว่า Motif คืออะไรมันเป็นการเอาพื้นฐานมาต่อยอดอีกที ซึ่งการแบ่งกลุ่มด้วยโมทีฟนั้นจะทำให้เห็นคุณลักษณะของกลุ่มชัดเจนมากขึ้น


เพียงเรียนไปแค่วิชาเดียวเดวฟ์ก็พลังหมดเสียแล้ว เขาตัดสินใจที่จะออกกำลังกายต่อหลังจากนั้นเขาก็ได้พักผ่อนด้วยการดูเด็กหนุ่มคนอื่นล่าฝันของพวกเขาที่จะได้เป็นไอดอลในนรายการ Youth With You ในเส้นทางแห่งความฝันมีคนที่ต้องผิดหวังมากมาย ไม่ได้เข้ารอบ 60 คนสุดท้ายกว่าหลายเดือนที่ทุกคนต้องแข่งขันเพื่อชิงความเป็นหนึ่ง และต้องได้การยอมรับจากผู้ชมทั่วโลก (การโหวต) มันยังเป็นการแข่งขันที่เต็มไปด้วยความฝัน ความมุ่งมั่น แต่มันก็ต้องมีผู้ที่ผิดหวังกลับไป เดวฟ์เห็นพลังของเด็กหนุ่มพวกนั้น และหวังว่าเขาจะมีพลังแบบนั้นในตัวเหลืออยู่บ้าง

ดู 10 ครั้ง0 ความคิดเห็น