• Canate Dew

[บันทึกการอ่าน] เทคนิคการทำนายจำนวนคนตอบสนองกับโฆษณาออนไลน์



บันทึกการอ่าน การทำนายจำนวนของผู้ใช้งานที่ตอบสนองกับโฆษณาออนไลน์ User Response Prediction in Online Advertising (Ghanribshah and Zhu, 2021)


ในการวิจัยได้ศึกษาและรวบรวมหลักการทำนายจำนวนของคนที่ตอบสนองกับโฆษณาออนไลน์ไม่ว่าจะเป็นโฆษณาผ่านการค้นหา (Search Ad) การโฆษณาด้วยรูปภาพ (Display Ad) การโฆษณาด้วยวีดีโอ (Video Ad) หรือการโฆษณาในโซเชียลเน็ตเวิร์ค ซึ่งในวิจัยนี้จะอธิบายถึง ความสำคัญของการโฆษณาออนไลน์ กระบวนการของการโฆษณาเบื้องต้น หลักการวัดผลของโฆษณา ประเภทของข้อมูลในการใช้ทำนาย จนไปถึงเครื่องมือที่ใช้ในการทำนายจำนวนผู้ตอบสนองกับโฆษณาออนไลน์


ในงานวิจัยได้อธิบายถึงความสำคัญของการโฆษณาในปัจจุบันในทางธุรกิจที่สามารถทำเงินได้มหาศาล ซึ่งการโฆษณาออนไลน์นั้นวัดผลประสบความสำเร็จได้ด้วยการตอบสนองของผู้ชมที่มีต่อโฆษณานั้นๆ หลายบริษัทที่เป็นผู้ให้บริการพื้นที่โฆษณา (Publisher) จึงพยายามพัฒนาอัลกอริทึ่มเพื่อทำนายผลการตอบสนองของผู้ชม (User) ต่อโฆษณาออนไลน์ให้แม่นยำมากที่สุด เพื่อดึงดูดให้นักโฆษณา (Advertiser) ในธุรกิจต่างๆเข้ามาซื้อพื้นที่ในการโฆษณาและ สามารถเผ่ยแพร่โฆษณาที่ต้องการให้ได้ตรงตามกลุ่มเป้าหมายโดยที่มีประสิทธิภาพสูงสุด ซึ่งการคำนวนด้วยเพื่อทำนายผลนั้นมีหลากหลายวิธีและในปัจุบันการใช้ Machine Learning ก็เป็นทางเลือกที่หลายแห่งเลือกใช้เพื่อให้เกิดความแม่นยำสูงที่สุด แต่กระนั้นก็ยังมีปัญหาในการคำนวนด้วยที่ยังเป็นปัญหาใหญ่ในการรับมือ

  • Scalability - ข้อมูลในอินเตอร์เน็ตนั้นมีจำนวนมหาศาลทำให้ยากมากขึ้นต่อการจัดเก็บข้อมูล และการคำนวนผลทำนายแบบทันที (Real-time prediction)

  • Response Rarity - จำนวนผู้ใช้ที่ตอบสนองต่อโฆษณามีน้อยเมื่อเทียบกับจำนวนของโฆษณาออนไลน์ที่เผยแพร่ไปทำให้เกิดความไม่สมดุลกันของข้อมูลในการเปรียบเทียบและคำนวน (Imbalance data)

  • Data Sparsity - การบันทึกผลการตอบสนองของโฆษณาเป็นการบันทึกแบบตัวเลข 1 และ 0 (1 คือผู้ใช้ตอบสนองกับโฆษณาและ 0 คือผู้ใช้ไม่ตอบสนองกับโฆษณา) ซึ่งการเก็บข้อมูลแบบนี้นั้นทำให้มีข้อมูลที่เป็นเลข 0 มากเพราะผู้ใช้ตอบสนองโฆษณาเป็นจำนวนน้อยกว่าจำนวนสินค้าและบริการที่โฆษณา

  • Cold Start - ในการคำนวนนั้นต้องใช้ข้อมูลในอดีตในการคำนวนแต่ปัญหาของสินค้าและบริการใหม่คือไม่มีข้อมูลในอดีตสำหรับการทำนายผลที่เพียงพอทำให้ความแม่นยำในการทำนายผลไม่มีประสิทธิภาพ


เข้าใจการทำงานของการโฆษณา


หลักการโฆษณานั้นเป็นการแข่งประมูลกันเพื่อชิงพื้นที่ในการโฆษณาออนไลน์ ผู้ที่ชนะการประมูลจะได้พื้นที่ในการเผยแพร่โฆษณา และเมื่อผู้ใช้งานเว็บไซต์ หรือโซเชียลเน็ตเวิร์คตอบสนองกับโฆษณา (กดคลิก กดไลค์ หรือกดดูโฆษณา) ผู้ซื้อโฆษณาจะต้องจ่ายค่าโฆษณาให้กับผู้ให้บริการเผยแพร่โฆษณา

โดยทั่วไปแล้วในการหาผู้ใช้ที่จะตอบสนองกับโฆษณานั้น ผู้ให้บริการพื้นที่โฆษณาจะทำการรวบรวมและวิเคราะห์ข้อมูลของประวัติการใช้งานของผู้ใช้งาน เพื่อระบุความสนใจและพฤติกรรมของผู้ใช้ และนำเสนอโฆษณาที่ตรงกับความสนใจนั้น หลักการในการวัดผลที่สำคัญที่ใช้เป็นส่วนใหญ่ได้แก่

  • Click-Through Rate - เป็นสัดส่วนจำนวนการคลิกโฆษณาเทียบกับจำนวนการมองเห็นของโฆษณา (ในปัจจุบันอาจจะนับเป็นการดาวน์โหลด การแชร์ การแสดงความคิดเห็น แทนจำนวนการคลิก) ปัญหาในการวัดผลแบบนี้คือข้อมูลที่ไม่สมดุล เพราะจำนวนผู้คลิกมีน้อยเมื่อเทียบกับจำนวนผู้เห็นโฆษณา ซึ่งอาจจะทำให้ผลการทำนายผู้ใช่ผิดเพี้ยนไปได้

  • Conversion Rate - จะแตกต่างจากการวัดผลแบบแรกตรงที่เป็นการวัดผลถึงการประสบการณ์การใช้งานหลังจากคลิกโฆษณาแล้ว อย่างการวัดผลที่เมื่อมีคนเห็นโฆษณาแล้วคลิกเข้าเว็บไซต์ และซื้อสินค้าบนเว็บไซต์ ในการวัดผลนี้จะนับจำนวนผู้ที่ซื้อสินค้าบนเว็บไซต์เทียบกับจำนวนผู้เห็นโฆษณา

  • User Engagement - เป็นการวัดผลเพื่อให้วัดประสิทธิภาพของโฆษณาที่ทำให้ผู้ใช้ยังคงใช้บริการต่อเนื่อง เป็นการคำนวนการเลิกใช้งาน (churn-rate) และเวลาการใช้งาน (dwell time) อย่างระบบแนะนำสินค้าในเว็บอีคอมเมิร์ซที่พยายามแนะนำสินค้าที่ตรงตามความต้องการของผู้ใช้พร้อมกับการแทรกโฆษณาสินค้าในจำนวนที่เหมาะสม เพื่อให้ผู้ใช้ยังคงใช้บริการเว็บอีคอมเมิร์ซ อยู่เป็นต้น การวัดผลที่เป็นที่นิยมคือ MAP@K (Mean average precision at rank K), MAR@R (Mean average recall at rank K) และ NDCG@K ( Normalized Discounted Cumulative Gain at rank K)

  • Explicit user feedback - เป็นการวัดผลโดยให้คะแนนจากผู้ใช้และสามารถวัดได้ทั้งความคิดเห็นบวกและลบเพราะเป็นการให้คะแนน อย่างการให้คะแนนสินค้า การให้คะแนนวีดีโอ การให้คะแนนจากการตอบแบบสอบถามเป็นต้น


ข้อมูลที่นำมาใช้ในการทำนายผล


ประเภทของข้อมูลที่ในงานวิจัยนี้ได้สรุปและแบ่งออกเป็น 3 ประเภทได้

  1. Multi-field categorical features - เป็นการเก็บข้อมูลของผู้ใช้ ผู้ซื้อโฆษณา ผู้ให้บริการพื้นที่โฆษณา และบริบทต่างๆ ซึ่งส่วนใหญ่จะบันทึกอยู่ในรูปแบบ binary vector (ข้อมูลเป็น 1 และ 0) แต่ปัญหาของการเก็บข้อมูลในรูปแบบนี้คือ high dimensionality เพราะมีเลข 0 เป็นจำนวนมาก การแก้ไขปัญหานี้คือการทำ Embedding เพื่อเป็นการบีบข้อมูลให้เป็นเวคเตอร์ที่มีขนาดเล็กลง

  2. Textual features - เป็นข้อมูลประเภทข้อความที่จะพบได้ในการโฆษณาแบบการค้นหา หลักการคือการนำเอาคำค้นหามาเปรียบเทียบคำ (Keywords) ของโฆษณาและแสดงผลโฆษณาที่มีค่าใกล้เคียงมากที่สุด โดยข้อมูลที่เก็บมีตั้งแต่หัวข้อ คำบรรยายาย และ URL เป็นต้น

  3. Visual features - ในอีคอมเมิร์ชและแพลตฟอร์มที่ให้บริการวีดีโอจะเป็นการเก็บข้อมูลภาพของสินค้าหรือบริการเพื่อมาวิเคราะห์และพัฒนาการทำนายผลของผู้ตอบสนองต่อโฆษณาด้วยเช่นกัน

โดยการเก็บข้อมูลนั้นจะบันทึกพฤติกรรมของผู้ใช้งานตามเวลาการใช้งานด้วยอย่างการบันทึกเป็น Session ของผู้ใช้งานที่จะบันทึกเมื่อผู้ใช้งานเข้ามาใช้บริการเว็บไซต์หรือแอปพลิเคชั่นช่วงเวลาหนึ่งและออกไป เมื่อผู้ใช้บริการคนเดิมกลับมาใช้บริการใหม่ก็จะเริ่มนับเป็น Session ใหม่ การบันทึกแบบนี้ช่วยให้เห็นความเปลี่ยนแปลงของพฤติกรรมของผู้ใช้และยังช่วยพัฒนาความแม่นยำของการทำนายผลผู้ตอบสนองต่อโฆษณาอีกด้วย หรือการนำข้อมูลมาวิเคราะห์ร่วมกัน (Hybrid Features) อย่างการเอาข้อมูลภาพมาใช้ร่วมกับข้อมูล Multi-field categorical features หรือการนำข้อมูลแบบข้อความมารวมกับข้อมูลแบบ Multi-field categorical features เป็นต้น


การคำนวนที่นำมาใช้เพื่อทำนายผล


จากงานวิจัยนี้ได้อธิบายถึงการทำนายผู้ตอบสนองต่อโฆษณามีการพัฒนามาอย่างต่อเนื่องจนในปัจจุบันมีการใช้ Machine Learning ในการคำนวนอย่างแผ่หลายโดยเฉพาะการทำ Deep Learning เพราะว่ามันสามารถจัดการข้อมูลที่มีจำนวนฟีเจอร์เยอะได้ และสามารถเรียนรู้ที่จะสร้างฟีเจอร์ใหม่เองได้เพื่อให้การทำนายผลมีความแม่นยำมากขึ้น และได้รวบรวมหลักการทำนายไว้ดังนี้

  1. Data Hierarchy Based Approaches เป็นการจัดเรียงข้อมูลเป็นโครงสร้างต้นไม้แตกย่อยลงมา สามารถแก้ปัญหา Cold Start และ Data Sparsity ได้ ซึ่งการสร้างและดูแลจะต้องใช้ผู้เชี่ยวชาญในการสร้าง

  2. Collaborative Filtering Based Approaches เป็นวิธีที่สามารถทำนายความสนใจของผู้ใช้ที่มีประสิทธิภาพ โดยการเก็บข้อมูลของผู้ใช้คนก่อนและมาทำนายพฤติกรรมของผู้ใช้คนใหม่ที่มีความคล้ายกับผู้ใช้คนก่อนๆ

  3. Supervised Learning-Based Approaches เป็นการทำนายผลโดยที่กำหนดผลลัพธ์เป็นข้อมูลแบบ binary หรือ multi-class ไว้และสร้างโมเดลเพื่อทำนายผู้ตอบสนองต่อโฆษณาในอนาคตตามฟีเจอร์ที่เราได้เลือกในการสร้างโมเดลขึ้นมา

  4. Predictive Models

  5. Logistic Regression เป็นการคำนวนผลลัพธ์ในรูปแบบ binary แต่จะมีปัญหาในการทำนายหากข้อมูลไม่สมดุล หรือข้อมูลมีน้อย หรือข้อมูลที่มีความสัมพันธ์ไม่เป็นเส้น จุดอ่อนของโมเดลนี้สามารถใช้ Cascading มาช่วยในการแก้ปัญหาได้

  6. Factorization Machines เป็นการใช้ Support vector machine ร่วมกับ Factorization models ทำให้สามารถจัดการความสัมพันธ์ไม่เป็นเส้นของฟีเจอร์ได้ สามารถจัดการ Data Sparsity ได้ไม่ดีหนักเมื่อข้อมูลมีหลายมิติ

  7. Deep Learning Methods เพื่อจัดการปัญหา Data Sparsity และมีโมเดลที่ต่อยอดจาก Deep neural network (DNN) อย่าง Recurrent neural network (RNN) และ Convolutional neural network (CNN) เพื่อช่วยแก้ปัญหานี้

  8. Ensemble Methods การใช้ Machine Learning โมเดลเดียวอาจจะไม่ได้ผลลัพธ์ที่ดีที่สุด การนำโมเดลหลายๆโมเดลมาเชื่อมต่อกันหรือมารวมกันจะทำให้ผลลัพธ์ของผลทำนายออกมามีประสิทธิภาพมากขึ้น ซึ่งมีวิธีการอย่าง Cascading, Stacking, Boosting และ Mixed เป็นต้น

  9. Unsupervised and Semi-supervised Approaches

  10. Network-Based ข้อมูลธุรกิจในปัจจุบันมีลักษณะเป็นเน็ตเวิร์คมากขึ้นการคำนวนโครงสร้างเน็ตเวิร์คจึงเป็นอีกหนึ่งวิธีที่สามารถนำมาทำนายการตอบสนองของผู้ใช้ต่อโฆษณาได้

  11. Graph Neural Networks (GNN) เป็นที่รู้จักในประสิทธิภาพของการพัฒนาโมเดลสำหรับการทำนายผลด้วยข้อมูลที่เป็นเน็ตเวิร์คได้ แต่มีข้อเสียที่มีต้นทุนในการคำนวนสูง

  12. Clustering-Based เป็นการแบ่งกลุ่มข้อมูลที่มีความคล้ายคลึงกันให้อยู่ในกลุ่มเดียวกันซึ่งมีหลายวิจัยได้พัฒนาการ Clustering เพื่อทำนายผู้ตอบสนองต่อโฆษณา แต่ผลที่ได้อาจจะมีความหลากหลายมากเกินไป

  13. Stream Based Framework สามารถปรับเปลี่ยนและตอบสนองความต้องการหรือความสนใจของผู้ใช้ตามเวลาที่เปลี่ยนไปได้ ใช้การเก็บข้อมูลตัวอย่างแบบ Reservoir technique ซึ่งเป็นการเก็บข้อมูลแบบกำหนดขนาดไว้ได้และทำการสุ่มข้อมูลใหม่เพื่อมาแทนข้อมูลที่มีอยู่

โดยสรุปแล้ววิจัยนี้เป็นการรวบรวมและรีวิวงานวิจัยต่างๆที่เกี่ยวกับการทำนายผลโฆษณาออนไลน์ อธิบายหลักการโฆษณาออนไลน์ไว้อย่างละเอียด และเปรียบเทียบการนำโมเดลต่างๆมาใช้ในการทำนาย ทำให้สามารถผู้ที่ต้องการศึกษาและพัฒนาต่อสามารถเข้าใจถึงการนำโมเดลต่างๆและทราบถึงข้อจำกัดในแต่ละโมเดลเพื่อนำไปใช้ในการทำนายผู้ตอบสนองต่อโฆษณาที่เหมาะสมที่สุด




ดู 89 ครั้ง0 ความคิดเห็น