Friday, 13 December 2019

บันไดห้าขั้นสู่การเป็น Data Scientist (ฉบับรับรองผล)

โร้ดแมปสำหรับการหางานเป็น data scientist ในเมืองไทย เขียนในบริบทของไทย customized สำหรับท่านผู้สนใจที่เป็นคนไทย โดยวันนี้จะนำเสนอบันไดห้าขั้นสู่การเป็น Data Scientist (ฉบับรับรองผล)

Art-template

(1) บันไดขั้นที่หนึ่ง (วุฒิการศึกษา)

ปัจจุบันงาน Data Science ส่วนใหญ่จะรับคนที่จบจากสาขาต่อไปนี้: Statistics, Mathematics, Computer Science, Engineering, MIS, Physics, Operation Research ท่านที่จบมาในสาขาดังกล่าว สามารถผ่านไปขั้นที่สองได้เลย แต่ถ้าท่านไม่ได้จบปริญญาตรีหรือโทในสาขาดังกล่าว มีทางแก้ได้ดังต่อไปนี้

1) บินไปเรียนต่อปริญญาโทด้าน Data Science/Analytics ที่ต่างประเทศ: ออฟชั่นนี้แพงสุด และต้องเสี่ยงลาออกจากงานที่ทำ รวมถึงไม่ได้ทำงานเป็นเวลา 1-2 ปี แต่ถ้าเรียนสำเร็จจากยูที่โอเคหน่อยมีโอกาสสูงมากที่จะได้งาน data science ในอเมริกาหรือสิงคโปร์ ซึ่งจะจ่ายเงินเดือนสูง โอกาสคืนทุนภายใน 9 เดือน (ในกรณีที่เรียนปีเดียว) (สนใจออฟชั่นนี้ลองอ่านรายละเอียดเพิ่มเติมที่นี่https://www.facebook.com/truebigdata/posts/664737983677840)

2) เรียน ปริญญาโทด้าน Data Science/Analytics จากมหาลัยต่างประเทศแบบออนไลน์: ข้อดีของออฟชั่นนี้คือไม่ต้องลาออกจากงานที่ทำอยู่ เรียนไปด้วยและทำงานที่เมืองไทยไปด้วยได้ และไม่ต้องเสียค่ากินอยู่เหมือนไปเรียนที่ต่างประเทศ แต่ต้องถือว่าเฉพาะค่าหน่วยกิตออนไลน์อย่างเดียวก็ยังมีราคาแพงอยู่ และอาจจะไม่มีความสะดวกในการหางานที่ต่างประเทศเท่ากับออฟชั่นแรก (อ่านรายละเอียดเพิ่มเติมที่https://www.facebook.com/truebigdata/posts/699930583491913)

3) เรียน ปริญญาโทด้าน Data Science/Analytics จากมหาลัยในประเทศ: ปัจจุบันมีโปรแกรมปริญญาโทด้าน Data Science/Analytics ดีๆในประเทศพอสมควร (อ่านรายละเอียดโปรแกรมปริญญาโททาง Data Science/Analytics ในไทยที่น่าสนใจ:

https://www.facebook.com/truebigdata/posts/680839798734325)

ข้อดีของการเรียนปริญญาโทในประเทศคือมีราคาถูก และผู้เรียนสามารถเรียนไปด้วยและทำงานไปด้วยได้ และถ้าต้องการโฟกัสหางาน data science ในเมืองไทย (ไม่ได้ต้องการไปทำงานต่างประเทศ) การเรียนปริญญาโทในประเทศถือเป็นออฟชั่นที่ดีที่สุดอันหนึ่ง

4) เรียนจาก MOOC เพื่อให้ได้ Data Science Certificate: แพลตฟอร์มการเรียนทางออนไลน์ (MOOC) ที่ดีและขอแนะนำมีสามตัวคือ edX (https://www.edx.org/), Coursera (https://www.coursera.org/) และ Udacity ( https://www.udacity.com/)

ทั้งสามตัวนี้ถ้าเรียนเป็นคอร์สๆไปก็ฟรีไม่ต้องเสียค่าใช้จ่าย แต่ถ้าเรียนเป็นหลักสูตรหลายๆคอร์สก็จะมีค่าใช้จ่าย แต่หลังจากเรียนจบจะได้ประกาศนียบัตรตามหลักสูตรที่เราเรียนจบ ซึ่งประกาศนียบัตรเหล่านี้สามารถใช้เป็นหลักฐานในการสมัครงาน data science ได้ (ถึงไม่ได้จบมาในสายที่เกี่ยวข้อง แต่ก็พิสูจน์มาแล้วจากการได้ประกาศนียบัตรมาว่า มีความรู้เพียงพอนะ) ข้อดีของออฟชั่นนี้คือมีราคาถูกสุด และเวลาในการเรียนสั้นและยืดหยุ่น แต่แน่นอนว่าความศักดิ์สิทธิของ certificate ในการใช้สมัครงานจะมีน้อยกว่าปริญญาบัตรในสามออฟชั่นแรก

(2) บันไดขั้นที่สอง (ปรับพื้นความรู้)

ท่านที่ปัจจุบันไม่ได้ทำงาน data science หรือห่างเหินมานานควรจะต้องทำการศึกษาองค์ความรู้ที่เกี่ยวข้อง ซึ่งจะเป็นประโยชน์ทั้งในตอนสัมภาษณ์งานและเวลาไปทำจริง ความรู้พื้นฐานที่ควรศึกษาได้แก่

1) สถิติ: เป็นพื้นฐานที่สำคัญของงาน data science แนะนำซีรี่ย์คอร์สวิชาสถิติของ UC Berkeley เรียนฟรีบน edX ประกอบด้วย

Descriptive statistics: https://www.edx.org/…/introduction-statistics-descriptive-u…

Statistical inference: https://www.edx.org/…/introduction-statistics-inference-uc-…

Probability and statistics: https://www.edx.org/…/introduction-statistics-probability-u…

2) Machine Learning: งานหลักของ Data Scientists ในยุคดิจิทัล จำเป็นต้องใช้ Machine Learning ในหลายส่วนงาน แนะนำคอร์สเรียน Machine Learning ระดับคุณภาพ เรียนฟรีทางออนไลน์

– Practical Machine Learning by Jeff Leek (Johns Hopkins University) เป็นคอร์สแบบง่ายสุด เหมาะแก่ผู้เริ่มต้นศึกษา เนื้อหายังอิงกับ Statistics, Data-Mining (https://www.coursera.org/learn/practical-machine-learning)

– Machine Learning by Andrew Ng (Stanford University) กลายเป็นคอร์สระดับตำนานในวงการไปแล้ว เป็น Gold standard สำหรับวิชา Machine Learning ในปัจจุบัน (https://www.coursera.org/learn/machine-learning)

– Learning from Data by Yaser Abu-Mostafa (CalTech) เป็น course ระดับ advance ขึ้นมาอีก (http://work.caltech.edu/telecourse.html)

ตำรา Machine Learning ฟรีออนไลน์ สำหรับ reference
Introduction to Statistical Learning (James, Witten, Hastie, Tibshirani): http://www-bcf.usc.edu/~gareth/ISL/

3) Analytical tools SAS/R/Python: Data Scientists ต้องใช้ tools เหล่านี้เป็นอย่างน้อย 1 ตัว (SAS, R, Python) จะเลือกใช้ Tool อะไรดี ลองอ่านบทความนี้เผื่อช่วยตัดสินใจ (https://www.facebook.com/truebigdata/posts/685402858278019)

สำหรับผู้ที่สนใจ R ลองอ่านตำราเรียน R ฟรี:
“R for Data Science” by Grolemund and Wickham (http://r4ds.had.co.nz/)

“Beginning R” by Mark Gardener (https://www.geekbooks.me/book/view/beginning-r)

วิดีโอสอน R ทางออนไลน์ของ Microsoft บน edX (https://www.edx.org/…/programming-r-data-science-microsoft-…)

รวมคอร์ส R ภาษาไทยของ รศ.ดร. ประเสริฐ คณาวัฒนไชย คณะพาณิชยศาสตร์และการบัญชี จุฬา (https://www.youtube.com/playlist…)

สำหรับผู้สนใจ Python อ่านตำรา Python ระดับคุณภาพ “Learn Python the Hard Way” by Zed Shaw ฟรีทางออนไลน์:http://learnpythonthehardway.org/book/

คอร์ส Python ของมหาวิทยาลัย Rice บน Coursera คอร์สนี้เหมาะสำหรับคนที่ไม่มีความรู้ด้าน Programming มาก่อนเลย:https://www.coursera.org/learn/interactive-python-1

(3) บันไดขั้นที่สาม (สะสมประสบการณ์-build profile)

เมื่อมีพื้นฐานความรู้ดีแล้ว ระหว่างรองานด้าน data science ก็ควรหมั่นฝึกปรือฝีมือเชิง data science ไปเรื่อยๆ โดยใช้ data ฟรีจากแหล่งต่างๆมาลองรันโมเดลเองดู ตัวอย่างแหล่งที่มี data ให้ใช้ฟรีเช่น
https://www.kaggle.com/datasets
http://archive.ics.uci.edu/ml/
http://aws.amazon.com/datasets/

เมื่อได้ผลแล้ว ลองเขียนบทความเกี่ยวกับงานที่เราทำลงในเวบไซด์ data science ที่ปัจจุบันมีมากมาย หรือลงใน facebook เพจ, LinkedIn หรือ เวปเพจเราเอง ซึ่งวิธีนี้จะเป็นการสร้าง profile ของเราให้เป็นที่รู้จักใน data science community

นอกจากนี้แนะนำให้ data scientist มือใหม่ทุกคนลองเข้าแข่งขัน Kaggle (Kaggle.com) โดยใน kaggle จะมีการ post โจทย์ทาง data science ในลักษณะโปรเจ็คพร้อม dataset ของจริงเพื่อให้เหล่า Data Scientists ที่เป็นผู้ใช้งานใน Kaggle ได้ลองรันโมเดล Data Science เพื่อแก้โจทย์ ซึ่งข้อดีของการเข้าแข่ง Kaggle นอกจากทำให้เราได้ฝึกปรือฝีมือทาง data science ไปเรื่อยๆ แล้ว เรายังสามารถใช้ผลจากการแข่งขัน Kaggle มาเป็น profile ของเราในการสมัครงาน data science ได้อีกด้วย (และถ้าเราทำได้ดีในการแข่งขัน ก็อาจมีแมวมองมาทาบทามเราไปทำงานเลย)

(4) บันไดขั้นที่สี่ (ออกงาน-หาความรู้-สร้าง connection)

ผุ้สนใจงานด้าน data science ควรหาโอกาสไปร่วมงานสัมมนา หรือการอบรมที่เกี่ยวข้องกับ data science โดยทางเวปไซด์ Data Science Thailand มีการอัพเดตงานสัมมนาและอบรมที่มีขึ้นในเมืองไทยทุกอาทิตย์:http://datascienceth.com/

นอกจากนี้ทาง Big Data Experience Center ของมหาวิทยาลัยเทคโนโลยีพระจอมเกล้าธนบุรี ก็มีการจัดสัมมนาและอบรมที่น่าสนใจเป็นประจำ (ฟรี ไม่เสียค่าใช้จ่าย): http://bigdataexperience.org/

ซึ่งการไปร่วมงานเหล่านี้ นอกจากจะทำให้เราเพิ่มพูนความรู้ที่เกี่ยวข้องกับ data science แล้วยังเป็นการสร้าง connection กับคนในแวดวง data science ผู้เขียนเคยเห็นหลายครั้งที่คนนอกวงการได้รู้จักกับผู้บริหารทีม data science ของบริษัทต่างๆในงานเหล่านี้ และมีการส่ง CV ถึงกันหลังงานเลิก

(5) บันไดขั้นที่ห้า (Approach target companies)

เมื่อผ่านมาถึงขั้นนี้ ก็ถึงเวลาที่เราจะเริ่มสมัครงานไปที่บริษัทที่เราสนใจ ลองอ่านบทความนี้พูดถึงธุรกิจและบริษัทต่างๆในเมืองไทยที่มีงานด้าน data science =>https://www.facebook.com/truebigdata/posts/678151292336509

สำหรับประกาศรับสมัครงานด้าน data science ในเมืองไทย ท่านสามารถติดตามได้จากสองเวปไซด์หลักคือ JobsDB.com(http://th.jobsdb.com/th/th) และ LinkedIn (https://th.linkedin.com/) ซึ่งจะมีงานด้าน data science อัพเดตสม่ำเสมอ

เมื่อถูกเรียกไปสัมภาษณ์ลองอ่านบทความข้างล่างโดย Quora และ KDnuggets กล่าววิธีในการเตรียมตัวสัมภาษณ์งานด้าน data science

https://www.quora.com/How-do-I-prepare-for-a-data-scientist…

http://www.kdnuggets.com/…/21-data-science-interview-questi…

ขอขอบคุณข้อมูลจาก https://www.facebook.com/truebigdata/






Google+

View My Stats