NEURAL.VN
Neural Việt Nam

Blog Post: Chia sẻ từ Kaggle Master: Hành trình và kinh nghiệm

27/3/20238phút đọc

Kaggle

Expert Interview

Đối với những bạn trẻ đam mê AI, đồng thời yêu thích sự cạnh tranh thì Kaggle sẽ là một nền tảng thú vị. Được thành lập vào năm 2010, Kaggle là nơi tổ chức các cuộc thi về AI và Machine Learning lớn hàng đầu thế giới, quy tụ nhiều tổ chức danh tiếng, đa dạng lĩnh vực và nổi tiếng với các giá trị giải thưởng lớn. Hôm nay chúng ta sẽ cùng gặp gỡ một Kaggle Competition Master, bạn Thế Nam, người đã từng đứng trong top đầu của một số cuộc thi trên nền tảng Kaggle.

1. Giới thiệu về bản thân

Mình là một người bén duyên với AI từ những năm 2017, thời điểm mà việc code một mạng classification bằng Tensorflow cũng là cả một nỗ lực 😂. Trải qua nhiều năm, mình luôn giữ cho bản thân một sự hứng thú thuần tuý với công nghệ này. Hiện tại mình đang làm việc ở AI Research Lab - Samsung SDS R&D Center với vị trí AI Engineer.

2. Bạn đã bắt đầu với Kaggle thế nào?

Mình không nhớ chính xác tại sao mình lại biết đến Kaggle, có thể vì Kaggle cũng nổi tiếng trong giới nên việc tình cờ biết đến cũng dễ hiểu. Bản thân mình khi học ở trường Đại học luôn muốn tham gia các cuộc thi về công nghệ, vừa là để học hỏi, vừa để đo lường năng lực nội tại và tìm ra những điểm cần cải thiện.

Để tham gia một cuộc thi trên Kaggle rất đơn giản, không yêu cầu bất kỳ điều gì khác ngoài việc các bạn có tài khoản. Và một đứa mới chập chững học AI như mình vào thời điểm đó cũng chỉ đơn giản là bấm vào mục Competition, chọn một bài và chiến.

3. Bạn có thể chia sẻ hành trình và kinh nghiệm để trở thành Kaggle Competitions Master của bản thân?

Hành trình từ Novice đến Master của Nam

Lúc mới tham gia, mình chỉ làm việc một mình, mặc dù không đặt mục tiêu cao ngay lúc đó nhưng mình luôn nhắc nhở bản thân một ngày nào đó có thể đứng ở trên top để khẳng định trình độ của những Kaggler Việt Nam, cạnh tranh với những Data Scientist và AI Engineer ở các nước trên thế giới. 3 năm đầu tiên từ 2018 cho đến 2020 mình chỉ thỉnh thoảng tham gia, và không giành được bất cứ một medal nào cả. Bước ngoặt đến bắt đầu từ năm 2021 khi mình quyết tâm đầu tư thời gian hơn, đồng thời được làm việc chung với những người bạn rất giỏi, mình đã giành 3 gold medal chỉ trong khoảng hơn 1 năm, trở thành Kaggle Master và đặc biệt nhất là việc đứng top 1 trong một cuộc thi vào giữa năm 2022.

Các kinh nghiệm để dành thứ hạng cao ở các cuộc thi Kaggle

Để thành công, trước hết phải bắt đầu. Bạn cứ tham gia một competition nào đó và cố gắng ở lại cho đến cuối cuộc thi đó, kể cả không giành thứ hạng tốt ngay lập tức, nhưng bạn sẽ học hỏi được nhiều điều, bởi vì sau mỗ cuộc thi, các đội top sẽ chia sẻ giải pháp, và chúng ta hoàn toàn có thể học tư duy của họ. Bên cạnh đó, hãy tự viết code của mình. Trên Discussion của Kaggle chia sẻ rất nhiều giải pháp sẵn có của một vài đội, rất dễ dàng cho một người copy và nộp bài. Điều này không tốt vì bạn sẽ lệ thuộc vào người khác, đồng thời giải pháp của họ có thể bị overfit với tập public test set, hiệu quả có thể kém trong tập private. Hãy coi những chia sẻ của người khác chỉ mang tính chất tham khảo, luôn luôn kiểm soát được những gì mình code, đó mới chính là con đường bền vững.

Đồng đội và team working đóng vai trò thế nào ở Kaggle?

Đồng đội là yếu tố rất quan trọng trong Kaggle. Thứ nhất thêm người thêm giải pháp, bạn có thể chia sẻ khối lượng công việc với các thành viên trong team. Thứ hai, khi làm việc nhóm, tính đa dạng sẽ giúp các bạn có những hướng đi sáng tạo hơn so với tư duy một mình. Thứ ba, khi bạn mất động lực, sẽ có người củng cố niềm tin của các bạn vào những điều phía trước.

Cuộc thi nào đáng nhớ nhất đối với bạn?

Cuộc thi khiến mình nhớ nhất không phải là cuộc thi mình giành thứ hạng cao nhất mà là cuộc khi khiến mình trải nghiệm nhiều cung bậc cảm xúc nhất: SIIM-FISABIO-RSNA COVID-19 Detection. Đây là một cuộc thi nhận dạng và khoanh vùng vị trí có dấu hiệu bệnh Covid 19 trên ảnh chụp X-quang. Thời điểm đó, Việt Nam đang dãn cách xã hội do Covid 19 và thực hiện work from home. Mình và team đầu tư rất nhiều nỗ lực vào bài toán này, bởi nhìn thấy ý nghĩa của nó cho cộng đồng, đồng thời mình cũng rất hứng thú với lĩnh vực xử lý ảnh y tế. Mặc dù nằm trong gold zone ở Public Leaderboard nhưng ở Private Leaderboard team mình chỉ được silver medal. Hồi đó team mình chưa lần nào được gold medal nên cảm giác mong chờ, khát khao rất lớn. Tuy nhiên thứ hạng chưa được như kỳ vọng. Sau cuộc thi mình rất quyết tâm học hỏi giải pháp của team đạt giải top 1 - đó là anh Nguyễn Bá Dũng ở VinBigData, thậm trí dành nhiều ngày để xem tại sao lại có sự khác biệt lớn trong hiệu quả. Và tin mình đi, sau mỗi lần như vậy, kiến thức của các bạn lại tăng lên đáng kể, và thành quả sẽ đến sau đó.

4. Những kiến thức ở Kaggle giúp Nam thế nào trong công việc AI Engineer hiện tại?

Liệu có sự khác nhau giữa Kaggle competition và công việc thực tế?

Đầu tiên mình sẽ chỉ ra sự liên hệ. Các cuộc thi trên Kaggle hầu hết là do các công ty, tổ chức lớn tạo ra với mục tiêu giải quyết một vấn đề thực tế họ đang gặp phải. Như vậy có thể nói mục đích của cuộc thi là hướng tới một giải pháp có ứng dụng cụ thể.

Tuy nhiên có hai khác biệt cơ bản. Thứ nhất về mặt dữ liệu, các cuộc thi trên Kaggle thường chỉ lấy một subset hoặc một phần dữ liệu trong một khoảng thời gian, chưa phản ánh đúng thực tế là dữ liệu luôn thay đổi. Thứ hai, các giải pháp trên Kaggle tập trung nhiều vào việc đẩy độ chính xác của mô hình, chưa chú trọng nhiều đến những yếu tố trong môi trường production như tốc độ xử lý, khả năng tích hợp và hệ thống, khả năng scale up, etc.

Áp dụng kiến thức, kinh nghiệm thu được từ Kaggle vào công việc

Đầu tiên, trên Kaggle là nơi tuyệt vời để tiếp cận với những state-of-the-art (SOTA). Khi làm việc trong môi trường R&D, yêu cầu tiếp cận và triển khai thử nghiệm những giải pháp SOTA là điều thường xuyên.

Thứ hai, việc tham gia cuộc thi khiến mình cải thiện rất nhiều về tư duy hình thành một giải pháp AI để giải quyết vấn đề, điều này giúp ích không nhỏ trong việc tạo ra một giải pháp hoàn thiện nhằm giải quyết vấn đề của khách hàng.

5. Trong tương lai, Nam có tiếp tục tham gia các cuộc thi Kaggle tiếp theo không?

Mình vẫn sẽ tham gia các cuộc thi trên Kaggle, hi vọng có thể được học hỏi, cạnh tranh cùng một số bạn ở đây trong các cuộc thi tiếp theo.

6. Lời khuyên cho các bạn trẻ mới học AI, và các bạn muốn bước chân vào đấu trường Kaggle?

Just do it. Hãy làm thôi các bạn. Dù làm chưa chắc thành nhưng không làm chắc chắn không thành. Yên tâm là việc tham gia các cuộc thi không bao giờ là sự đầu tư lãng phí vì bạn luôn thu được kiến thức và kĩ năng. Đến khi có được cảm giác chiến thắng, có ít xèng giải thưởng để phục vụ các mục tiêu tài chính của bạn thì thật là tuyệt!