Khởi động Cuộc thi KHOA HỌC DỮ LIỆU KHOA CÔNG NGHỆ THÔNG TIN – Năm 2025

  1. Nội dung cuộc thi

Ứng dụng Khoa học dữ liệu: Các ứng dụng trong kinh doanh, y tế, tài chính, công nghiệp; Phân tích dữ liệu thời gian thực; Các dự án nghiên cứu và thực hành từ thu thập dữ liệu, phân tích đến trình bày kết quả.

Trong đó vận dụng các kiến thức và kỹ năng:

  • Toán học và thống kê như: phân phối xác suất, ước lượng tham số, kiểm định giả thuyết; Đại số tuyến tính; Đạo hàm, tích phân, tối ưu hóa.
  • Thu thập, xử lý và làm sạch dữ liệu; Phân tích và trực quan hóa dữ liệu; Khai phá dữ liệu (data mining)
  • Các thuật toán học máy cơ bản: hồi quy tuyến tính, hồi quy logistic, cây quyết định, k-means clustering; Đánh giá và chọn mô hình: cross-validation, ROC curve; Học sâu (Deep Learning): mạng nơ-ron, CNN, RNN (ở mức độ cơ bản đến nâng cao tùy chương trình đào tạo).
  • Kiến trúc và công cụ xử lý dữ liệu lớn: Hadoop, Spark; Quản lý và lưu trữ dữ liệu: cơ sở dữ liệu quan hệ (SQL) và không quan hệ (NoSQL).
  1. Đối tượng dự thi

  • Thi theo đội, đăng ký tối đa là 05 thành viên/1 đội.
  • Thành viên đội thi là sinh viên Khoa Công nghệ thông tin, các trường ĐH có khác đam mê lập trình, mong muốn xây dựng các ứng dụng có tính thực tiễn cao và thông minh.
  1. Đăng ký tham gia

  • Đăng ký dự thi trực tuyến theo mẫu của ban tổ chức tại trang https://khdl2025.kcntt.edu.vn/ hoặc theo thông báo tại trang web của Khoa CNTT trước 23h59’ ngày 15/04/2025
  1. Các vòng thi

4.1. Vòng loại

  • Sau khi đăng ký tham gia Cuộc thi từ ngày 09/04/2025 đến hết ngày 15/04/2025, các đội phải đăng ký tên đề tài trước ngày 15/04/2025.
  • Các đội nộp bài thi vòng loại về Ban Tổ chức trước 23h59’ ngày 01/05/2025 tại trang web https://khdl2025.kcntt.edu.vn/ để BTC công bố Bài thi vào chung kết ngày 02/05/2025

4.2. Vòng chung kết

– Trình bày sản phẩm dự thi (Presentation, Sản phẩm) diễn ra từ 13h ngày 09/05/2025 theo hình thức tập trung.

– Địa điểm: Lầu 3, Thư viện – Cơ sở An Phú Đông, Trường ĐH Nguyễn Tất Thành

 

KHOA CÔNG NGHỆ THÔNG TIN

—————————————————————–

THỂ LỆ CUỘC THI

  1. Hình thức thi: Vòng loại và chung kết

5.1. Vòng loại

  • Sinh viên viết báo cáo ngắn ngọn, rõ ràng và ý tưởng phải có tính khả thi.
  • Ban giám khảo chấm thi để lựa chọn ra 12 đội đạt vào vòng chung kết.

5.2. Ban giám khảo chấm thi chung kết dựa trên các tiêu chí sau

  • Tính cấp thiết của đề tài về Khoa học dữ liệu hiện nay.
  • Tính thực tiễn mà sản phẩm dự thi mang lại lợi ích cho xã hội.
  • Thiết kế giao diện người dùng hấp dẫn, hài hòa và tiện dụng
  • Hàm lượng khoa học của sản phẩm dự thi cần có độ khó nhất định.
  • Kết quả của các đội thi ở chung kết có thể là sản phẩm mang tính ứng dụng cao hoặc là sản phẩm cho những công trình nghiên cứu khác kế thừa.

5.3. Các nội dung cần báo cáo vòng chung kết

  • Giới thiệu về sản phẩm
  • Tính thực tiễn của sản phẩm mang lại
  • Qui trình thực hiện đề tài dự thi:
    • Xác định mục tiêu
    • Khảo sát công việc liên quan
    • Hướng tiếp cận
    • Phương pháp thực hiện
    • Địa điểm thực hiện
  • Kết quả đạt được
  • Hướng phát triển

5.4. Demo sản phẩm

  • Sản phẩm chạy KHÔNG có lỗi
  • Nếu có lỗi thì bị trừ điểm
  • Sản phẩm demo phải đúng với nội dung đã đăng ký

5.5. Phương pháp đánh giá từng đội ở vòng chung kết

  • Ban giám khảo dựa vào các tiêu chí ở mục 2 để chấm điểm. Sau đó chia trung bình để xác định đội nhất, nhì, ba, tư và khuyến khích.
  1. Yêu cầu

6.1. Khoa học dữ liệu (80 điểm)

  • Dữ liệu minh bạch, tin cậy
  • Tiền xử lý dữ liệu (Integration, Clean, Data Transformation)
  • Phương pháp trích chọn thuộc tính ảnh hưởng lên mô hình phân loại
  • Mô hình huấn luyện AI
  • Đánh giá độ tin cậy của dữ liệu, của mô hình, tối ưu hóa thuật toán
  • Kiểm tra tính đúng và tính sai số
  • Ra quyết định.
  • Kết quả

6.2. Thuyết trình (20 điểm)

– Tính đồng đội

– Thuyết trình: Nội dung trình bày ngắn gọn, rõ ràng, đầy đủ và xúc tích.

 

KHOA CÔNG NGHỆ THÔNG TIN