Trong kỷ nguyên dữ liệu bùng nổ, Data Engineer (Kỹ sư dữ liệu) đang trở thành một trong những nghề “hot” nhất trên thị trường lao động. Sự phát triển mạnh mẽ của Big Data, AI, và nhu cầu ra quyết định dựa trên dữ liệu khiến Data Engineer được săn đón ở hầu hết các doanh nghiệp – từ startup đến tập đoàn đa quốc gia.
| Tên khóa học | Hình thức | Học phí gốc | Học phí ưu đãi | Ưu đãi nhóm |
|---|---|---|---|---|
| Khóa học Become a Data Engineer | Trực tiếp | 20,650,000 | 20,650,000 | 20,150,000 |
| Trực tuyến | 20,650,000 | 20,650,000 | 20,150,000 |
1. Kiến thức nền tảng
- Hiểu được vai trò, trách nhiệm của Data Engineer trong hệ sinh thái dữ liệu (so với Data Analyst, Data Scientist, BI Developer).
- Nắm vững kiến thức cơ bản về cơ sở dữ liệu quan hệ (RDBMS) và phi quan hệ (NoSQL).
- Thành thạo SQL nâng cao: joins, subquery, CTE, window functions, indexing.
- Sử dụng Python để xử lý dữ liệu, làm sạch dữ liệu và kết nối cơ sở dữ liệu.
- Biết sử dụng Linux, Shell scripting, Git để quản lý mã nguồn và tự động hóa công việc.
2. Kỹ năng xây dựng Pipeline & ETL
- Hiểu kiến trúc Data Warehouse và Data Lake.
- Áp dụng Data Modeling: Star Schema, Snowflake Schema, Data Vault.
- Xây dựng ETL/ELT pipelines với Python, Spark, Airflow, dbt.
- Biết cách xử lý dữ liệu batch và tối ưu hóa hiệu năng pipeline.
- Tạo, quản lý và giám sát các workflow với Airflow/Prefect.
3. Kỹ năng xử lý Big Data & Streaming
- Hiểu được kiến trúc hệ sinh thái Big Data (Hadoop, Spark, Kafka).
- Sử dụng Apache Spark để xử lý dữ liệu lớn: RDD, DataFrame, Spark SQL, UDF.
- Xây dựng hệ thống streaming real-time với Kafka + Spark Streaming/Flink.
- Phân biệt và triển khai được batch processing và real-time processing.
4. Kỹ năng triển khai trên Cloud
- Hiểu khái niệm Cloud Data Engineering và lợi ích so với on-premises.
- Làm quen và thực hành trên ít nhất 1 nền tảng Cloud (AWS, Azure, GCP).
- Xây dựng data lakehouse với công nghệ Delta Lake/Iceberg/Hudi.
- Triển khai pipeline trên Cloud: ingest dữ liệu → transform → load vào Data Warehouse (Redshift, BigQuery, Synapse).
- Sử dụng Docker, Kubernetes và IaC (Terraform) để quản lý hạ tầng dữ liệu.
- Đảm bảo bảo mật, phân quyền và tuân thủ khi làm việc với dữ liệu trên Cloud.
5. Data Governance & Quản lý chất lượng dữ liệu
- Hiểu rõ Data Governance: quản lý lineage, catalog, metadata.
- Ứng dụng công cụ Data Quality (Great Expectations, Deequ) để kiểm soát chất lượng dữ liệu.
- Thực hiện performance tuning cho SQL và Spark.
- Xây dựng hệ thống monitoring, logging, alerting cho pipeline dữ liệu.
6. Kỹ năng làm việc dự án & triển khai thực tế
- Áp dụng kiến thức đã học để thực hiện dự án end-to-end:
- Thu thập dữ liệu (batch + streaming).
- Lưu trữ trong Data Lake.
- Xử lý bằng Spark/dbt.
- Load dữ liệu vào Data Warehouse.
- Xuất dữ liệu cho BI tools (Power BI, Looker, Tableau).
- Rèn luyện kỹ năng làm việc nhóm (Git, CI/CD, Agile/Scrum).
- Hình thành tư duy thiết kế hệ thống dữ liệu ổn định – mở rộng – tối ưu.
7. Năng lực sau khi hoàn thành khóa học:
- Thiết kế & triển khai các data pipeline từ nhỏ đến lớn.
- Làm chủ ETL/ELT và Big Data frameworks (Spark, Kafka).
- Vận hành hệ thống dữ liệu trên Cloud (AWS/Azure/GCP).
- Đảm bảo chất lượng, bảo mật và quản trị dữ liệu trong tổ chức.
- Thực hiện độc lập hoặc tham gia nhóm trong các dự án Data Warehouse, Data Lake, Data Streaming.
- Đủ năng lực ứng tuyển các vị trí: Data Engineer, Big Data Engineer, Cloud Data Engineer.
| Tên bài học | Nội dung | Thời lượng |
|---|---|---|
| Học phần 1: Nền tảng Data Engineering |
- Giới thiệu Data Engineering, vai trò trong hệ sinh thái dữ liệu. |
6 buổi – 24h |
| Học phần 2: Data Pipeline & ETL |
- Kiến trúc Data Warehouse vs Data Lake. |
6 buổi – 24h |
| Học phần 3: Xử lý dữ liệu lớn & Streaming |
- Giới thiệu Big Data ecosystem (Hadoop, Spark, Kafka). |
6 buổi – 24h |
| Học phần 4: Cloud Data Engineering |
- Cloud fundamentals: AWS vs Azure vs GCP. |
6 buổi – 24h |
| Học phần 5: Data Governance & Dự án tổng hợp |
- Data Governance: lineage, catalog, metadata. |
6 buổi – 24h |
- Có laptop cá nhân và kết nối Internet ổn định.
- Nắm vững kiến thức cơ bản về SQL, lập trình Python và xử lý dữ liệu.
- Hiểu các khái niệm dữ liệu nền tảng như cơ sở dữ liệu quan hệ (RDBMS) và NoSQL.
- Sẵn sàng làm việc với công cụ dòng lệnh (Linux/Shell), Git để quản lý mã nguồn và tự động hóa công việc.
- Tư duy logic, phân tích hệ thống và hệ xử lý dữ liệu lớn (Big Data).
- Mong muốn xây dựng data pipeline, ETL/ELT, xử lý dữ liệu lớn với Spark, Kafka và triển khai trên Cloud (AWS/Azure/GCP).
- Cam kết thực hành các mô-đun từ kiến trúc dữ liệu, ETL/ELT, streaming cho tới dự án capstone end-to-end.
- Muốn ứng tuyển vào các vị trí Data Engineer, Big Data Engineer, Cloud Data Engineer với bộ kỹ năng hoàn chỉnh sau khoá học.
🔹15+ năm kinh nghiệm
🔹Technical Consultant tại IMIC
🔹Chuyên môn: Lập trình Web Full-stack Data Engineer & AI
🔹10+ năm kinh nghiệm
🔹Project Manager tại Cyberlogitec
🔹Chuyên môn: Lập trình Web Full-stack & Mobile apps, Data Engineer & AI
🔹12+ năm kinh nghiệm
🔹Technical Assistant tại Viettel High Tech
🔹Chuyên môn: Lập trình C|C++, C#, Data Analyis & AI
✅ 15+ năm kinh nghiệm đào tạo CNTT & Data
Đơn vị đào tạo tiên phong, uy tín, được hàng nghìn học viên và doanh nghiệp tin tưởng.
✅ Học thực chiến – làm được việc ngay
Chương trình học bám sát yêu cầu tuyển dụng, học qua dự án thật, không lý thuyết suông.
✅ Giảng viên là chuyên gia 10+ năm kinh nghiệm đang làm việc tại doanh nghiệp
Truyền đạt kiến thức + kinh nghiệm thực tế + tư duy nghề nghiệp.
✅ Cam kết hỗ trợ việc làm sau khóa học
Cấp chứng chỉ, hỗ trợ thực tập, và kết nối doanh nghiệp đối tác.
✅ Phù hợp cả người mới & người đi làm
Lộ trình rõ ràng từ cơ bản đến nâng cao, thời gian học linh hoạt online & offline.
✅ Mỗi lớp chỉ từ 7-12 học viên – kèm cặp sát sao
Giảng viên theo sát từng học viên, giải đáp 1–1 khi cần.
✅ Học phí linh hoạt – nhiều ưu đãi
Hỗ trợ trả góp, ưu đãi học viên cũ, sinh viên và đăng ký theo nhóm.
Ms Linh – Admissions Team Leader
.jpg)
Ms Trân – Admissions Team
.png)