3 trụ cột kiến thức & kỹ năng để làm tốt hơn công việc của Data Analyst/Business Intelligence Analyst
Tiếp theo series tổng quan về ngành data thì trong bài viết này mình sẽ chia sẻ cho các bạn các trụ cột chính về kiến thức và kỹ năng cần thiết để làm tốt công việc phân tích dữ liệu của Data Analyst/Business Intelligence Analyst.
Thông thường các bạn mới tìm hiểu về nghề Data Analyst/Business Intelligence Analyst thường nghe đến các keywords trong các bài quảng cáo của rất nhiều trung tâm dạy về phân tích dữ liệu như: học SQL, học làm báo cáo với Power BI, Tableau, Python sau 3 tháng thì sẽ có được công việc data analyst ngàn đô. Các kỹ năng này là cần thiết nhưng theo kinh nghiệm đi làm thực tế và quan sát cá nhân mình thì nó vẫn chưa đủ. Ở bài này mình sẽ cố gắng chia sẻ bức tranh tổng quát hơn về các mảng kiến thức và kỹ năng cần thiết để làm tốt công việc này.
Phân tích dữ liệu là một hướng ngành triển vọng trên thế giới và cả Việt Nam như ở bài viết trước mình đã chia sẻ, đồng thời nó cũng là một nghề khó, đòi hỏi nhiều chiều kiến thức khác nhau và kiến thức trong ngành cũng thay đổi nhanh đòi hỏi người theo nghề phải liên tục trau dồi, update kiến thức liên tục để không bị tụt lại phía sau.
Như hình bên trên, theo mình để làm tốt công việc phân tích dữ liệu cần có 3 trụ cột chính:
- Business domain: kiến thức về ngành/lĩnh vực bạn đang phân tích.
- Tech stack: các công cụ hỗ trợ cho việc phân tích dữ liệu, tư duy phân tích, kiến thức về thống kê..,
- Kỹ năng mềm: storytelling with data (kỹ năng kể chuyện bằng dữ liệu), teamwork, project management (kỹ năng quản lý dự án), stakeholder management, communication..,
Như các bạn thấy, kiến thức về SQL hay các BI tools (Power BI, Tableau..,) chỉ là một phần nhỏ trong bức tranh lớn, các kiến thức này đang nằm trong phần “tech stack” cùng với kha khá nhiều các kiến thức và kỹ năng khác (chi tiết ở dưới).
1. Business domain (kiến thức ngành)
Theo cá nhân mình thì business domain kiến thức ngành là một mảng quan trọng không thể thiếu nếu bạn muốn làm tốt công việc phân tích dữ liệu. Một báo cáo hoặc một bài phân tích sẽ không mang lại nhiều value cho business nếu bạn không hiểu rõ các chỉ số mình đang đo lường đang phục vụ cho mục đích gì? Tại sao lại có bài phân tích đó? Tại sao chỗ này là phân tích theo hướng A, chỗ kia lại phân tích theo hướng B? Cũng dễ hiểu khi đây cũng là thứ các newbie mới vào nghề sẽ bị thiếu, vì bản thân mình lúc mới bắt đầu cũng gặp tình trạng tương tự. Nếu chúng ta chưa làm trong các lĩnh vực cụ thể này bao giờ thì các nghiệp vụ, chỉ số đo lường, quy trình đặc thù của lĩnh vực đó chúng ta sẽ khó mà hiểu sâu được. Một số cách để tụi mình có thể trau dồi phần kiến thức ngành này:
- Đọc nhiều tài liệu về các business model tương tự trên thị trường cả trong nước và thế giới.
- Liên tục học hỏi từ các đồng nghiệp trong và ngoài team data.
- Đọc và research về các báo cáo, bài phân tích hiện tại, tài liệu nội bộ không chỉ của mảng mình đang làm mà còn của các mảng khác từ đó có được một cái nhìn tổng thể về cả business của công ty.
- Cố gắng nói chuyện nhiều với các phòng ban mà mình đang hỗ trợ để hiểu rõ quy trình nghiệp vụ của họ, pain point họ đang gặp phải và data đang hỗ trợ họ thế nào trong công việc hằng ngày. Gạch đầu dòng này mình đang áp dụng nhiều nhất và nó đem lại cho mình nhiều góc nhìn mới từ các team vận hành khác, từ đó mình cũng hỗ trợ họ tốt hơn về mặt sử dụng dữ liệu để ra quyết định.
Có được một nền tảng về kiến thức ngành về lĩnh vực bạn đang làm thì mình tin là công việc của mọi người sẽ trở nên mượt mà hơn rất nhiều. Các bài phân tích của các bạn sẽ đi vào trọng tâm hơn, đánh đúng vào điểm mà business cần thay vì bạn phải tốn thời gian đi lục lọi data chỉ vì không biết mình sẽ làm gì. Các báo cáo, các bài phân tích sẽ mang lại nhiều impact và value hơn cho business, ngoài ra còn giảm được việc misunderstanding trong quá trình trao đổi công việc, dần dần đóng góp của bạn cho team, các phòng ban khác và business nói chung cũng sẽ được ghi nhận nhiều hơn.
Ví dụ công việc hiện tại của mình là làm trong lĩnh vực online food delivery tại thị trường Việt Nam. Thì ít nhất mình cũng phải biết được:
-Business model của công ty hiện tại? Các đối thủ trên thị trường là ai?
-Các nguồn doanh thu, chi phí
-Các bên liên quan trong business model này (customers: khách hàng cuối, merchants: các cửa hàng đăng ký gian hàng trên ứng dụng, drivers: đội ngũ giao hàng và cuối cùng là Ứng dụng )
-Các chỉ số quan trọng nhất mà cả business đang nhìn vào vào hằng ngày, ví dụ
- Số lượng đơn hàng trung bình hằng ngày (Average daily order)
- Chi phí khuyến mãi trên một đơn hàng (Promotion cost per order)
- Chi phí giao hàng trên một đơn hàng cho driver (driver cost per order)
- Giá trị trung bình đơn hàng (ABS: average bill size)
- Hoa hồng trên mỗi đơn hàng thành công từ merchant (commission per order)
- ….,
Khi có hiểu biết đủ sâu về lĩnh vực hiện tại thì khi gặp bài toán phân tích mình sẽ biết nên sử dụng chỉ số nào để phân tích và các chiều phân tích như thế nào để hỗ trợ giải quyết được vấn đề business đang gặp phải dưới góc nhìn dữ liệu.
2. Tech stack
Khái niệm về tech stack hiểu đơn giản là bộ các công cụ, kỹ năng cần cho việc phân tích dữ liệu. Đây là phần các bạn sẽ có thể tự học hoặc học từ trung tâm (chọn lọc).
a. Kiến thức về cơ sở dữ liệu & công cụ cho việc phân tích dữ liệu
- Database & data warehouse structure: Phần kiến thức này mình thấy nó khá quan trọng vì đây là thứ mà hằng ngày người làm phân tích dữ liệu phải nhìn vào và hiểu rõ nó để phục vụ cho công việc. Kiến thức về phần này sẽ gồm một số terms chính như: kiến trúc của một hệ thống dữ liệu của doanh nghiệp gồm những phần nào? Cách các loại data đang được lưu trữ như thế nào? Cấu trúc của các bảng dữ liệu mà người phân tích sẽ lấy dữ liệu?
- SQL (Structured Query Language): 80-90% công việc hằng ngày của các bạn làm phân tích dữ liệu data analyst/BI analyst sẽ làm việc với data dạng bảng (tabular data), hiểu đơn giản SQL là công cụ giúp mọi người có thể giao tiếp và làm việc với cơ sở dữ liệu dạng bảng. SQL giúp người phân tích truy vấn và lấy ra dữ liệu cần thiết cho báo cáo và phân tích của mình. Đây là công cụ bắt buộc người làm việc liên quan tới dữ liệu phải biết, SQL đang và sẽ phổ biến như Excel trong một vài năm tới. Không chỉ người làm phân tích dữ liệu cần “master” SQL mà hiện giờ theo mình quan sát thì rất nhiều phòng ban khác đã có thể dùng SQL để phục vụ cho nhu cầu số liệu của mình thay vì phải nhờ team data lấy số theo yêu cầu. Vì vậy đây là công cụ vỡ lòng nên được ưu tiên học trước khi bước chân vào ngành data. Nguồn học SQL thì rất nhiều, các bạn có thể google, có dịp mình sẽ chia sẻ sâu hơn ở những series sau.
- BI Tools: phổ biến nhất là Power BI, Tableau, Google Looker studio..,. Hiểu đơn giản thì các công cụ này sẽ giúp người phân tích dữ liệu trực quan hóa số liệu và kết quả phân tích của mình dưới dạng các biểu đồ, nhằm giúp cho người người đọc báo cáo/phân tích có thể consume thông tin một cách tốt hơn và trực quan hơn. Ngoài ra các công cụ này cũng cung cấp một số chức năng hỗ trợ cho người phân tích tìm ra insights tốt hơn, nhìn dữ liệu theo nhiều chiều khác nhau và tiết kiện thời gian thực hiện báo cáo/phân tích.
- R/Python: Đây là hai ngôn ngữ lập trình giúp người phân tích dữ liệu có thể thực hiện các bước xử lý dữ liệu nâng cao, dữ liệu với dung lượng lớn và cấu trúc phức tạp. Ngoài ra hai ngôn ngữ này còn là công cụ giúp người phân tích thực hiện các bài toán Predictive analytics sử dụng các mô hình thống kê, machine learning, deep learning. Ở những giai đoạn đầu thì mình khuyên các bạn nên tạm khoan học phần này, mà hãy chú trọng 2 phần trên trước. Sau khi đã đi làm và tiếp xúc với các bài toán thực tế, có usecase cần dùng đến thì hẵng bắt đầu học (theo dạng project based learning).
b. Mindset và các kiến thức liên quan:
- Statistical mindset: tư duy và kiến thức về thống kê để nhìn dữ liệu tốt hơn, tránh bị dữ liệu đánh lừa và các chỉ số trong bài phân tích mang ý nghĩa về mặt thông kê.
- Analytical mindset: tư duy phân tích, các bước để thực hiện một bài phân tích, các nguyên lý phổ biến thường sử dụng (MECE, 80/20)
- Visualization mindset: tư duy về trực quan hóa dữ liệu, chọn biểu đồ phù hợp, loại bỏ các yếu tố thừa trong khi trực quan hóa dữ liệu.
- Kiến thức cơ bản về các mô hình machine learning, cách hoạt động của mô hình, background toán bên dưới của mô hình. Phần này là một phần khó nên cần nhiều thời gian và va chạm để mọi người có thể xây dựng nền tảng kiến thức dần dần.
3. Soft skills (kỹ năng mềm):
Kỹ năng mềm thì mình sẽ không nói nhiều ở đây vì mình nghĩ ngành nào cũng cần tới các kỹ năng này và đây là phần hơi cá nhân, mỗi người sẽ có một cách rèn luyện và phát triển các kỹ năng mềm của mình khác nhau. Một số kỹ năng quan trọng dưới đây theo mình thấy cực kỳ cần thiết cho công việc hằng ngày của một người phân tích dữ liệu từ chính trải nghiệm bản thân mình, nếu thiếu các kỹ năng đó thì công việc của các bạn sẽ khó suôn sẻ được. Song song với chuyên môn thì các bạn cũng nên đầu tư thời gian, sức lực để trau dồi các kỹ năng này ngày một tốt hơn.
- Storytelling with data
- Teamwork
- Project management
- Stakeholder management
- Communication
- Presentation
Túm cái váy lại thì để làm tốt công việc phân tích dữ liệu thì mọi người nên phát triển cả 3 trụ cột mình chia sẻ trong bài thay vì chỉ chăm chăm vào phần công cụ, phân tích dữ liệu là một ngành đòi hỏi rất nhiều kỹ năng và kiến thức ở nhiều lĩnh vực nên cố lên các bạn nhé. ^^ Có câu hỏi gì các bạn có thể kết nối với mình theo contact bên phải hoặc comment nhé, happy to help! Thanks
*Disclaimers: Các bài viết mình chia sẻ trên blog chủ yếu đến từ trải nghiệm cá nhân và kinh nghiệm của bản thân mình, với mong muốn mang đến thêm nhiều góc nhìn bổ ích cho công việc và cuộc sống của các bạn. Mong rằng các bạn sẽ đón nhận và góp ý những điều mình chia sẻ với một tư duy mở và phát triển. Bài viết đôi khi sẽ sử dụng một số thuật ngữ tiếng Anh vì nếu dịch sang tiếng Việt sẽ hơi khó hiểu nên mình vẫn sẽ giữ nguyên bản. Cám ơn các bạn đã ghé thăm blog của mình.
One Reply to “3 trụ cột kiến thức & kỹ năng để làm tốt hơn công việc của Data Analyst/Business Intelligence Analyst”