Các loại hình phân tích dữ liệu trong doanh nghiệp
1. Tổng quan các loại hình phân tích dữ liệu
Tiếp theo series tổng quan về ngành data thì trong bài viết này mình sẽ giới thiệu với các bạn về “các loại hình phân tích dữ liệu trong doanh nghiệp” theo góc nhìn và tổng hợp của mình.
Đầu tiên, nói về định nghĩa thì theo mình phân tích dữ liệu (Data Analytics) là một quá trình bao gồm: xác định, làm sạch, biến đổi & mô hình hóa, trực quan hóa dữ liệu để khám phá ra những thông tin ý nghĩa và hữu ích. Những thông tin này được thể hiện qua những báo cáo phân tích, từ đó hỗ trợ cho quá trình ra quyết định của doanh nghiệp/phòng ban các bạn đang làm việc.
Các loại hình phân tích dữ liệu có thể chia làm các dạng chính như sau:
- Descriptive Analytics: Phân tích mô tả
- Diagnostic Analytics: Phân tích chuẩn đoán
- Predictive Analytics: Phân tích dự đoán
- Prescriptive Analytics: Phân tích đề xuất
Mình tóm tắt đặc điểm của từng loại hình phân tích trong hình trên: Từ data thô ban đầu để đi được đến outcome là quyết định kinh doanh, tùy vào yêu cầu của business thì người làm phân tích sẽ chọn loại hình phân tích phù hợp để đáp ứng nhu cầu đó. Nhìn từ trái sang phải thì và từ dưới lên trên, theo thứ tự Descriptive -> Diagnostic -> Predictive -> Prescriptive thì value tạo ra cho business từ loại hình phân tích đó để đi được đến quyết định kinh doanh và mức độ thành thạo kỹ thuật sẽ tăng dần lên và sự can thiệp của con người (human input/human intervention) cũng sẽ ít dần đi.
2. Đặc điểm của từng loại phân tích dữ liệu
a. Descriptive analytics
Descriptive analytics – Phân tích mô tả giúp trả lời các câu hỏi về điều gì đã xảy ra dựa trên các dữ liệu quá khứ – what “happened”? Outcome của loại hình phân tích này thường sẽ là các thống kê đơn giản, các “fact” từ dữ liệu quá khứ. Như hình trên ta có thể thấy mức độ thành thạo về kỹ thuật cần cho loại hình phân tích này và value mà nó tạo ra sẽ ít nhất so với các loại hình phân tích khác. Thông thường bắt đầu với đa số bài toán phân tích người phân tích dữ liệu sẽ thực hiện phân tích mô tả trước để hiểu dữ liệu và hiểu được tình hình hiện tại của doanh nghiệp trước khi đi sâu vào phân tích các vấn đề khác.
Một ví dụ đơn giản của phân tích mô tả: thống kê doanh số của theo vùng, theo thành phố, theo cửa hàng. Một ví dụ khác gần gũi hơn đó là báo cáo tài chính của doanh nghiệp.
b. Diagnostic analytics
Phân tích chuẩn đoán giúp trả lời câu hỏi tại sao tình trạng này lại diễn ra (“why” things happened?). Phân tích chuẩn đoán bao gồm các phân tích mô tả cơ bản, sử dụng những kết quả của phân tích mô tả để từ đó tìm ra nguyên nhân của các sự kiện đã xảy ra. Từ đó, các sự kiện đặc biệt hay bất thường sẽ được phân tích kỹ hơn. Quá trình này thường bao gồm 3 bước:
- Tìm ra những điểm bất thường trong dữ liệu. Những điểm này thường là một biến đổi không lường trước được ở một chỉ số hoặc một thị trường nào đó.
- Thu thập các dữ liệu liên quan đến những điểm bất thường này.
- Sử dụng các kỹ thuật thống kê để tìm ra mối quan hệ và xu hướng giúp giải thích những điểm bất thường này.
Value từ kết quả phân tích của loại hình phân tích này mang lại sẽ đáng kể hơn so với phân tích mô tả và mức độ đòi hỏi về kỹ thuật phân tích, công cụ phân tích và kiến thức về xác suất thống kê sẽ cao hơn.
Theo quan sát của mình thì 80-90% khối lượng công việc của Business Intelligence Analyst và Data Analyst sẽ làm việc với 2 loại hình phân tích là mô tả và chuẩn đoán.
c. Predictive analytics
Phân tích dự đoán giúp trả lời các câu hỏi về điều gì sẽ xảy ra trong tương lai (what’s likely to happen?). Phân tích dự đoán sử dụng các dữ liệu quá khứ để xác định các xu hướng cũng như khả năng xảy ra của xu hướng đó từ đó cung cấp những thông tin giá trị về tình hình tương lai. Các kỹ thuật phân tích dự đoán đa dạng bao gồm cả các kỹ thuật thống kê lẫn học máy (machine learning) như neural networks, decision trees và hồi quy (regression).
Value từ kết quả phân tích của loại hình phân tích này mang lại sẽ đáng kể hơn hai loại hình phân tích trên nhưng một phần cũng sẽ phụ thuộc vào nhu cầu phân tích thực tế và quy mô doanh nghiệp. Theo kinh nghiệm và quan sát của mình thì phân tích dự báo sẽ value hơn trong doanh nghiệp vừa và lớn với mức độ trưởng thành về dữ liệu cao (data maturity) hơn là doanh nghiệp nhỏ.
Thông thường người thực hiện loại hình phân tích này chủ yếu là các bạn Data Scientist, ML Engineer hoặc đôi khi có thể là các bạn Data Analyst hay Business Intelligence Analyst thực hiện theo dạng project based.
d. Prescriptive analytics
Phân tích đề xuất giúp trả lời các câu hỏi về hành động nào nên được thực hiện để đặt được một mục tiêu nhất định. Bằng cách sử dụng các kết quả từ phân tích đề xuất, các tổ chức có thể ra quyết định dựa trên dữ liệu. Phương pháp này giúp các tổ chức đưa ra các quyết định trong các hoàn cảnh không chắc chắn. Phân tích đề xuất dựa trên học máy (machine learning) để tìm ra các pattern trong các dataset lớn. Bằng cách phân tích các quyết định & sự kiện trong quá khứ, người phân tích có thể ước lượng xác suất xảy ra của các kết quả.
3. Ví dụ thực tế các loại hình phân tích dữ liệu trong thương mại điện tử (E-commerce):
Dưới đây là ví dụ mình đưa ra trong lĩnh vực thương mại điện tử để giải thích rõ hơn các loại hình phân tích bên trên, các bạn đọc và liên kết với phần lý thuyết bên trên để nắm rõ hơn nhé.
Túm cái váy lại, tùy vào nhu cầu của doanh nghiệp và bài toán bạn đang giải là gì thì bạn sẽ chọn loại hình phân tích phù hợp để giải quyết bài toán đó và không phải tất cả mọi công việc hằng ngày của người phân tích dữ liệu đều phải làm hết cả 4 loại hình phân tích này, đôi khi chỉ cần làm phân tích mô tả và phân tích chẩn đoán là đã giải quyết được vấn đề rồi. Đề hiểu rõ hơn ai thường sẽ là người thực hiện các loại hình phân tích này các bạn có thể đọc bài giới thiệu về “Các vị trí công việc liên quan đến data trong doanh nghiệp” của mình tại đây.
Tạm dừng bài này ở đây, mong là bài viết sẽ cung cấp thêm một vài thông tin hữu ích cho mọi người về tổng quan ngành data cám ơn đã ghé thăm blog của mình. Ciao!
*Disclaimers: Các bài viết mình chia sẻ trên blog chủ yếu đến từ trải nghiệm cá nhân và kinh nghiệm của bản thân mình, với mong muốn mang đến thêm nhiều góc nhìn bổ ích cho công việc và cuộc sống của các bạn. Mong rằng các bạn sẽ đón nhận và góp ý những điều mình chia sẻ với một tư duy mở và phát triển. Bài viết đôi khi sẽ sử dụng một số thuật ngữ tiếng Anh vì nếu dịch sang tiếng Việt sẽ hơi khó hiểu nên mình vẫn sẽ giữ nguyên bản. Cám ơn các bạn đã ghé thăm blog của mình.
One Reply to “Các loại hình phân tích dữ liệu trong doanh nghiệp”