Ngày nay, khi ngày càng nhiều doanh nghiệp nhận ra “sức mạnh” của dữ liệu trong việc đạt được các mục tiêu kinh doanh, hầu hết đều hy vọng có thể tận dụng dữ liệu trong chiến lược kinh doanh và sản phẩm của họ.


Điều này đòi hỏi phải tập hợp một đội nhóm xử lý dữ liệu mạnh mẽ có thể truyền tải một cách hiệu quả và chi tiết theo các khía cạnh khác nhau của doanh nghiệp. Để đi theo hướng “data-driven”, các công ty cần xây dựng 3 năng lực bao gồm: chiến lược dữ liệu, quản trị dữ liệu và phân tích dữ liệu.


Định nghĩa về 3 yếu tố mà doanh nghiệp cần có


  • Chiến lược: Chiến lược dữ liệu là lộ trình mà doanh nghiệp tận dụng dữ liệu để đạt được mục tiêu. Chiến lược này đòi hỏi sự hiểu biết rõ ràng về nhu cầu dữ liệu vốn có đối với chiến lược kinh doanh. Vậy câu hỏi đặt ra là tại sao bạn thu thập dữ liệu? Bạn đang cố gắng kiếm tiền, tiết kiệm tiền, quản trị rủi ro, mang lại trải nghiệm khách hàng đặc biệt hay hướng đến tất cả những điều trên?
  • Quản trị: Quản trị dữ liệu là một tập hợp các quy trình, vai trò, chính sách, tiêu chuẩn và số liệu nhằm đảm bảo sử dụng hiệu quả thông tin để giúp doanh nghiệp đạt được các mục tiêu của mình. Một chiến lược quản trị dữ liệu được xây dựng tốt sẽ đảm bảo rằng dữ liệu được sử dụng là đáng tin cậy, chính xác và luôn luôn có sẵn.
  • Phân tích: Thuật ngữ phân tích dữ liệu liên quan đến quá trình phân tích dữ liệu thô nhằm đưa ra kết luận về thông tin từ đó mang đến những cải thiện tốt hơn. Thông thường, những người liên quan đến phân tích dữ liệu trong doanh nghiệp thường là kỹ sư dữ liệu, nhà phân tích dữ liệu và nhà khoa học dữ liệu.

Khả năng tận dụng dữ liệu của bạn sẽ phụ thuộc vào 3 yếu tố cốt lõi trên. Khi xây dựng một nhóm phân tích dữ liệu, những người đứng đầu thường phải đối mặt với những câu hỏi sau:

  • Nên xây dựng quy mô đội ngũ như thế nào?
  • Có bao nhiêu kỹ sư dữ liệu, nhà phân tích dữ liệu, nhà khoa học dữ liệu?
  • Làm thế nào để nhóm phân tích tương tác với các bộ phận còn lại của doanh nghiệp?
  • Cấu trúc cho nhóm phân tích dữ liệu như thế nào? Cấu trúc quản lý tập trung hay kết hợp với các bộ phận khác?


Định vị doanh nghiệp trong hành trình dữ liệu


Trước khi xây dựng nhóm dữ liệu, điều quan trọng là bạn phải biết mình đang ở đâu trong “hành trình dữ liệu”, vì điều này sẽ ảnh hưởng trực tiếp đến cấu trúc của nhóm. Doanh nghiệp của bạn có thể lớn mạnh, doanh thu tăng trưởng khá ổn định, tuy vậy xét về góc độ dữ liệu có thể vẫn chưa được tận dụng triệt để.


Data Maturity là một hành trình hướng đến việc nhận ra giá trị hữu hình từ Data Assets. ANATICS đề xuất một khuôn khổ đơn giản khi đánh giá Data Maturity, nơi đo lường khả năng hiểu biết về quá khứ, nắm bắt hiện tại và dự đoán tương lai của bạn.


Thành thạo dữ liệu là hành trình hướng tới việc nhìn thấy giá trị hữu hình từ dữ liệu của bạn. Trong hầu hết các công ty, mỗi bộ phận đều có bộ KPI riêng để hỗ trợ việc thực hiện chiến lược của công ty. Nhưng chỉ xác định chúng thôi là chưa đủ, KPI cần được theo dõi rõ ràng và bạn cũng phải có khả năng dự đoán kết quả trong tương lai dựa trên các KPI này. Khả năng này đến từ các kiến ​​thức về tình hình hiện tại bạn đang sở hữu, và sự hiểu biết sâu sắc về dữ liệu quá khứ.

Xem xét một số ví dụ dưới đây:


  • Marketing ROI: Xác định ROI thông qua nhiều kênh bằng cách sử dụng mô hình phân bổ đã xác định. Sau đó, hiểu sự phát triển của hoạt động phân bổ trong 12 tháng trước đó (hiểu được dữ liệu quá khứ) và đặc biệt là các yếu tố tạo ra sự phân bổ đó (chẳng hạn như xác định các kênh hoạt động, thời gian trong năm, sản phẩm...). Sau đó thực hiện theo dõi sự phát triển hàng ngày, hàng tuần, hàng tháng nhờ vào một công cụ báo cáo mà bạn tin tưởng (nắm được tình hình hiện tại); và dự báo ngân sách marketing của bạn dựa trên các mô hình dự đoán này (dự đoán cho tương lai).
  • Sự hài lòng của khách hàng: Xác định thước đo mức độ hài lòng của khách hàng. Bạn nên tính toán sự phát triển của thông tin này trong 12 tháng trước, tìm hiểu các yếu tố tác động tạo nên sự tăng trưởng đó (quá khứ). Sau đó theo dõi mức độ hài lòng của khách hàng hàng ngày bằng các bảng tổng hợp báo cáo đáng tin cậy. Xác định hành động cần thực hiện ngay từ hôm nay để gia tăng sự hài lòng. Sự hiểu biết của bạn về quá khứ và trạng thái hiện tại về sự hài lòng của khách hàng sẽ cho phép dự đoán tỷ lệ khách hàng rời bỏ thương hiệu một cách hiệu quả (tương lai).
  • Phân tích mô tả: Sự hiểu biết của bạn về quá khứ và hiện tại thường có được qua việc thực hiện phân tích/thống kê mô tả. Phân tích mô tả giúp tổ chức hiểu được hiệu quả hoạt động của mình bằng cách cung cấp ngữ cảnh giúp các bên liên quan mật thiết diễn giải thông tin. Ngữ cảnh này thường tồn tại ở dạng trực quan hoá dữ liệu, bao gồm đồ thị, trang báo cáo tổng hợp, báo cáo Ad Hoc đơn lẻ và biểu đồ. Khi đang phân tích dữ liệu để dự báo tương lai, bạn đang thực hiện phân tích dự đoán. Phân tích dự đoán là lấy dữ liệu lịch sử, đưa dữ liệu đó vào một mô hình machine learning để xem xét các mẫu chính. Áp dụng mô hình này cho dữ liệu hiện tại và kỳ vọng sẽ hỗ trợ dự báo trong tương lai.


Nhân sự “chủ chốt” trong nhóm phân tích dữ liệu


Nhóm phân tích dữ liệu thường bao gồm:


  1. Kỹ sư dữ liệu: Chịu trách nhiệm thiết kế, xây dựng và duy trì các tập dữ liệu có thể được tận dụng trong các dự án dữ liệu. Do đó, các kỹ sư dữ liệu thường làm việc chặt chẽ với cả nhà khoa học dữ liệu và nhà phân tích dữ liệu.
  2. Nhà khoa học dữ liệu: Sử dụng toán học và thống kê cao cấp cũng như các công cụ lập trình để xây dựng các mô hình dự đoán. Vai trò của nhà khoa học dữ liệu và nhà phân tích dữ liệu khá giống nhau, nhưng các nhà khoa học dữ liệu tập trung nhiều vào phân tích dự đoán hơn là phân tích mô tả.
  3. Nhà phân tích dữ liệu: Sử dụng dữ liệu để thực hiện báo cáo và phân tích trực tiếp. Trong khi các nhà khoa học và kỹ sư dữ liệu thường tương tác với dữ liệu thô, thì các nhà phân tích làm việc với dữ liệu đã được sàng lọc và chuyển đổi thành các định dạng thân thiện với người dùng hơn.
  4. Chuyên viên phân tích kinh doanh (Business Analyst – BA)/ Chuyên viên vận hành (Ops Analyst – OA): Tổ chức cải tiến các quy trình và hệ thống của doanh nghiệp. Tập trung vào việc thiết kế các bảng báo cáo tổng hợp giúp trả lời các câu hỏi kinh doanh và đề xuất giải pháp mới. Đối tượng này thường có sự nhanh nhạy và vạch ra ranh giới giữa CNTT – doanh nghiệp để thu hẹp khoảng cách nhằm nâng cao hiệu quả. BA/OA thường xuyên có một lĩnh vực kinh doanh cụ thể như marketing hoặc tài chính và khả năng hiểu biết về SQL của họ có thể bao gồm tổng quan cơ bản đến phân tích nâng cao.
  5. Trưởng bộ phận phân tích dữ liệu: Cung cấp giám sát chiến lược cho nhóm dữ liệu. Mục tiêu của họ là tạo ra một môi trường cho phép tất cả các bên khác nhau truy cập dữ liệu họ cần một cách dễ dàng, xây dựng các kỹ năng của doanh nghiệp để rút ra những thông tin giúp ích được cho kinh doanh từ dữ liệu và đảm bảo quản trị dữ liệu. Họ cũng đóng vai trò là cầu nối giữa nhóm dữ liệu và đơn vị kinh doanh chính, vai trò này cần một người có tầm nhìn xa để dẫn dắt đội kỹ thuật.‍


Quy mô của đội ngũ phân tích dữ liệu


Các công ty khác nhau sẽ xây dựng các nhóm dữ liệu có quy mô khác nhau và tất nhiên sẽ không có quy mô nào phù hợp với tất cả. ANATICS đã nghiên cứu cấu trúc của nhóm dữ liệu của hơn 300 công ty, với phạm vi 300-1.000 nhân viên và rút ra những thông tin chi tiết sau:

  • Như một quy định chung, nên đặt mục tiêu có tổng số 5-10% nhân viên hiểu biết về phân tích dữ liệu trong công ty của bạn.
  • Những nhân viên đầu tiên của nhóm dữ liệu hoàn toàn mới thường là kỹ sư dữ liệu và nhà phân tích dữ liệu. Chỉ với 2 vai trò này, các tổ chức đã có thể tham gia vào một số phân tích mô tả cơ bản. Khi xây dựng một nhóm lớn hơn, hãy suy nghĩ về bộ kỹ năng bạn cần. Một dự án dữ liệu điển hình yêu cầu các kỹ năng sau: cơ sở dữ liệu, phát triển phần mềm, machine learning, trực quan hoá, cộng tác và kỹ năng giao tiếp. Rất hiếm để tìm thấy những cá nhân sở hữu tất cả các kỹ năng này. Do đó, bạn nên biết mỗi ứng viên sở hữu kỹ năng nào bạn đặt ra để tuyển dụng hợp lý.
  • Quy mô nhóm phân tích dữ liệu của bạn sẽ được định hướng bằng số lượng các báo cáo vấn đề kinh doanh và mức độ phức tạp của các vấn đề nghiêm trọng nhất. Xem xét quy mô lộ trình của bạn và xác định bạn cần bao nhiêu người để hoàn thành các dự án dữ liệu của mình trong một khoảng thời gian hợp lý. Nếu bạn nhận thấy nhóm dữ liệu của mình sẽ mất hơn một năm để hoàn thành các dự án, thì có lẽ đã đến lúc mở rộng nhóm. ANATICS khuyến khích bạn nên suy nghĩ về kế hoạch phân chia tỷ lệ giữa hoạt động dự án hằng ngày và hoạt động xây dựng mở rộng của nhóm. Nhóm phân tích dữ liệu của bạn nên tập trung vào công việc vận hành hằng ngày 2/3 thời gian và xây dựng cho tương lai khoảng 1/3 thời gian còn lại. Nếu nhóm phân tích dữ liệu của bạn dành toàn bộ thời gian để tập trung vào các nhu cầu hàng ngày, bạn đang gây nguy hiểm cho tương lai của công ty mình và có lẽ đã đến lúc phải mở rộng nhóm.
  • Điều cuối cùng mà bạn cần cân nhắc đó là việc tuyển dụng nhân sự cho các dự án đòi hỏi chuyên môn cao. Ví dụ như bạn đang có 1 dự án về điều tra gian lận của Fintech, bạn nên tuyển những người có kiến thức chuyên sâu về ngành mà dự án của bạn đang cần.


Cách nhóm phân tích dữ liệu kết hợp với các phòng ban khác trong công ty


Sự thật là không có một cấu trúc hoàn hảo cho việc xây dựng nhóm phân tích dữ liệu, chắc chắn rằng cấu trúc nhóm của bạn sẽ thay đổi rất nhiều trong tương lai. Có thể thấy rằng nếu cấu trúc nhóm phân tích dữ liệu của bạn không thay đổi trong 2 năm qua, thì đó có thể là cấu trúc dưới mức tối ưu, vì nhu cầu dữ liệu của doanh nghiệp đang phát triển nhanh chóng, đòi hỏi sự điều chỉnh của cấu trúc nhóm phân tích dữ liệu.


Bước đầu tiên để xây dựng nhóm phân tích dữ liệu là tìm những người đã quen làm việc với dữ liệu có sẵn trong tổ chức, họ có thể không có danh từ “dữ liệu” trong chức danh nhưng là những người sẵn sàng để phân tích số liệu hoặc có sẵn kỹ năng về ngôn ngữ truy vấn dữ liệu (SQL) nếu bạn không dành thời gian cho việc sắp xếp những nhân sự có sẵn này vào nhóm phân tích dữ liệu, khả năng cao nhóm phân tích của bạn sẽ không phù hợp với những yêu cầu từ phía kinh doanh.


Mô hình tập trung (Centralized Model)


Mô hình tập trung là cấu trúc đơn giản nhất để triển khai và thường là bước đầu tiên đối với các công ty hướng đến việc định hướng dữ liệu. Tuy nhiên cũng có một số hạn chế đối với mô hình này. Cấu trúc này thường dẫn đến một “nền tảng” dữ liệu tập trung, nơi nhóm phân tích dữ liệu có quyền truy cập vào tất cả dữ liệu và các dịch vụ của toàn tổ chức trong nhiều dự án khác nhau. Tất cả các kỹ sư dữ liệu, nhà phân tích dữ liệu và nhà khoa học dữ liệu trong nhóm này được quản lý trực tiếp bởi người đứng đầu.


Mô hình linh hoạt này có thể thích ứng với nhu cầu phát triển liên tục của một doanh nghiệp đang phát triển. Nếu bạn đang bắt đầu hành trình dữ liệu của mình, tức là bạn vẫn đang đấu tranh để có một tầm nhìn rõ ràng về quá khứ và hiện tại thì đây là cấu trúc được khuyên nên sử dụng. Các dự án đầu tiên của nhóm dữ liệu sẽ tìm cách mang lại giá trị có thể nhìn thấy từ dữ liệu cho doanh nghiệp, đảm bảo tất cả các phòng ban trong tổ chức của bạn đều có KPI và trang báo cáo tổng hợp mà họ có thể tin tưởng. Loại cấu trúc này đặc biệt tốt cho phân tích khi khả năng tái sử dụng và quản lý dữ liệu là quan trọng.


Nguồn: Medium

Lợi ích của mô hình:

  • Nhóm phân tích dữ liệu có thể hỗ trợ dự án của các nhóm khác, đặt ưu tiên cho những dự án quan trọng.
  • Có nhiều cơ hội hơn để phát triển tài năng và kỹ năng theo mô hình tập trung. Trên thực tế, nhóm dữ liệu làm việc trên nhiều dự án khác nhau, từ đó các kỹ sư dữ liệu, nhà khoa học và nhà phân tích có thể hưởng lợi từ những thông tin hoặc kiến thức từ đồng đội.
  • Người đứng đầu bộ phận dữ liệu có cái nhìn tập trung về chiến lược của công ty và có thể chỉ định nhân viên dữ liệu vào các dự án phù hợp nhất với khả năng của họ.
  • Khuyến khích sự phát triển trong sự nghiệp, các vai trò kỹ sư dữ liệu và nhà khoa học dữ liệu có được góc nhìn chi tiết về các vai trò khi đạt cấp bậc cao.


Hạn chế của mô hình:

  • Khả năng mất kết nối cao giữa nhóm phân tích dữ liệu và các đơn vị kinh doanh khác. Trong mô hình này, các kỹ sư dữ liệu và nhà khoa học dữ liệu không tham gia nhiều vào các hoạt động hàng ngày của các nhóm khác, khiến họ khó xác định các vấn đề liên quan nhất để giải quyết.
  • Rủi ro nhóm phân tích bị xem là chức năng “hỗ trợ” cho các bộ phận khác dẫn đến các bộ phận khác không nhận trách nhiệm của họ.
  • Vì nhóm dữ liệu phục vụ cho tất cả các bộ phận của doanh nghiệp, họ sẽ luôn trong trạng thái quá tải. Điều này sẽ làm một số đơn vị kinh doanh có thể cảm thấy nhu cầu của họ không được giải quyết đúng cách hoặc quy trình lập kế hoạch quá chậm.


Mô hình phi tập trung (Decentralized/Embedded Model)


Trong mô hình phi tập trung, mỗi bộ phận sẽ có nhân viên phân tích dữ liệu riêng với một nền tảng dữ liệu tập trung. Trong mô hình này, các nhà phân tích dữ liệu và nhà khoa học tập trung vào các vấn đề mà từng bộ phận cụ thể của họ phải đối mặt, ít tương tác với những người làm dữ liệu từ các phòng ban khác của công ty. Với cấu trúc này, các nhà phân tích dữ liệu sẽ báo cáo trực tiếp cho người đứng đầu đơn vị kinh doanh của họ.

Nguồn: Medium

Lợi ích của mô hình:

  • Nhóm phân tích dữ liệu được hoạt động trong một phòng ban sẽ có độ nhanh và chính xác cao hơn vì đội ngũ chuyên tâm vào các chức năng kinh doanh tương ứng và có kiến ​​thức chuyên sâu.
  • Người quản lý sản phẩm có thể giao nhiệm vụ dữ liệu cho những người có đủ năng lực nhất để thực hiện chúng.
  • Các nhóm phân tích dữ liệu kinh doanh không phải tranh giành tài nguyên để xây dựng dự án dữ liệu của họ vì các tài nguyên này đã được phân bổ về cho mỗi nhóm.

Hạn chế của mô hình:

  • Không biết được nguồn dữ liệu chính xác và dễ rơi vào tình huống trùng lặp mục đích khi sử dụng dữ liệu.
  • Nhân viên dữ liệu phải làm việc với các vấn đề dữ liệu bị lặp lại do thiếu liên lạc giữa các nhóm khác nhau.
  • Điều kiện làm việc tách biệt dẫn đến suy giảm năng suất trong việc phân tích dữ liệu vì làm việc riêng biệt không có sự trao đổi và học hỏi kiến thức từ đồng nghiệp.
  • Mô hình này khiến việc tối ưu hoá sử dụng nhân sự phân tích dữ liệu trong các dự án khác nhau trở nên khó khăn hơn.
  • Các nhà quản lý doanh nghiệp, thường thiếu kiến ​​thức về mặt kỹ thuật, sẽ khó quản lý nhân sự phân tích dữ liệu và hiểu chất lượng công việc của họ.


Mô hình liên kết (Federated model/Centre of excellence)


Mô hình liên kết phù hợp nhất với các doanh nghiệp đã có lợi thế nhất định về dữ liệu, có chiến lược dữ liệu rõ ràng và tập trung vào phân tích dự đoán.


Trong mô hình Centre of excellence (COE), nhân viên phân tích dữ liệu được tham gia cùng với các đơn vị kinh doanh nhưng vẫn trong một nhóm và vẫn có những lợi ích của nhóm như được sự hỗ trợ từ đồng nghiệp và tập huấn từ cấp trên. Trong trường hợp nhân sự trong nhóm phân tích của bạn đang được triển khai ở các phòng ban khác nhau, bạn vẫn có một nhà lãnh đạo, người ưu tiên và giám sát các dự án dữ liệu. Điều này đảm bảo rằng các dự án dữ liệu có lợi nhất sẽ được giải quyết trước tiên.


Chiến lược này phù hợp nhất với các công ty quy mô doanh nghiệp, lớn hơn với lộ trình dữ liệu rõ ràng. Cách tiếp cận này giữ lại những ưu điểm của cả mô hình tập trung và mô hình phi tập trung. Đó là một cấu trúc cân bằng hơn, trong đó các hành động của nhóm phân tích dữ liệu được điều phối, nhưng cũng giữ cho các chuyên gia dữ liệu được tham gia cùng với các đơn vị kinh doanh.

Nguồn: Medium

Lợi ích của mô hình:

  • Là sự kết hợp của cả hai mô hình tập trung và mô hình phi tập trung, mang những lợi ích của cả hai mô hình.

Hạn chế của mô hình:

  • Mô hình này đòi hỏi cần thêm một tầng điều phối và giao tiếp giúp giữ vững sự thống nhất giữa nhóm phân tích dữ liệu và các phòng ban, đơn vị kinh doanh khác
  • Không phù hợp với các tổ chức vừa và nhỏ.


Xây dựng một nhóm phân tích chất lượng là “chìa khoá vàng” mà bạn cần nắm bắt nếu doanh nghiệp của bạn muốn phát triển dựa trên dữ liệu. Những giá trị đem lại cho công ty tỷ lệ thuận với sức mạnh của nhóm phân tích dữ liệu và mức độ liên kết giữa nhóm dữ liệu với những bộ phận khác trong doanh nghiệp. Hiện nay vẫn chưa có một lời khuyên “chuẩn” nào về quy mô, thành phần hoặc cấu trúc mà nhóm phân tích dữ liệu nên được xây dựng. Đó là lý do vì sao doanh nghiệp nên định vị được bản thân, hiểu về khả năng thành thạo dữ liệu hiện tại mà công ty đã đạt được. Từ những cơ sở đó, bạn sẽ dễ dàng phát triển đội nhóm dữ liệu phù hợp với chiến lược kinh doanh hơn.

Nguồn: Towards Data Science