Công nghệ xử lí dữ liệu lớn có thể xử lí mọi loại dữ liệu từ các nguồn như mạng xã hội, cảm biến, camera… với mọi định dạng và theo thời gian thực.
Dữ liệu lớn là gì?
Lâu nay, các công ty, tổ chức thường chỉ có thể quản lí được các dữ liệu được lưu trữ trong cơ sở dữ liệu. Ngày nay, cùng với sự phổ biến của các mạng xã hội, các weblog, thiết bị cảm biến, bản ghi log của các thiết bị, các hình ảnh..., thông tin nằm rải rác nhiều nơi và có thể mang lại những thông tin hữu ích nếu được tập hợp, xử lí.
Những thông tin như vậy được các nhà nghiên cứu công nghệ gọi là Dữ liệu lớn (Big Data). Nó không chỉ lớn về mặt khối lượng mà còn vô cùng đa dạng về định dạng cũng như tốc độ sinh ra.
Các công ty nghiên cứu thị trường như IDC, Gartner cũng chỉ ra rằng các tổ chức đang rất nỗ lực để tích hợp các dạng và nguồn thông tin mới, đa dạng, có giá trị cao vào một cơ sở hạ tầng quản lí thông tin nhất quán.
Trong khi các công nghệ xử lí dữ liệu trước đây chỉ có khả năng xử lí các loại dữ liệu có cấu trúc, vì vậy, rất cần có một giải pháp chuyên biệt dùng cho xử lí các dữ liệu không có định dạng từ nhiều nguồn khác nhau (như các cảm biến, camera, mạng xã hội,…) theo tốc độ nhanh và thời gian thực.
Và nay đã có giải pháp.
Chẳng hạn, trong điều tra tội phạm, công nghệ xử lí dữ liệu lớn có thể truy soát biển số xe từ các cảm biến, các file video do các camera ghi lại, truy cuộc gọi từ điện thoại, truy thông tin di chuyển của đối tượng qua các hệ thống định vị… và gửi tự động về trung tâm giúp việc điều tra được thực hiện nhanh chóng, khẩn trương.
Trong y tế, việc theo dõi các căn bệnh mãn tính hoặc lâu dài là rất đắt đỏ, việc sử dụng các thiết bị cảm biến tại nhà riêng để đo các chỉ số sức khỏe (như nhịp tim, huyết áp, đường huyết,…) phục vụ việc giám sát bệnh từ xa có thể giúp cải thiện sức khỏe bệnh nhân nhờ được theo dõi kịp thời mà lại giảm được số lần thăm khám và nhập viện.
Ông Kaleem Chaudhry, Giám đốc khu vực khối công nghệ doanh nghiệp, Oracle châu Á – Thái Bình Dương cho biết các giải pháp cũ thường chỉ xử lí những dữ liệu có định dạng, đưa ra những nhận xét về hiệu quả của những việc đã làm nhưng với công nghệ xử lí dữ liệu mới có thể thu thập thông tin từ hàng trăm nguồn khác nhau và xử lí nó, tìm mối quan hệ cho các thông tin để đưa ra những quyết định cho tương lai.
Ứng dụng Dữ liệu lớn trong doanh nghiệp
Công nghệ xử lí Dữ liệu lớn rất phù hợp đối với các hoạt động trong doanh nghiệp, giúp trả lời các câu hỏi tại sao doanh thu của công ty sụt giảm? Sản phẩm nào được thị trường chú trọng?... Chẳng hạn, trước đây, các công ty bán lẻ thường chỉ có các bản ghi về các khách hàng đã mua sản phẩm. Nhưng với công nghệ dữ liệu lớn có thể giúp họ có được thông tin từ mạng xã hội và các bản ghi từ các trang web (weblog) thương mại điện tử có thể giúp họ hiểu rõ ai là người không mua hàng cũng như lí do vì sao họ lại không mua hàng, những thông tin mà trước đây họ không thể có được.
Chẳng hạn, thông qua các thông tin trên mạng xã hội, doanh nghiệp có thể hiểu ra rằng có 5 sản phẩm “hot” trên thị trường mà cửa hàng mình không có hoặc không có cỡ mà người mua hay dùng…
Đối với các nhà mạng, họ cũng có thể truy cứu dữ liệu sâu từ các sổ ghi (log file) để tìm hiểu xem nguyên nhân nào khách hàng bỏ mạng: do điện thoại của khách hay do lỗi phủ sóng.
Cũng theo Kaleem, công nghệ xử lí Dữ liệu lớn chính là sự bổ sung cho các công nghệ xử lí dữ liệu trước đây. Đối với các doanh nghiệp, công nghệ xử lí Dữ liệu lớn sẽ đem lại khả năng xử lí thông tin toàn diện trong doanh nghiệp cùng với công nghệ xử lí dữ liệu có cấu trúc theo kiểu truyền thống, công nghệ phân tích thông tin doanh nghiệp.
Theo PCWorld VN