Backup and migrate data

Mục đích bài viết

Các bước cần thiết để thực hiện di chuyển deep storage của bạn từ local lên S3 hoặc HDFS.

Read More

001 Making Visit Statistical System

Mục đích bài viết

Tìm hiểu các thành phần của một hệ thống thống kê truy cập website thương mại điện tử. Một hệ thống thống kê truy cập cho ta thấy được một cái nhìn tổng quan về các hoạt động đang diễn ra trên trang web của mình.

Read More

007 Apache Druid - Compacting Segments

Mục đích bài viết

Trong bài viết này chúng ta sẽ cùng tìm hiểu về cách giảm số lượng segments trong dữ liệu của Druid. Việc giảm số segment có thể giúp giảm bộ nhớ lưu trữ và quá trình xử lý.

Read More

006 Apache Druid - Roll-up In Druid

Mục đích bài viết

Trong quá trình Ingestion, roll-up là kỹ thuật giúp bạn tổng hợp trước dữ liệu ngay lúc nhập dữ liệu, từ đó giảm lượng dữ liệu cần lưu trữ.

Read More

005 Apache Druid - Query In Druid

Mục đích bài viết

Trong bài viết này chúng ta sẽ cùng tìm hiểu cách truy vấn dữ liệu trong Druid. Druid hỗ trợ 2 phương thức truy vấn là Druid SQL và Native query.

Read More

003 Apache Druid - Druid Ingestion

Mục đích bài viết

Khái niệm nhập dữ liệu trong Druid được gọi là ingestion. Trong bài viết này chúng ta sẽ cùng tìm hiểu các cách nhập dữ liệu trong Druid. Druid cung cấp 2 phương thức để nhập dữ liệu đó là batch ingestion và streaming ingestion.

Read More

002 Apache Druid - Install Apache Druid

Mục đích bài viết

Tiếp tục series tìm hiểu Apache Druid, trong bài viết này chúng ta sẽ cùng tìm hiểu cách cài đặt Druid. Druid cung cấp 2 cách cài đặt, một là cài đặt trên một single machine, hai là cài đặt trên một cluster.

Read More

001 Apache Druid - Introduction To Druid

Mục đích bài viết

Mình đang tìm hiểu để làm một hệ thống thống kê truy cập trên một hệ thống website. Sản phẩm công ty mình đang làm là một nền tảng thương mại điện tử, tự động tạo ra trang web cho người dùng chỉ với vài bước đơn giản. Số lượng website rất lớn cho nên nhu cầu cũng là rất lớn. Lõi của một hệ thống báo cáo thống kê đương nhiên phải là một hệ quản trị cơ sở dữ liệu tốt rồi. Apache Druid là một CSDL được thiết kế với mục đích tối ưu lưu trữ, truy vấn nhanh, phân tán, xử lý song song, dễ dàng scale. Bài viết này sẽ giới thiệu về Druid, các key features của nó, khi nào nên sử dụng.

Read More