Backup and migrate data
Mục đích bài viết
Các bước cần thiết để thực hiện di chuyển deep storage của bạn từ local lên S3 hoặc HDFS.
001 Making Visit Statistical System
Mục đích bài viết
Tìm hiểu các thành phần của một hệ thống thống kê truy cập website thương mại điện tử. Một hệ thống thống kê truy cập cho ta thấy được một cái nhìn tổng quan về các hoạt động đang diễn ra trên trang web của mình.
009 Apache Druid - Transform Data
Mục đích bài viết
Trong bài viết này chúng ta sẽ cùng tìm hiểu về cách biến đổi dữ liệu khi nhập dữ liệu.
008 Apache Druid - Delete Data
Mục đích bài viết
007 Apache Druid - Compacting Segments
Mục đích bài viết
Trong bài viết này chúng ta sẽ cùng tìm hiểu về cách giảm số lượng segments trong dữ liệu của Druid. Việc giảm số segment có thể giúp giảm bộ nhớ lưu trữ và quá trình xử lý.
006 Apache Druid - Roll-up In Druid
Mục đích bài viết
Trong quá trình Ingestion, roll-up là kỹ thuật giúp bạn tổng hợp trước dữ liệu ngay lúc nhập dữ liệu, từ đó giảm lượng dữ liệu cần lưu trữ.
005 Apache Druid - Query In Druid
Mục đích bài viết
Trong bài viết này chúng ta sẽ cùng tìm hiểu cách truy vấn dữ liệu trong Druid. Druid hỗ trợ 2 phương thức truy vấn là Druid SQL và Native query.
004 Apache Druid - Writing Spec Ingestion
Mục đích bài viết
Trong bài viết này chúng ta sẽ tìm hiểu cách viết một file spec để ingestion.
003 Apache Druid - Druid Ingestion
Mục đích bài viết
Khái niệm nhập dữ liệu trong Druid được gọi là ingestion. Trong bài viết này chúng ta sẽ cùng tìm hiểu các cách nhập dữ liệu trong Druid. Druid cung cấp 2 phương thức để nhập dữ liệu đó là batch ingestion và streaming ingestion.
002 Apache Druid - Install Apache Druid
Mục đích bài viết
Tiếp tục series tìm hiểu Apache Druid, trong bài viết này chúng ta sẽ cùng tìm hiểu cách cài đặt Druid. Druid cung cấp 2 cách cài đặt, một là cài đặt trên một single machine, hai là cài đặt trên một cluster.
001 Apache Druid - Introduction To Druid
Mục đích bài viết
Mình đang tìm hiểu để làm một hệ thống thống kê truy cập trên một hệ thống website. Sản phẩm công ty mình đang làm là một nền tảng thương mại điện tử, tự động tạo ra trang web cho người dùng chỉ với vài bước đơn giản. Số lượng website rất lớn cho nên nhu cầu cũng là rất lớn. Lõi của một hệ thống báo cáo thống kê đương nhiên phải là một hệ quản trị cơ sở dữ liệu tốt rồi. Apache Druid là một CSDL được thiết kế với mục đích tối ưu lưu trữ, truy vấn nhanh, phân tán, xử lý song song, dễ dàng scale. Bài viết này sẽ giới thiệu về Druid, các key features của nó, khi nào nên sử dụng.
My first post!
Hello, this is my firt post, let’s make awesome!