Langsung ke konten utama

Komputasi Data Cube : Konsep Awal

Cube Materialization: Full Cube, Iceberg Cube, Cube Tertutup, dan Cube Shell

   
      Ukuran yang umum digunakan antara lain; count(), sum(), min(), max(), dan total penjualan(). Setiap kubus mewakili kelompok demi kelompok. Misalkan ada ABC yang basisnya berbentuk kubus, mengandung ketiga dimensi. Di sini, ukuran agregat, M, dihitung untuk setiap kemungkinan kombinasi dari tiga dimensi. Basis kubus adalah paling umum dari semua cuboids dalam kubus data. Kubus yang paling umum adalah apex berbentuk kubus. 
      Untuk menelusuri kubus data, kita mulai dari kubus apeks, untuk menggulung, kita mulai dari kubus dasar ke atas. 









Referensi:
Jiawei Han, M. K. (2012). Data Mining Concepts and Technique. In M. K. Jiawei Han, Data Mining Concepts and Technique 3rd Edition (pp. 187-200). USA: BritishLibrary Cataloguing-in-Publication Data.

Komentar

Postingan populer dari blog ini

Data Cube Technology

Pendahuluan        Sistem data warehouse menyediakan alat pemrosesan analitik online (OLAP) untuk interaktif analisis data multidimensi pada tingkat granularitas yang bervariasi. Alat OLAP biasanya digunakan kubus data (data cube) dan model data multidimensi untuk menyediakan akses yang fleksibel untuk dirangkum. Sebagai contoh, sebuah kubus data dapat menyimpan langkah-langkah precomputed, seperti count() dan total penjualan() yang membentuk kombinasi dimensi data (seperti barang, wilayah, dan pelanggan).         Pengguna dapat mengajukan pertanyaan OLAP pada data. Mereka juga dapat mengeksplorasi data secara interaktif dengan cara multidimensional melalui operasi OLAP seperti drill-down (untuk melihat lebih khusus data seperti total penjualan per kota) atau roll-up (untuk melihat data secara lebih umum tingkat seperti total penjualan per negara).        Meskipun konsep data kubus awalnya ditujukan untuk OLAP, itu...

Strategi Umum untuk Komputasi Data Cube

       Ada beberapa metode untuk perhitungan kubus data yang efisien, secara umum, ada dua data dasar struktur yang digunakan untuk menyimpan kubus. Implementasi OLAP relasional (ROLAP) menggunakan tabel relasional, sedangkan array multidimensional digunakan dalam multidimensional OLAP (MOLAP). Meskipun ROLAP dan MOLAP masing-masing dapat menjelajahi kubus yang berbeda teknik perhitungan, beberapa "trik" optimasi dapat dibagi di antara yang beberapa  representasi data. Berikut ini adalah teknik pengoptimalan pada perhitungan Data Cube. Teknik Optimasi 1: Sorting, hashing, dan grouping. Operasi pengelompokan harus diterapkan pada atribut dimensi untuk menyusun ulang dan kluster yang berkaitan dengan tupel. Dalam perhitungan data cube, agregasi dilakukan pada tupel (atau sel) yang dibagikan set nilai dimensi yang sama. Jadi, penting untuk mengeksplorasi sorting, hashing, dan grouping untuk mengakses dan mengelompokkan da...