DataWareHouse Nedir?

Bilgilerin saklanma ihtiyacı veritabanlarının oluşmasına sebep olmuştur. Daha sonra verilerin veritabanlarında da oldukça artması ve elle kontrol edile bilmenin imkansızlığı ve bilgilere erişimin gecikmesinden ötürü Datawarehouse(Veri madenciliği) teknolojisi ortaya çıkmıştır.
Bir diğer adı da veri ambarları olan teknolojinin amacı çok boyutlu ve karmaşık verileri özetlemek ve kategorize etmektir. Sorgulanan veriler kategoriler halinde saklanarak raporlanır. Bir diğer amacı ise Gereksiz verileri ayıklar ve odaklandığı konu çerçevesinde basit ve anlaşılabilir bilgiyi sunar.
Veri Madenciliğinin en gerekli kılan faktör ise ;
Veri tabanındaki bilgilerin veri madenciliği sayesinde İşlemsel sistemlerdeki veriyi kopyalar ve karar verme işlemi için uygun formda saklar.

datawarehouse pharmamarketing

Veri Madenciliğinde Uygulanan Yöntemler

Veri Çıkarımı ve Yükleme
Veri çıkarımı, veri ambarının kullandığı kaynaklardan veri elde etme işlemidir. Yükleme işlemi verinin, veri ambarına konulması işlemidir. Yükleme işleminden önce, farklı işletimsel kaynaklardan  gelen veri, tutarlı hale getirilmelidir. Kaynaklardan çıkarılan veri genellikle, geçici dosyalara yüklenilir.

Veri Temizleme ve Format Dönüştürümü

Veri temizleme işlemi geçici dosyalar üzerinde yapılır.Veri temizleme işleminde,  aynı ve farklı kaynaklardaki verilerin tutarlı olması, veri doğruluğu tespit edilir.Temizleme ve dönüştürüm işleminde amaç veriyi sorgulanabilecek (Query) veri yapısı formatına çevirmektir. (Uygun veri tipi)Veri yönetimini daha kolay ve verimli hale getirmek için veri bölümlenir. Kullanım sıklığı fazla olan sorgular için, veri toplulukları yaratılır.

Veri Dönüştürümü

Verinin temizlenmesinden sonra, hesaplanan verinin saklanması için  gerekli alanlar ve zaman alanı türünde ilave alanların eklenmesi işlemidir.

Metadata

Veri ambarı çok fazla veri içermektedir. Tutulan  veri hakkında ihtiyaç duyulan tüm bilgiler metadata olarak adlandırılır.Metadata, kütüphanede ki kart kataloguna benzer. Bir kart katalogu, aranılan kitabin kütüphanede olup olmadığına, eğer kütüphanedeyse yerini bulmak için kullanılır.

Veri Pazarları (Data Marts)

Birleşik verilerin tutulduğu veri ambarına ilave olarak kullanılan veri deposu olarak tanımlanabilir. Veri pazarı, belirli kullanıcı grubu için yaratılan veri bölümüyle ilgilidir. Bir veri pazarı,  normalize edilmemiş, özetlenmiş, toplanılmış veri topluluğu olabilir.

Veri ambarı

İlişkili verilerin sorgulandığı ve analizlerinin yapılabildiği bir depodur. Veri ambarı veri tabanını yormamak için oluşturulmuştur. Bir veri ambarı ilgili veriyi kolay, hızlı ve doğru bicimde analiz etmek için gerekli işlemleri yerine getirir. Veri ambarı, işlemsel sistemlerde ki veriyi kopyalayıp, karar verme işlemi için uygun formda saklar. Veri ve bilgiler, üretildiklerinde heterojen kaynaklardan elde edilirler. Standford Üniversitesine göre: Veri ambarı, başlangıçta farklı kaynaklardan gelen verinin üzerinde daha etkili ve daha kolay sorguların yapılmasını sağlamaktadır.

Yorumlarınızı Bekliyorum...