DATA QUALITY SERVICES

Merhaba,

Açılımı Data Quality Services olan DQS tool u nedir, niçin kullanıyoruzu inceliyor olacağız bu yazımda.

SQL Server 2012 ile gelen bu özellik tabiri caizse yanlış, tutarsız, duplice verileri istediğimiz forma dönüştürmemize yardım eden bir tool dur.

DQS veriyi daha tutarlı, doğru bir hale gitirmek için kullanılan yani veri temizliği yaptığımız bir tool dur. Peki bizim için önemi nedir diye düşünürsek:

Şirketlerin tüm karar mekanizlarını etkileyen, analiz, raporlarının kaynağı olan veri yanlış olduğu anda tüm kararlar yanlış olacaktır.

Bir yerde okumuştum  “Veri petrol gibidir, işlenmedikçe kullanılmaz” gibi bir söz -Orjinali daha güzeldi tabi- aslında DQS in önemini ortaya koymakta. Elimizde veri var, zaten veri azlığı gibi bir problemle karşılaşmamaktayız günümüzde aksine veri fazlalığı ve bu fazla verinin içinden çıkamamak gibi  bir durum söz konusu. Dolayısıyla, veri çok farklı platformlarda, birbirinden farklı formatlarda tutulmakta. Bunun önüne geçebilmek hayati derecede önemli.

Çok fazla verinin tutarsız olduğu, duplicate verilerin olduğu bir veri kümesinden analiz, raporlama yapmaya çalıştığımızda sonuçların bizleri ne kadar yanlış yerlere götürebileceğini düşünmek bile istemeyiz. Hatta öyleki verdiğimiz yanlış kararlarla şirketimizi yanlış yerlere dahi götürebiliriz.

Yanlış, tutarsız veri= yanlış şirket stratejisi, yanlış kararlar, yanlış analiz…..

Örnek vermek gerekirse: internetten satış yaptığımızı düşünelim. Satış işlemi için alıcıların mail adresleri ile log in olması gerekmekte.Yusuf Boğatepe isimli kullanıcı kullanmış olduğu mail adresi ile login olup satın alma işlemini gerçekleştiriyor. Başka bir satın alma işlemi sırasında Yusuf Boğatepe şifresini unutuyor. Yeniden şifre oluşturma işlemini yapmak yerine tekrardan kullanmakta olduğu başka bir mail hesabıyla login oluyor. Bu şekilde 1000 lerce kişinin farklı mail adresileriye işlem yapma olasılığı tahmin ederiz ki baya bir yüksektir. Şirketimiz açısından bakarsak 1000 lerce fazla müşterimiz varmış gibi analiz edip, karar almasına neden olacaktır.

Tabi bu basit bir örnek. Ciddi bir durumda çok olumsuz durumlarla karşı karşıya kalabiliriz.

Tüm bu saydıklarımız ve de saymadıklarımız veri tutarsızlığını, kirliliğini önlemek amacı ile DQS i kullanıyoruz.

Kullanılma amacını öğrendik şimdi sıra geldi DQS i nasıl kullanacağımızı incelemeye.

DQS Kurulumu

SQL Server 2012 ve sonrasında kullanma imkanı olan DQS i kullanabilmek için SQL Server kurulumu sırasında bu özelliği de indirmek istediğimizi belirtmemiz gerekmekte.

DQS iki bileşenden oluşmaktadır. Zaten bu özellikleri SQL Server kurulumu sırasında check leyerek kurulumunu yapabilirsiniz.

SQL Server kurulumunda aşağıda olduğu gibi “Data Quality Services” ve “Data Quality Client” özelliklerini check lememiz gerekmekte.dqs1

 

Kurulumu tamamladıktan sonra,  DQS i aktifleştirmek için, Data Quality Server Installer ı çalıştırıyoruz.

dqs2

 

Burada bizden Master Key istemekte.m1

Master Key üretmek için SSMS te aşağıdaki kodu yazıyorum. Complex bir şifre olmasına dikkat etmekte yarar var.

m2

DQSInstaller a key i yazarak işlemimize devam edip, sonlandırıyoruz.

Buraya kadar DQS i kullanma amacımızdan ve kurulumundan bahsettik.

DQS ile yaptığımız temel işlemler olan Matching ve Cleasing in ayrıntılarına sonraki yazılarımda değineceğim.

Keyifli okumalar…

Şeydanur Sandıkçı

 

Reklamlar

Etiketler:, , , , , , , ,

Trackbacks / Pingbacks

  1. Data Warehouse Dizisi-1 | - 19 Nisan 2016

Bir Cevap Yazın

Aşağıya bilgilerinizi girin veya oturum açmak için bir simgeye tıklayın:

WordPress.com Logosu

WordPress.com hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Twitter resmi

Twitter hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Facebook fotoğrafı

Facebook hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Google+ fotoğrafı

Google+ hesabınızı kullanarak yorum yapıyorsunuz. Çıkış  Yap / Değiştir )

Connecting to %s

%d blogcu bunu beğendi: