Czyszczenie Danych

Początkowym etapem każdej z analiz jest „poznanie danych” oraz tzw. preprocesing, w skład którego wchodzi proces oczyszczania i standaryzacji danych (ang. data cleansing, data scrubbing). Bez nie go nie jesteśmy w stanie wydobyć cennej informacji.
Szybko i solidnie „oczyszczamy” dane.
Proces czyszczenia danych realizujemy w następujących etapach:

  • analiza danych – określenie problemów jakości danych i określenie strategii dalszych faz czyszczenia,
  • standaryzacja danych – parsowanie, poprawienie i standaryzacja danych, możliwość wykorzystania słownika, narzędzi informatycznych
  • dopasowanie – identyfikacja duplikatów,
  • agregacja danych – usunięcie duplikatów

Poprawiamy m.in. typowe błędy adresowe (możliwość stworzenia słownika), literówki, przeprowadzamy agregacje danych do określonego poziomu. Zapewniamy również kompleksowe wykonanie usług od procesu oczyszczania, aż po konkretną analizę i raportowanie.

[button link=”http://dcad.com.pl/kontakt-2″]Zapraszamy do kontaktu z nami[/button]