Klasyfikacja Danych: Analityka

Home / Aktualności / Klasyfikacja Danych: Analityka

Czwartym wymiarem użyteczności File Analysis Software, według Gartner’a jest analityka. To własnie poprawa tego obszaru interesuje wiele działów – od IT, przez Security i Finanse do działu prawnego. Analityka pozwala grupować pliki według istotności poszczególnych miejsc, analizy czasu ich życia w organizacji lub odchyleń dotyczących klasyfikowania plików przez ich użytkowników. Ten przypadek użycia koncentruje się na dodaniu wartości do wizji i celów organizacji, takich jak identyfikacja dodatkowych możliwości biznesowych.

Gartner ujmuje kwestię analityki w klasyfikatorach danych jako wydobywanie potencjalnej wartości biznesowej związanej z nieustrukturyzowanymi danymi.  Dzieje się tak dzięki identyfikowaniu i włączaniu tagów metadanych, które optymalizują działania biznesowe. Pozwala to :

  • Zapewnić lepszy dostęp do nieustrukturyzowanych danych.
  • Ułatwić biznesowe wykorzystanie danych, które wcześniej uznano za „ciemne”.

Tagi metadanych mogą zapewnić krytyczny wgląd w dane, co zwykle rozumiane jest jako wystarczający poziom analityki w organizacji. Przykładowo:

Formalne systemy CRM są zazwyczaj wykorzystywane w najmniejszym stopniu przez sprzedawców, ze względu na ich złożoność i problemy z dostępem zdalnym. Z drugiej strony powszechne aplikacje biurowe (takie jak Word, Excel czy Google Docs) stanowią podstawę ich codziennych działań w tworzeniu ofert dla klientów. Podobnie przedstawia się sytuacja aplikacji komunikacyjnych (Gmail, Microsoft Outlook, HCL Technologies-Lotus Notes, Slack i Skype), są one używane jako główny nośnik do wewnętrznego i zawenętrznego przekazywania sobie pomysłów, propozycji i najważniejszych tematów . Brak klasyfikacji sprawia, że dane te są „niewidzialne” dla analityków.

Jak na ironię, większość organizacji zajmuje się w swoich hurtowniach danych (zasilanych przez ustrukturyzowane bazy danych i aplikacje) analizą biznesową (BI). W międzyczasie ignorując większe zbiory danych, które są używane częściej, także podczas „strumienia świadomości”, dlatego właśnie znacznie lepszy kontekst zapewniałaby tutaj analiza niestrukturyzowanych zbiorów danych.


Kluczowe funkcjonalności w zakresie analityki to:

  • Analiza metadanych – raportowanie zarówno standardowych, jak i dostosowanych metadanych zapewnia prawdziwą moc analizy plików. Atrybuty takie jak rozmiar pliku, jego właściciel, tytuł, numer, data dostępu, modyfikacji i zablokowania umożliwiają organizacjom IT lepsze zrozumienie i naprawę nieustrukturyzowanych danych.

  • Świadomość treści – większość narzędzi do analizy plików skupia się na identyfikacji danych wrażliwych, takich jak dane umożliwiające identyfikację osoby, PCI i PHI. Solidność wielu produktów lub dostępnych interfejsów API do zasilania innych aplikacji pozwala na dodatkowe przypadki użycia, które wymagają znajomości treści w celu klasyfikacji lub egzekwowania zasad, takich jak identyfikacja udokumentowanych procesów, trendów danych i analiz. Kompromisy w wyszukiwaniu treści mogą obejmować opóźnienia w pobieraniu wyników i obniżoną wydajność systemu na żywo podczas procesu wyszukiwania danych.

  • Oznaczanie i klasyfikacja – jest to możliwość oznaczania pliku lub obiektu metadanymi, które umożliwią podjęcie przyszłych działań lub decyzji, na przykład za pomocą zewnętrznego narzędzia egzekwowania (takiego jak system DLP). Tagowanie opiera się na analizie metadanych lub świadomości treści. Klasyfikacja to możliwość sortowania artefaktów w grupy, takie jak proste kategorie lub taksonomie.

  • Wizualizacja i prezentacja – analiza plików obejmuje funkcje wizualizacji, które zapewniają szerokie możliwości manipulacji graficznej. Możliwość drążenia do szczegółowego poziomu i graficznego przedstawiania relacji jest kluczowa. Najbardziej efektywne produkty będą miały więcej grafiki i mniej list podczas pracy z plikami.

  • Raportowanie – raporty z klasyfikatora zawierają szczegółowe informacje o treści, takie jak właściciel, temat i wiek, w oparciu o metadane i/lub indeksowanie pełnotekstowe.

Biorąc pod uwagę powyższe punkty, jeżeli klasyfikacja jest przedsięwzięciem prowadzonym przez dział bezpieczeństwa, warto zastanowić się kto jeszcze skorzysta na jej wdrożeniu. Właśnie ze względu na zwiększone możliwości analityczne – wasi data scientists i analitycy mogą być niezrównanymi sojusznikami!



Powiązane artykuły

Nasz serwis używa plików cookies w celach statystycznych, reklamowych oraz funkcjonalnych. Dzięki nim możemy indywidualnie dostosować ofertę do Twoich potrzeb. Każdy może zaakceptować pliki cookies albo ma możliwość wyłączenia ich w przeglądarce, dzięki czemu nie będą zbierane żadne informacje.