Autor: Marko Sorec
Godine 2021. se u svijetu svakog dana na internetu generiralo 2,5 kvintiliona bajta podataka. To je broj koji mnogi ne mogu niti zamisliti (2,5 i 18 nula). Internet je ogroman prostor kojeg je teško vizualizirati. Svojevremeno smo bili svjedoci osobnim računarima s izuzetno malim tvrdim diskovima, njihov je brzi razvoj doprineo smanjenju njihove veličine, koja se, s duge strane, značajno povećala. Danas možemo pratiti brze “flash” podatkovne jedinice koje imaju vrlo priručnu veličinu (malehnost) i dovoljno velike kapacitete (128 GB i više). Nalazimo ih u mobilnim napravama, tablet i prenosivim računarima. U moćnijim modelima računara nisu rijetkost ni diskovi kapaciteta od 4 TB. Kao korisnici naprava svakodnevno produciramo ogromne količine podataka što prate mašinske mogućnosti. Govorimo o produciranju fotografija, podataka, o pretraživanju videosnimaka, o nalaganju miliona aplikacija i igara. Naše naprave prenose ogromno mnogo podataka u oblak pripadajućim ponuđačima (Google, Apple, Microsoft…), radi pohranjivanja, analitike za obezbjeđivanje boljeg korisničkog iskustva i boljeg povezivanja s drugim ljudima.
Ekonomska održivost pohranjivanja podataka i arhiva
Poduzeća koja su, posredno ili neposredno, obavezna pikupljati, skladištiti i obrađivati podatke, moraju stalno pratiti trend rasta akumuliranja podataka. Trend, naravno, nije linearan, već je, matematički gledano, potencijalno rastući. Porastom broja korisnika raste i tip podataka kao i njihova frekventnost. Zamislimo na trenutak da 1000 ljui producira 1000 GB podataka u pet aplikacija za mjesec dana. Zatim, nešto kasnije, zamislimo da je 2000 ljudi iz 15 aplikacija proizvelo 5000 GB podataka. Više je nego očito da trend oštro raste i da se neće zaustaviti. Podatci predstavljaju zlato informatičkog doba. Velike količine neobrađenih podataka (big data, raw data) leže u tzv. podatkovnim jezerima. Riječ je o podatkovnim bazama i sistemima podatkovnih baza koji su sposobni obraditi velike količine podataka i učiniti ih razumljivijim korisnicima. Obrađeni (procesuirani) podatci su po prirodi najčešće oplemenjeni sirovi podatci koji određenoj skupini ljudi, bilo da su to ciljni kupci, istraživači, vladine organizacije ili korporacije, daju upotrebnu vrijednost. Kada govorimo o ekonomskoj održivosti, govorimo o tome šta mora poduzeće investirati u smislu mašinske i programske opreme, zaposlenih, vremena i stručnog “know-howa” da bi produciralo dovoljno primjerene i vrijedne podatke s kojima, u ekonomskom smislu, pokriva svoju investiciju. Na prvi pogled sistem je možda vrlo sličan osnovnom poslovnom konceptu, ali ne zaboravimo da je porastom troškova ugrožena ekonomska održivost.
Pogled u podatkovni centar Press Clippinga
Glavni tip podataka u Press Clippingu, iz kojeg izlaze gotovo svi aktuelni produkti, jeste medijska objava. Press Clipping prikuplja medijske objave još od 1994., a digitalni arhiv postoji od 2007. Za svoj opstanak on mora obezbjeđivati realnu vremensku podršku informacijskom sistemu, redovno povećavanje podatkovnih kapaciteta, praćenje modernih podatkovnih tehnologija i programske opreme, kao i agilnost u prilagođavanju tržištu jer se ono munjevito brzo mijenja. Različitim klijentima podatci znače različite stvari pa su zato i pilagođavanja do neke mjere svakodnevni posao. Radi se o različitim vrstama dostave oplemenjenih podataka, različitim analizama na osnovu podataka, mogućnostima pristupanja arhivskim podatcima itd. Potrebno je budnim očima obezbjeđivati da svi informacijski sistemi djeluju bez poteškoća jer se na tom području ne može stagnirati obzirom da količina podataka strmo raste. Ako smo svojevremeno na internetu prikazivali 10 objava na dan, danas ih može biti i 500.
Šta donosi skora budućnost?
Trenutni trend govori da će u skoroj budućnosti prirast podataka biti još veći. Sistemi imaju sve veće mogućnosti, srazmjerno tome predstavljaju veće nabavne i operativne troškove. Ipak, istovremeno mogu čuvati i obrađivati velike količine podataka. Očekivati je, dakle, rast na svim područjima što će omogućavati i dalje kvalitetne proizvode na području podataka. Kažu da su podatci danas ono što je svojevremeno bila nafta. Neki ljudi ih poistovjećuju čak i sa zlatom. Postoji i siguran zaključak da bi poduzeća mogla svojim klijentima obezbjeđivati ažuran, kvalitetan i agilan proizvod. To mora pratiti razvoj podatkovnih sistema, nadgradnje postojećih i budno oko nad procesima te mogućnost agilnog prilagođavanja tržištu.
Uloga Press Clippinga u cijeloj priči
Press Clipping je trenutno voeći na području skladištenja podataka za svoje klijente, što se u svakom trenutku odražava u dostupnosti multimedijalnih i tekstualnih podataka. Ovome možemo pribrojati i arhivske podatke koji predstavljaju najveći dio ukupnog podatkovnog skladišta. Dodana vrijednost za klijenta je da na raspolaganju ima svoje podatke bez dodatnih troškova. Svo vijeme strijemimo ka tome da je samo skladištenje podataka objedinjeno sa kompletnom uslugom koju nudimo na dnevnom nivou. Najbolji proizvodi najčešće klijenta ne opterećuju tehnikalijama, pozadinom i razvojem, već im nude uslugu koja djeluje, odnosno služi svojoj svrsi. Često put do toga nije sasvim razumljiv i vidljiv, mada se radi o ciklusu svakodnevnog odžavanja i poboljšanja. Najčešće se vidi samo vrh ledenog brijega, sve ostalo je skriveno od očiju. Tako klijent dobija uslugu ne mareći o procesima koji se odvijaju u pozadini. Najbolji proizvodi obično imaju vrlo jednostavne komponente. Vidljiv dio često prekriva vrlo kompleksan komplet funkcija i procesa koji leži ispod njih i omogućava ih. Tako u Press Clippingu smatramo da je naša najveća vrijednost upravo u tome da dovedemo podatke do klijenta i držimo ih na tom nivou nastojeći da se proces odvija bez grešaka i komplikacija. Težimo, takođe, jednostavnim rješenjima, finalnim proizvodima, analizama i svemu što predstavlja dodanu vrijednost u sadašnjosti i što će je, zasigurno, predstavljati i u budućnosti.
Trend u 2022. godini
Press Clipping će u 2022. godini nastaviti sa osavremenjivanjem i prilagođavanjem svog podatkovnog skladišta te sa razvojem modernih algoritama. Prije svega, mnogo se bavimo prirodnim prepoznavanjem tekstova, što nam omogućava da podatke oplemenimo do tačke gdje je to ručno nemoguće napraviti u toj količini i zato predstavlja ogromnu dodanu vrijednost. I dalje ćemo se baviti korisničkim iskustvima koja će klijentima predstavljati vrata u svijet prilagođenog praćenja medijskih objava, njihove analize i pregled novorođenih podataka. Svo vrijeme Press Clipping se bavi optimizacijom podatkovnog skladišta i djelovanjem mreža, pokušavajući da osigura najkraće moguće vrijeme opažanja novih objava. Veliki dio se odnosi i na interaktivnost društvenih medija i njihovo praćenje. Uvijek iznova rješavamo izazove, tražimo nove mogućnosti i bdijemo nad medijskim prostorom bilo da je to sadržaj novinara, ili medijskih kuća, ili samo sadržaj pojedinaca i influensera.