Meetodid suurte andmemahtude töötlemiseks. Kuidas Big Data tehnoloogiad aitavad linnadel areneda

Ainult laisk ei räägi Big datast, aga vaevalt saab ta aru, mis see on ja kuidas see töötab. Alustame kõige lihtsamast – terminoloogiast. Vene keeles öeldes on suurandmed erinevad tööriistad, lähenemisviisid ja meetodid nii struktureeritud kui ka struktureerimata andmete töötlemiseks, et neid konkreetsete ülesannete ja eesmärkide jaoks kasutada.

Struktureerimata andmed on teave, millel ei ole etteantud struktuuri või mis ei ole korraldatud kindlas järjekorras.

Mõiste "suured andmed" võttis kasutusele Nature'i toimetaja Clifford Lynch juba 2008. aastal erinumbris, mis käsitles maailma teabemahtude plahvatuslikku kasvu. Kuigi suurandmed ise olid muidugi varem olemas. Ekspertide hinnangul kuulub suurem osa andmevoogudest üle 100 GB päevas Big data kategooriasse.

Loe ka:

Tänapäeval peidab see lihtne termin ainult kahte sõna – andmete salvestamine ja töötlemine.

Suured andmed – lihtsate sõnadega

Kaasaegses maailmas on suurandmed sotsiaal-majanduslik nähtus, mida seostatakse sellega, et tohutu hulga andmemahtude analüüsimiseks on tekkinud uued tehnoloogilised võimalused.

Loe ka:

Arusaadavuse hõlbustamiseks kujutage ette supermarketit, kus kõik kaubad pole teie harjumuspärases järjekorras. Leib puuviljade kõrvale, tomatipasta külmutatud pitsa kõrvale, süütevedelik tampoonide riiuli kõrvale, millel on muu hulgas avokaadod, tofu või shiitake seened. Big data paneb kõik oma kohale ja aitab leida pähklipiima, teada saada maksumuse ja aegumiskuupäeva ning ka seda, kes peale sinu sellist piima ostab ja kuidas on parem kui piim lehm.

Kenneth Cookier: suured andmed on paremad andmed

Suurandmete tehnoloogia

Töödeldakse tohutul hulgal andmeid, et inimene saaks konkreetseid ja vajalikke tulemusi nende edasiseks efektiivseks rakendamiseks.

Loe ka:

Tegelikult on suurandmed probleemide lahendaja ja alternatiiv traditsioonilistele andmehaldussüsteemidele.

McKinsey järgi suurandmetele rakendatavad analüüsimeetodid ja meetodid:

rahvahulga hankimine;

Segamine ja andmete integreerimine;

Masinõpe;

Kunstlikud närvivõrgud;

Mustri tuvastamine;

Ennustav analüütika;

simulatsiooni modelleerimine;

Ruumianalüüs;

Statistiline analüüs;
Analüütiliste andmete visualiseerimine.

Andmetöötlust võimaldav horisontaalne skaleeritavus on suurandmete töötlemise aluspõhimõte. Andmed jaotatakse andmetöötlussõlmedesse ja töötlemine toimub ilma jõudluse halvenemiseta. McKinsey hõlmas rakendatavuse kontekstis ka relatsioonihaldussüsteeme ja ärianalüüsi.

Tehnoloogia:

NoSQL;
MapReduce;
Hadoop;
Riistvaralahendused.

Loe ka:

Suurandmete jaoks on traditsioonilised defineerivad omadused, mille Meta Group töötas välja juba 2001. aastal ja mida nimetatakse " Kolm V»:

Helitugevus- füüsilise mahu väärtus.
Kiirus- kasvutempo ja kiire andmetöötluse vajadus tulemuste saamiseks.
Mitmekesisus- võimalus töödelda samaaegselt erinevat tüüpi andmeid.

Suurandmed: rakendus ja võimalused

Heterogeense ja kiiresti saabuva digitaalse teabe mahtu ei ole võimalik traditsiooniliste vahenditega töödelda. Andmete analüüs ise võimaldab näha teatud ja hoomamatuid mustreid, mida inimene ei näe. See võimaldab meil optimeerida kõiki oma eluvaldkondi – alates avalikust haldusest kuni tootmise ja telekommunikatsioonini.

Näiteks mõned ettevõtted kaitsesid paar aastat tagasi oma kliente pettuste eest ja kliendi raha eest hoolitsemine on oma raha eest hoolitsemine.

Susan Atliger: Aga suurandmed?

Suurandmetel põhinevad lahendused: Sberbank, Beeline ja teised ettevõtted

Beeline'il on abonentide kohta tohutul hulgal andmeid, mida nad kasutavad mitte ainult nendega töötamiseks, vaid ka analüütiliste toodete loomiseks, näiteks väliskonsultatsiooniks või IPTV analüüsiks. Beeline segmenteeris andmebaasi ja kaitses kliente rahapettuste ja viiruste eest, kasutades talletamiseks HDFS-i ja Apache Sparki ning andmetöötluseks Rapidminerit ja Pythonit.

Loe ka:

Või meenutage Sberbanki nende vana korpusega AS SAFI. See on süsteem, mis analüüsib fotosid, et tuvastada pangakliente ja vältida pettusi. Süsteem võeti kasutusele juba 2014. aastal, süsteem põhineb andmebaasis olevate fotode võrdlemisel, mis tänu arvutinägemisele jõuavad raamidel olevatest veebikaameratest. Süsteemi aluseks on biomeetriline platvorm. Tänu sellele vähenesid pettuste juhtumid 10 korda.

Suured andmed maailmas

Aastaks 2020 moodustab inimkond prognooside kohaselt 40-44 zetabaiti informatsiooni. Ja aastaks 2025 kasvab see 10 korda, selgub IDC analüütikute koostatud aruandest The Data Age 2025. Aruandes märgitakse, et suurema osa andmetest loovad ettevõtted ise, mitte tavatarbijad.

Uuringu analüütikud usuvad, et andmetest saab elutähtis vara ja turvalisusest saab elu kriitiline alus. Samuti on töö autorid kindlad, et tehnoloogia muudab majandusmaastikku ning tavakasutaja suhtleb ühendatud seadmetega umbes 4800 korda päevas.

Suur andmeturg Venemaal

Tavaliselt pärinevad suurandmed kolmest allikast:

Internet (sotsiaalvõrgustikud, foorumid, ajaveebid, meedia ja muud saidid);
Ettevõtte dokumentide arhiivid;
Andurite, instrumentide ja muude seadmete näidud.

Suured andmed pankades

Lisaks ülalkirjeldatud süsteemile Sberbanki strateegias aastateks 2014-2018. räägib super-andmekogumite analüüsimise tähtsusest kvaliteetse klienditeeninduse, riskijuhtimise ja kulude optimeerimise jaoks. Pank kasutab nüüd Big Datat riskide maandamiseks, pettuste vastu võitlemiseks, klientide krediidivõimelisuse segmenteerimiseks ja hindamiseks, personali juhtimiseks, kontorijärjekordade ennustamiseks, töötajate preemiate arvutamiseks ja muudeks ülesanneteks.

VTB24 kasutab suurandmeid, et segmenteerida ja hallata klientide vähenemist, koostada finantsaruandeid ning analüüsida tagasisidet sotsiaalvõrgustikes ja foorumites. Selleks kasutab ta Teradata, SAS Visual Analytics ja SAS Marketing Optimizer lahendusi.

Andmete kasvu pidev kiirenemine on tänapäevase tegelikkuse lahutamatu osa. Sotsiaalvõrgustikud, mobiilseadmed, mõõteseadmete andmed, äriteave on vaid mõned allikatest, mis võivad genereerida tohutul hulgal andmeid.

Praegu termin Suured andmed(Big data) on muutunud üsna tavaliseks. Mitte igaüks ei tea veel, kui kiiresti ja sügavalt suurte andmemahtude töötlemise tehnoloogiad muudavad ühiskonna kõige erinevamaid aspekte. Erinevates valdkondades toimuvad muutused, mis toovad kaasa uusi probleeme ja väljakutseid, sealhulgas infoturbe vallas, kus esiplaanil peaksid olema sellised olulised aspektid nagu konfidentsiaalsus, terviklikkus, käideldavus jne.

Kahjuks kasutavad paljud kaasaegsed ettevõtted Big Data tehnoloogiat, loomata selleks sobivat infrastruktuuri, mis tagaks nende kogutavate ja salvestatud tohutute andmemahtude usaldusväärse salvestamise. Teisest küljest areneb praegu kiiresti plokiahela tehnoloogia, mis on mõeldud selle ja paljude muude probleemide lahendamiseks.

Mis on suurandmed?

Tegelikult peitub mõiste definitsioon pinnal: "suured andmed" tähendab väga suurte andmemahtude haldamist, aga ka nende analüüsi. Kui vaadata laiemalt, siis see on info, mida selle suurte mahtude tõttu pole võimalik klassikaliste meetoditega töödelda.

Termin Big Data ise (suured andmed) ilmus suhteliselt hiljuti. Google Trendsi teenuse andmetel langeb termini populaarsuse aktiivne kasv 2011. aasta lõppu:

2010. aastal hakkasid ilmuma esimesed tooted ja lahendused, mis on otseselt seotud suurandmete töötlemisega. Aastaks 2011 kasutab enamik suurimaid IT-ettevõtteid, sealhulgas IBM, Oracle, Microsoft ja Hewlett-Packard, oma äristrateegiates aktiivselt mõistet Big Data. Järk-järgult alustavad infotehnoloogia turuanalüütikud selle kontseptsiooni aktiivset uurimist.

Praegu on see termin saavutanud märkimisväärse populaarsuse ja seda kasutatakse aktiivselt erinevates valdkondades. Siiski ei saa kindlalt väita, et Big Data on mingi põhimõtteliselt uus nähtus – vastupidi, suured andmeallikad on eksisteerinud juba aastaid. Turunduses võivad need olla andmebaasid klientide ostude, krediidiajaloo, elustiili ja muu kohta.Analüütikud on aastate jooksul nende andmete abil aidanud ettevõtetel prognoosida tulevasi klientide vajadusi, hinnata riske, kujundada tarbijate eelistusi jne.

Praegu on olukord muutunud kahes aspektis:

— erinevate andmekogumite analüüsimiseks ja võrdlemiseks on tekkinud keerukamad vahendid ja meetodid;
— Analüüsivahendeid on täiendatud paljude uute andmeallikatega, mille põhjuseks on laialdane digiteerimine, samuti uued andmete kogumise ja mõõtmise meetodid.

Teadlased ennustavad, et Big Data tehnoloogiaid hakatakse kõige aktiivsemalt kasutama tootmises, tervishoius, kaubanduses, avalikus halduses ning teistes väga erinevates valdkondades ja tööstusharudes.

Suurandmed ei ole konkreetne andmete massiiv, vaid meetodite kogum nende töötlemiseks. Suurandmete määravaks tunnuseks pole mitte ainult nende maht, vaid ka muud kategooriad, mis iseloomustavad andmetöötluse ja -analüüsi töömahukaid protsesse.

Töötlemise algandmed võivad olla näiteks:

— Interneti-kasutajate käitumislogid;
— asjade Internet;
- sotsiaalmeedia;
— meteoroloogilised andmed;
— suurimate raamatukogude digiteeritud raamatud;
– sõidukite GPS-signaalid;
— teave pangaklientide tehingute kohta;
— andmed mobiilsidevõrkude abonentide asukoha kohta;
— info ostude kohta suurtes jaekettides jne.

Aja jooksul andmete hulk ja nende allikate hulk pidevalt kasvab ning selle taustal tekivad uued infotöötlusmeetodid ning täiustatakse olemasolevaid infotöötluse meetodeid.

Suurandmete põhiprintsiibid:

- Horisontaalne skaleeritavus – andmemassiivid võivad olla tohutud ja see tähendab, et suur andmetöötlussüsteem peab nende mahtude kasvades dünaamiliselt laienema.
- Veataluvus – isegi kui mõni seade peaks rikki minema, peab kogu süsteem töötama jääma.
— Andmete asukoht. Suurtes hajutatud süsteemides jaotatakse andmed tavaliselt suure hulga masinate vahel. Kuid võimalusel ja ressursside säästmiseks töödeldakse andmeid sageli samas serveris, kus neid hoitakse.

Kõigi kolme põhimõtte stabiilseks toimimiseks ja vastavalt ka suurandmete salvestamise ja töötlemise kõrge efektiivsuse tagamiseks on vaja uusi läbimurdelisi tehnoloogiaid, nagu näiteks plokiahel.

Milleks on suurandmed?

Suurandmete ulatus laieneb pidevalt:

— Suurandmeid saab kasutada meditsiinis. Seega on võimalik patsiendile diagnoosi panna mitte ainult haigusloo analüüsi andmete põhjal, vaid võttes arvesse ka teiste arstide kogemusi, teavet patsiendi elukoha ökoloogilise olukorra kohta. ja palju muid tegureid.
— Suurandmete tehnoloogiate abil saab korraldada mehitamata sõidukite liikumist.
— Suurte andmemahtude töötlemisel on võimalik foto- ja videomaterjalides nägusid ära tunda.
- Big Data tehnoloogiaid saavad kasutada jaemüüjad – kaubandusettevõtted saavad aktiivselt kasutada sotsiaalvõrgustike andmemassiivisid, et tõhusalt seadistada oma reklaamikampaaniaid, mida saab maksimaalselt keskenduda konkreetsele tarbijasegmendile.
— Seda tehnoloogiat kasutatakse aktiivselt valimiskampaaniate korraldamisel, sealhulgas ühiskonna poliitiliste eelistuste analüüsimisel.
— Suurandmete tehnoloogiate kasutamine on asjakohane tulukindlustuse (RA) klassi lahenduste jaoks, mis hõlmavad tööriistu ebakõlade tuvastamiseks ja põhjalikku andmeanalüüsi, mis võimaldavad õigeaegselt tuvastada tõenäolised kahjud või teabe moonutused, mis võivad viia finantstulemuste languseni. .
— telekommunikatsiooniteenuse pakkujad saavad koondada suurandmeid, sealhulgas geograafilise asukoha andmeid; see teave võib omakorda pakkuda ärilist huvi reklaamiagentuuridele, kes võivad seda kasutada suunatud ja kohaliku reklaami kuvamiseks, aga ka jaemüüjatele ja pankadele.
"Suurandmetel võib olla oluline roll otsustamisel, kas avada jaemüügipunkt konkreetses asukohas, tuginedes andmetele võimsa sihitud inimeste voo olemasolu kohta.

Seega peitub Big Data tehnoloogia kõige ilmsem praktiline rakendus turunduse valdkonnas. Tänu Interneti arengule ja kõikvõimalike sidevahendite levikule muutuvad käitumisandmed (nagu kõnede arv, ostuharjumused ja ostud) reaalajas kättesaadavaks.

Suurandmete tehnoloogiaid saab tõhusalt kasutada ka rahanduses, sotsioloogilistes uuringutes ja paljudes muudes valdkondades. Eksperdid väidavad, et kõik need suurandmete kasutamise võimalused on vaid jäämäe nähtav osa, kuna neid tehnoloogiaid kasutatakse luure- ja vastuluures, sõjanduses, aga ka kõiges, mida tavaliselt nimetatakse infosõjaks. .

IN üldiselt Suurandmetega töötamise järjekord koosneb andmete kogumisest, saadud teabe struktureerimisest aruannete ja armatuurlaudade abil ning seejärel tegevussoovituste sõnastamisest.

Vaatleme lühidalt Big Data tehnoloogiate kasutamise võimalusi turunduses. Teatavasti on turundaja jaoks informatsioon peamine prognoosimise ja strateegia koostamise tööriist. Suurandmete analüüsi on pikka aega edukalt kasutatud tarbijate sihtrühma, huvide, nõudluse ja aktiivsuse määramiseks. Eelkõige võimaldab suurandmete analüüs kuvada reklaame (RTB oksjonimudeli alusel – Real Time Bidding) ainult neile tarbijatele, kes on tootest või teenusest huvitatud.

Suurandmete kasutamine turunduses võimaldab ärimeestel:

- tunnetage oma tarbijaid paremini ära, meelitage ligi sarnast vaatajaskonda Internetis;
- hinnata klientide rahulolu taset;
— mõista, kas pakutav teenus vastab ootustele ja vajadustele;
- leida ja rakendada uusi viise klientide usalduse suurendamiseks;
— luua projekte, mille järele on nõudlust jne.

Näiteks teenus Google.trends võib turundajale öelda konkreetse toote hooajalise nõudluse aktiivsuse, kõikumiste ja klikkide geograafia prognoosi. Kui võrrelda seda teavet oma saidil vastava pistikprogrammi kogutud statistikaga, saate koostada reklaamieelarve jaotamise plaani, näidates ära kuu, piirkonna ja muud parameetrid.

Paljude teadlaste arvates peitub Trumpi kampaania edu just Big Data segmenteerimises ja kasutamises. USA tulevase presidendi meeskond suutis publiku õigesti jagada, mõista selle soove ja näidata täpselt seda sõnumit, mida valijad tahavad näha ja kuulda. Nii et Irina Belõševa Data-Centric Alliance’ist arvab Trumpi võidu suuresti ebastandardne lähenemine internetiturundusele, mis põhines suurandmetel, psühho-käitumuslikul analüüsil ja personaliseeritud reklaamil.

Trumpi poliittehnoloogid ja turundajad kasutasid spetsiaalselt väljatöötatud matemaatilist mudelit, mis võimaldas kõigi USA valijate andmeid süvitsi analüüsida ja süstematiseerida, muutes ülitäpse sihtimise mitte ainult geograafiliste tunnuste, vaid ka valijate kavatsuste, huvide, Nende psühhotüüp, käitumisomadused jne. Pärast Selleks on turundajad korraldanud iga kodanikurühmaga isikupärastatud suhtluse nende vajaduste, meeleolu, poliitiliste vaadete, psühholoogiliste omaduste ja isegi nahavärvi alusel, kasutades peaaegu iga inimese jaoks oma sõnumit üksikvalija.

Mis puutub Hillary Clintoni, siis ta kasutas oma kampaanias sotsioloogilistel andmetel ja standardsel turundusel põhinevaid "ajaproovitud" meetodeid, jagades valijad ainult formaalselt homogeensetesse rühmadesse (mehed, naised, afroameeriklased, hispaanlased, vaesed, rikkad jne).

Selle tulemusena võitis see, kes hindas uute tehnoloogiate ja analüüsimeetodite potentsiaali. Eelkõige olid Hillary Clintoni kampaaniakulud kaks korda suuremad kui tema vastasel:

Andmed: Pew Research

Big Data kasutamise peamised probleemid

Lisaks kallile hinnale on üks peamisi suurandmete juurutamist erinevates valdkondades takistavaid tegureid töödeldavate andmete valiku probleem ehk kindlaks teha, milliseid andmeid on vaja välja tõmmata, salvestada ja analüüsida ning milliseid. ei tohiks arvestada.

Teine suurandmete probleem on eetiline. Teisisõnu tekib loomulik küsimus: kas sellist andmete kogumist (eriti ilma kasutaja teadmata) võib pidada privaatsuspiiride rikkumiseks?

Pole saladus, et Google'i ja Yandexi otsingumootoritesse salvestatud teave võimaldab IT-hiiglastel oma teenuseid pidevalt täiustada, muuta need kasutajasõbralikuks ja luua uusi interaktiivseid rakendusi. Selleks koguvad otsingumootorid kasutajaandmeid kasutajate tegevuse kohta Internetis, IP-aadresse, geograafilise asukoha andmeid, huvisid ja veebioste, isikuandmeid, meilisõnumeid jne. Kõik see võimaldab kuvada kontekstuaalset reklaami vastavalt kasutaja käitumisele Internetis. Samas ei küsita selleks enamasti kasutajate nõusolekut ning ei anta valikut, millist teavet enda kohta esitada. See tähendab, et vaikimisi kogutakse kõik suurandmetesse, mis seejärel salvestatakse saitide andmeserveritesse.

Sellest tuleneb järgmine oluline küsimus andmete säilitamise ja kasutamise turvalisuse kohta. Kas näiteks analüüsiplatvorm, millega tarbijad jagavad automaatselt oma andmeid, on turvaline? Lisaks märgivad paljud ettevõtete esindajad kõrgelt kvalifitseeritud analüütikute ja turundajate puudust, kes suudavad tõhusalt opereerida suurte andmemahtudega ja lahendada nende abiga konkreetseid äriprobleeme.

Vaatamata kõikidele raskustele Big Data juurutamisel, kavatseb ettevõte sellesse valdkonda investeeringuid suurendada. Gartneri uuringu kohaselt on suurandmetesse investeerivate tööstusharude juhid meedia-, jaekaubandus-, telekomi-, pangandus- ja teenindusettevõtted.

Plokiahela tehnoloogiate ja suurandmete interaktsiooni väljavaated

Suurandmetega integreerimisel on sünergiline mõju ja see avab ettevõtetele palju uusi võimalusi, sealhulgas võimaldab:

— pääsete ligi üksikasjalikule teabele tarbijate eelistuste kohta, mille põhjal saate koostada üksikasjalikud analüütilised profiilid konkreetsete tarnijate, toodete ja tootekomponentide kohta;
- integreerida üksikasjalikud andmed tehingute kohta ja statistika teatud kaubarühmade tarbimise kohta erinevate kasutajakategooriate kaupa;
- hankida üksikasjalikke analüütilisi andmeid tarne- ja tarbimisahelate kohta, kontrollida toote kadusid transportimisel (näiteks teatud tüüpi kaupade kahanemisest ja aurustumisest tingitud kaalukaotus);
– võidelda võltsitud toodete vastu, suurendada rahapesu- ja pettustevastase võitluse tõhusust jne.

Juurdepääs üksikasjalikele andmetele kaupade kasutamise ja tarbimise kohta avab suures osas Big Data tehnoloogia potentsiaali peamiste äriprotsesside optimeerimisel, vähendab regulatiivseid riske ning avab uusi võimalusi raha teenimiseks ja praegustele tarbijaeelistustele kõige paremini vastavate toodete loomiseks.

Teatavasti näitavad suurimate finantsasutuste esindajad juba praegu märkimisväärset huvi plokiahela tehnoloogia vastu, sh jne. Šveitsi finantsholdingu UBS IT-juhi Oliver Bussmanni sõnul võib plokiahela tehnoloogia „vähendada tehingute töötlemise aega mitmelt päevalt mitmele. minutit”.

Plokiahela analüüsi potentsiaal Big Data tehnoloogia abil on tohutu. Hajutatud registritehnoloogia tagab teabe terviklikkuse ning kogu tehinguajaloo usaldusväärse ja läbipaistva salvestamise. Big Data annab omakorda uusi tööriistu efektiivseks analüüsiks, prognoosimiseks, majanduse modelleerimiseks ning vastavalt sellele avab uusi võimalusi teadlikumate juhtimisotsuste tegemiseks.

Plokiahela ja suurandmete tandemit saab tervishoius edukalt kasutada. Teatavasti suurendavad ebatäiuslikud ja mittetäielikud andmed patsiendi tervise kohta kohati vale diagnoosi ja valesti määratud ravi ohtu. Kriitilised andmed raviasutuste klientide tervise kohta peaksid olema võimalikult turvalised, muutumatuse omadustega, kontrollitavad ja mitte mingil juhul manipuleeritavad.

Plokiahelas olev teave vastab kõigile ülaltoodud nõuetele ning võib olla kvaliteetsete ja usaldusväärsete lähteandmetena süvaanalüüsiks, kasutades uusi suurandmete tehnoloogiaid. Lisaks saaksid raviasutused plokiahelat kasutades vahetada usaldusväärseid andmeid kindlustusseltside, justiitsasutuste, tööandjate, akadeemiliste asutuste ja muude meditsiiniinfot vajavate organisatsioonidega.

Suurandmed ja infoturve

Laiemas tähenduses on infoturve teabe ja seda toetava infrastruktuuri kaitsmine juhuslike või tahtlike looduslike või tehislike negatiivsete mõjude eest.

Infoturbe valdkonnas seisavad Big Data ees järgmised väljakutsed:

— andmekaitse ja nende terviklikkuse tagamise probleemid;
— välise sekkumise ja konfidentsiaalse teabe lekkimise oht;
— konfidentsiaalse teabe ebaõige säilitamine;
- teabe kadumise oht, näiteks kellegi pahatahtliku tegevuse tõttu;
— isikuandmete väärkasutamise oht kolmandate isikute poolt jne.

Üks peamisi suurandmete probleeme, mille lahendamiseks plokiahel on loodud, peitub infoturbe valdkonnas. Kõigi oma põhiprintsiipide järgimise tagamisel saab hajutatud pearaamatu tehnoloogia garanteerida andmete terviklikkuse ja usaldusväärsuse ning tänu ühe tõrkepunkti puudumisele muudab plokiahel infosüsteemid stabiilseks. Hajutatud pearaamatutehnoloogia võib aidata lahendada andmete usalduse probleemi, samuti annab võimaluse universaalseks andmevahetuseks.

Info on väärtuslik vara, mis tähendab, et infoturbe põhiaspektid peaksid olema esikohal. Konkurentsis ellujäämiseks peavad ettevõtted ajaga kaasas käima, mis tähendab, et nad ei saa eirata potentsiaalseid võimalusi ja eeliseid, mida plokiahela tehnoloogia ja Big Data tööriistad sisaldavad.

HSE õpetajate veerg suurandmetega töötamise müütidest ja juhtumitest

Järjehoidjate juurde

HSE School of New Media õppejõud Konstantin Romanov ja Aleksander Pjatigorski, kes on ka Beeline'i digitaalse transformatsiooni direktor, kirjutasid saidile veeru peamistest väärarusaamadest suurandmete kohta – näiteid tehnoloogia kasutamisest ja tööriistadest. Autorid soovitavad, et väljaanne aitab ettevõtete juhtidel seda kontseptsiooni mõista.

Müüdid ja väärarusaamad suurandmete kohta

Big Data ei ole turundus

Suurandmete mõiste on muutunud väga moekaks – seda kasutatakse miljonites olukordades ja sadades erinevates tõlgendustes, mis sageli ei ole seotud sellega, mis see on. Tihtipeale toimub inimeste teadvuses mõistete asendamine ja Big Data aetakse segamini turundustootega. Lisaks on Big Data mõnes ettevõttes turundusdivisjoni osa. Suurandmete analüüsi tulemus võib tõepoolest olla turundustegevuse allikas, aga ei midagi enamat. Vaatame, kuidas see toimib.

Kui tuvastasime nimekirja nendest, kes ostsid meie poest kaks kuud tagasi rohkem kui kolme tuhande rubla väärtuses kaupu ja saatsime seejärel neile kasutajatele mingisuguse pakkumise, siis on see tüüpiline turundus. Tuletame struktuuriandmete põhjal selge mustri ja kasutame seda müügi suurendamiseks.

Kui aga kombineerida CRM-i andmed voogedastusinfoga näiteks Instagramist ja seda analüüsida, leiame mustri: inimene, kes on kolmapäeva õhtul aktiivsust vähendanud ja kelle viimasel fotol on kassipojad, peaks tegema kindla pakkumise. Sellest saab juba Big Data. Leidsime päästiku, andsime selle turundajatele ja nad kasutasid seda oma eesmärkidel.

Siit järeldub, et tehnoloogia töötab enamasti struktureerimata andmetega ja kui andmed on struktureeritud, jätkab süsteem nendes peidetud mustrite otsimist, mida turundus ei tee.

Big Data ei ole IT

Selle loo teine äärmus: Big Data aetakse sageli segi IT-ga. See on tingitud asjaolust, et Venemaa ettevõtetes on IT-spetsialistid reeglina kõigi tehnoloogiate, sealhulgas suurandmete eestvedajad. Seega, kui kõik selles osakonnas toimub, jätab see ettevõttele tervikuna mulje, et tegemist on mingi IT-tegevusega.

Tegelikult on siin põhimõtteline erinevus: Big Data on teatud toote hankimisele suunatud tegevus, mis IT-le üldse ei kehti, kuigi ilma nendeta tehnoloogia eksisteerida ei saa.

Big Data ei ole alati teabe kogumine ja analüüs

Big Data kohta on veel üks eksiarvamus. Igaüks mõistab, et see tehnoloogia on seotud suurte andmemahtudega, kuid see, milliseid andmeid silmas peetakse, pole alati selge. Igaüks saab teavet koguda ja kasutada, nüüd on see võimalik mitte ainult filmides, vaid ka igas, isegi väga väikeses ettevõttes. Küsimus on vaid selles, mida täpselt koguda ja kuidas seda enda huvides ära kasutada.

Kuid tuleb mõista, et suurandmete tehnoloogia ei ole absoluutselt igasuguse teabe kogumine ja analüüsimine. Näiteks kui kogute sotsiaalvõrgustikes andmeid konkreetse inimese kohta, siis see ei ole Big Data.

Mis on suurandmed tegelikult

Big Data koosneb kolmest elemendist:

andmed;
analüütika;
tehnoloogia.

Big Data ei ole ainult üks neist komponentidest, vaid kõigi kolme elemendi kombinatsioon. Sageli inimesed asendavad mõisteid: keegi arvab, et suurandmed on ainult andmed, keegi arvab, et see on tehnoloogia. Kuid tegelikult, hoolimata sellest, kui palju andmeid te kogute, ei saa te nendega midagi peale hakata ilma õige tehnoloogia ja analüütikata. Kui analüütika on hea, aga andmeid pole, on seda enam halb.

Kui me räägime andmetest, siis see pole ainult tekstid, vaid ka kõik Instagrami postitatud fotod ja üldiselt kõik, mida saab analüüsida ja erinevatel eesmärkidel ja ülesannetes kasutada. Teisisõnu viitavad andmed tohutule hulgale erinevate struktuuride sise- ja välisandmetele.

Vaja on ka analüüsi, sest Big Data ülesanne on mingid mustrid üles ehitada. See tähendab, et analüütika on varjatud sõltuvuste tuvastamine ning uute küsimuste ja vastuste otsimine kogu heterogeensete andmete mahu analüüsi põhjal. Veelgi enam, suurandmed tõstatavad küsimusi, mis nendest andmetest otseselt ei tulene.

Mis puudutab pilte, siis fakt, et postitasite endast sinise T-särgiga foto, ei ütle midagi. Kui aga kasutada fotot Big Data modelleerimiseks, siis võib selguda, et just nüüd tasuks laenu pakkuda, sest sinu sotsiaalses grupis viitab selline käitumine teatud nähtusele tegudes. Seetõttu ei ole "paljad" andmed ilma analüütikata, ilma varjatud ja mitteilmsete sõltuvuste paljastamiseta suurandmed.

Nii et meil on suured andmed. Nende hulk on tohutu. Meil on ka analüütik. Kuidas aga tagada, et nendest algandmetest sünniks konkreetne lahendus? Selleks vajame tehnoloogiaid, mis võimaldavad neid mitte ainult salvestada (ja see oli varem võimatu), vaid ka analüüsida.

Lihtsamalt öeldes, kui teil on palju andmeid, on teil vaja selliseid tehnoloogiaid nagu Hadoop, mis võimaldab salvestada kogu teabe esialgsel kujul hilisemaks analüüsiks. Sellised tehnoloogiad tekkisid Interneti-hiiglastes, kuna nad olid esimesed, kes seisid silmitsi suure hulga andmete salvestamise ja nende analüüsimise probleemiga hilisemaks monetiseerimiseks.

Lisaks optimeeritud ja odavate andmete salvestamise tööriistadele on vaja analüütilisi tööriistu ning kasutatava platvormi lisandmooduleid. Näiteks Hadoopi ümber on juba tekkinud terve ökosüsteem seotud projekte ja tehnoloogiaid. Siin on mõned neist:

Pig on deklaratiivne andmeanalüüsi keel.
Taru – andmete analüüs SQL-ile lähedase keele abil.
Oozie on Hadoopi töövoog.
Hbase - andmebaas (mitterelatsiooniline), Google Big Table analoog.
Mahout – masinõpe.
Sqoop - andmete edastamine RSDDB-st Hadoopi ja vastupidi.
Flume - palkide ülekandmine HDFS-i.
Zookeeper, MRUnit, Avro, Giraph, Ambari, Cassandra, HCatalog, Fuse-DFS ja nii edasi.

Kõik need tööriistad on kõigile tasuta kättesaadavad, kuid on ka hulk tasulisi lisandmooduleid.

Lisaks on vaja spetsialiste: see on arendaja ja analüütik (nn Data Scientist). Samuti on vaja juhti, kes mõistaks, kuidas seda analüütikat konkreetse ülesande puhul rakendada, sest iseenesest on see täiesti mõttetu, kui see pole äriprotsessidesse sisse ehitatud.

Kõik kolm töötajat peavad töötama meeskonnana. Juht, kes annab andmeteadlasele ülesande leida teatud muster, peab mõistma, et alati pole võimalik leida täpselt seda, mida ta vajab. Sel juhul peaks juht tähelepanelikult kuulama, mida andmeteadlane on leidnud, sest sageli osutuvad tema leiud äri jaoks huvitavamaks ja kasulikumaks. Sinu ülesanne on seda äris rakendada ja sellest toode teha.

Vaatamata sellele, et praegu on palju erinevaid masinaid ja tehnoloogiaid, jääb lõplik otsus alati inimese enda teha. Selleks tuleb info kuidagi visualiseerida. Selleks on üsna palju tööriistu.

Illustreerivaim näide on geoanalüütilised aruanded. Ettevõte Beeline teeb palju koostööd erinevate linnade ja piirkondade valitsustega. Väga sageli tellivad need organisatsioonid aruandeid, nagu "Liikluskoormus konkreetses asukohas".

Selge on see, et selline aruanne peaks riigiasutusteni jõudma lihtsal ja arusaadaval kujul. Kui pakume neile tohutu ja täiesti arusaamatu tabeli (st teavet sellisel kujul, nagu me selle saame), ei osta nad tõenäoliselt sellist aruannet - see on täiesti kasutu, nad ei saa sellest teadmisi. mida nad tahtsid saada.

Seega, hoolimata sellest, kui head andmeteadlased on ja milliseid mustreid nad leiavad, ei saa te nende andmetega töötada ilma kvaliteetsete visualiseerimistööriistadeta.

Andmeallikad

Vastuvõetud andmete massiiv on väga suur, nii et neid saab jagada mõneks rühmaks.

Ettevõtte siseandmed

Kuigi 80% kogutud andmetest kuulub sellesse rühma, ei kasutata seda allikat alati. Sageli on need andmed, mida keegi ei vaja, näiteks logid. Kui aga vaadata neid teise nurga alt, võib vahel leida neist ootamatuid mustreid.

Jagamisvara allikad

See hõlmab andmeid sotsiaalvõrgustikest, Internetist ja kõigest, millesse saab tasuta tungida. Miks jagamisvara? Ühest küljest on need andmed kõigile kättesaadavad, kuid kui tegemist on suurettevõttega, siis pole nende hankimine kümnete tuhandete, sadade või miljonite klientidega tellijabaasi suuruses enam lihtne ülesanne. Seetõttu on turul nende andmete edastamiseks tasulisi teenuseid.

Tasulised allikad

See hõlmab ettevõtteid, mis müüvad andmeid raha eest. Need võivad olla telekommunikatsioonid, DMP-d, Interneti-ettevõtted, krediidibürood ja koondajad. Venemaal telekomid andmeid ei müü. Esiteks on see majanduslikult kahjumlik, teiseks on see seadusega keelatud. Seetõttu müüvad nad oma töötlemise tulemusi, näiteks geoanalüütilisi aruandeid.

avatud andmed

Riik vastab ettevõtluse vajadustele ja võimaldab nende kogutud andmeid kasutada. Suuremal määral arendatakse seda läänes, kuid ka Venemaa käib selles osas ajaga kaasas. Näiteks on Moskva valitsuse avaandmete portaal, mis avaldab teavet linna infrastruktuuri erinevate objektide kohta.

Moskva elanike ja külaliste jaoks esitatakse andmed tabeli- ja kartograafilises vormis ning arendajatele spetsiaalsetes masinloetavates vormingutes. Kuigi projekt töötab piiratud režiimis, kuid see areneb, mis tähendab, et see on ka andmeallikas, mida saate oma äriülesannete jaoks kasutada.

Uurimine

Nagu juba märgitud, on Big Data ülesanne leida muster. Sageli võivad uuringud üle maailma saada pidepunktiks konkreetse mustri leidmisel – saad konkreetse tulemuse ja üritad sarnast loogikat oma eesmärkidele rakendada.

Suurandmed on valdkond, kus kõik matemaatika seadused ei tööta. Näiteks "1" + "1" ei ole "2", vaid palju rohkem, sest andmeallikate segamisel saab efekti oluliselt suurendada.

Tootenäited

Paljud inimesed tunnevad Spotify muusikavaliku teenust. Selle ilu seisneb selles, et see ei küsi kasutajatelt, milline on nende tänane tuju, vaid arvutab selle välja talle saadaolevate allikate põhjal. Ta teab alati, mida sa praegu vajad – džässi või hard rocki. See on peamine erinevus, mis pakub talle fänne ja eristab teda teistest teenustest.

Selliseid tooteid nimetatakse tavaliselt meeletoodeteks – need, mis tunnevad oma klienti.

Big Data tehnoloogiat kasutatakse ka autotööstuses. Näiteks Tesla teeb seda - nende uusim mudel seal on autopiloot. Ettevõte püüab luua autot, mis viiks reisija sinna, kuhu ta peab minema. Ilma Big Datata on see võimatu, sest kui me kasutame ainult neid andmeid, mida me otse saame, nagu inimene seda teeb, siis auto ei saa paremaks muutuda.

Kui sõidame ise autoga, kasutame oma neuroneid, et teha otsuseid paljude tegurite põhjal, mida me isegi ei märka. Näiteks ei pruugi me aru saada, miks otsustasime kohe rohelist tuld mitte põlema panna, ja siis selgub, et otsus oli õige – auto sõitis teist meeletu kiirusega mööda ja te vältisite õnnetust.

Võid tuua ka näite Big Data kasutamisest spordis. 2002. aastal otsustas Oakland Athleticsi pesapallimeeskonna peadirektor Billy Bean sportlaste otsimise paradigmat murda – ta valis ja treenis mängijaid "numbrite järgi".

Tavaliselt vaatavad juhid mängijate edu, kuid antud juhul oli see erinev - tulemuse saamiseks uuris juht, milliseid sportlaste kombinatsioone ta vajab, pöörates tähelepanu individuaalsetele omadustele. Veelgi enam, ta valis sportlased, kes iseenesest ei esindanud suurt potentsiaali, kuid meeskond tervikuna osutus nii edukaks, et võitsid kakskümmend matši järjest.

Seejärel tegi režissöör Bennett Miller sellele loole pühendatud filmi - "Mees, kes muutis kõike" Brad Pittiga peaosas.

Big Data tehnoloogia on kasulik ka finantssektoris. Mitte ükski inimene maailmas ei suuda iseseisvalt ja täpselt kindlaks teha, kas tasub kellelegi laenu anda. Otsuse langetamiseks tehakse punktiarvestus ehk ehitatakse tõenäosusmudel, mille järgi saab aru, kas see inimene tagastab raha või mitte. Lisaks rakendatakse punktiarvestust kõigil etappidel: saate näiteks arvutada, et teatud hetkel lõpetab inimene maksmise.

Suurandmed võimaldavad mitte ainult raha teenida, vaid ka neid säästa. Eelkõige aitas see tehnoloogia Saksamaa tööministeeriumil vähendada töötushüvitiste kulusid 10 miljardi euro võrra, kuna pärast teabe analüüsimist selgus, et 20% hüvitistest maksti teenimatult.

Tehnoloogiaid kasutatakse ka meditsiinis (see kehtib eriti Iisraeli kohta). Big Data abil saate teha palju täpsema analüüsi, kui seda suudab teha kolmekümneaastase staažiga arst.

Iga arst tugineb diagnoosi pannes ainult oma kogemustele. Kui masin seda teeb, tuleneb see tuhandete selliste arstide kogemusest ja muust olemasolevad lood haigus. See võtab arvesse, mis materjalist on patsiendi maja tehtud, millises piirkonnas kannatanu elab, milline suits seal on jne. See tähendab, et see võtab arvesse paljusid tegureid, mida arstid ei võta arvesse.

Näiteks suurandmete kasutamisest tervishoius on projekt Artemis, mille elluviijaks oli Toronto lastehaigla. See on infosüsteem, mis kogub ja analüüsib andmeid beebide kohta reaalajas. Masin võimaldab igal sekundil analüüsida iga lapse 1260 tervisenäitajat. See projekt on suunatud lapse ebastabiilse seisundi ennustamisele ja laste haiguste ennetamisele.

Suurandmeid hakatakse kasutama ka Venemaal: näiteks Yandexil on suurandmete divisjon. Ettevõte käivitas koos AstraZeneca ja Venemaa kliinilise onkoloogia seltsiga RUSSCO platvormi RAY geneetikutele ja molekulaarbioloogidele. Projektiga täiustatakse vähi diagnoosimise ja vähi eelsoodumuse tuvastamise meetodeid. Platvorm käivitatakse 2016. aasta detsembris.

Uuringute ja trendide järgi

Big Data, "Big Data" on IT- ja turundusajakirjanduses juba mitu aastat kõneaineks saanud. Ja selge on: digitehnoloogiad on tänapäeva inimese ellu tunginud, “kõik on kirjas”. Kasvab andmemaht elu erinevate aspektide kohta ja samal ajal kasvavad ka võimalused info salvestamiseks.

Globaalsed tehnoloogiad teabe salvestamiseks

Allikas: Hilbert ja Lopez, "Maailma tehnoloogiline suutlikkus teabe salvestamiseks, suhtlemiseks ja arvutamiseks", Science, 2011 Global.

Enamik eksperte nõustub, et andmete kasvu kiirendamine on objektiivne reaalsus. Sotsiaalvõrgustikud, mobiilseadmed, mõõteseadmete andmed, äriteave on vaid mõned allikad, mis võivad genereerida tohutul hulgal teavet. Uuringute kohaselt IDCDigitaalne universum, avaldati 2012. aastal, ulatub järgmise 8 aasta jooksul andmemaht maailmas 40 Zb-ni (zettabaidi), mis võrdub 5200 GB-ga planeedi elaniku kohta.

Kogutava digitaalse teabe kasv USA-s

Allikas: IDC

Märkimisväärse osa teabest ei loo inimesed, vaid robotid suhtlevad nii omavahel kui ka teiste andmevõrkudega, nagu näiteks andurid ja nutiseadmed. Sellise kasvutempo juures kahekordistub andmete hulk maailmas teadlaste hinnangul iga aastaga. Virtuaalsete ja füüsiliste serverite arv maailmas kasvab seoses laienemise ja uute andmekeskuste loomisega kümnekordseks. Sellega seoses on kasvav vajadus nende andmete tõhusa kasutamise ja rahaks muutmise järele. Kuna suurandmete kasutamine ettevõtluses nõuab märkimisväärseid investeeringuid, on vaja olukorda selgelt mõista. Ja see on sisuliselt lihtne: saate suurendada ettevõtte efektiivsust kulude vähendamise ja/või müügi suurendamise kaudu.

Milleks on suurandmed?

Suurandmete paradigma määratleb kolm peamist ülesannete tüüpi.

Salvestage ja hallake sadu terabaite või petabaite andmeid, mis on tavalised suhtelised alused andmed ei võimalda tõhusat kasutamist.
Tekstidest, piltidest, videotest ja muud tüüpi andmetest koosneva struktureerimata teabe organiseerimine.
Big Data analüüs, mis tõstatab küsimuse, kuidas töötada struktureerimata teabega, analüütiliste aruannete genereerimine ja ennustavate mudelite rakendamine.

Big Data projektiturg ristub ärianalüüsi (BA) turuga, mille maht maailmas ulatus ekspertide hinnangul 2012. aastal umbes 100 miljardi dollarini. See hõlmab võrgutehnoloogia komponente, servereid, tarkvara ja tehnilisi teenuseid.

Samuti on Big Data tehnoloogiate kasutamine asjakohane ettevõtete tegevuse automatiseerimiseks mõeldud tulukindlustuse (RA) klassi lahenduste puhul. Kaasaegsed süsteemid sissetulekugarantiid sisaldavad tööriistu ebakõlade tuvastamiseks ja andmete süvaanalüüsiks, võimaldades õigeaegselt avastada võimalikke kahjusid või infomoonutusi, mis võivad viia majandustulemuste languseni. Selle taustal märgivad Venemaa ettevõtted, kinnitades nõudlust suurandmete tehnoloogiate järele siseturul, et tegurid, mis stimuleerivad suurandmete arengut Venemaal, on andmete kasv, juhtimisotsuste langetamise kiirenemine ja nende võimekuse paranemine. kvaliteet.

Mis takistab suurandmetega töötamist

Tänapäeval analüüsitakse vaid 0,5% kogunenud digiandmetest, hoolimata sellest, et objektiivselt on olemas üle valdkonna ülesandeid, mida saaks lahendada Big Data klassi analüütiliste lahendustega. Arenenud IT-turgudel on juba olemas tulemused, mille põhjal saab hinnata suurandmete kogumise ja töötlemisega seotud ootusi.

Üks peamisi tegureid, mis Big Data projektide elluviimist pidurdab lisaks kõrgetele kuludele, on töödeldavate andmete valiku probleem: see tähendab määratlus, milliseid andmeid tuleks ekstraheerida, salvestada ja analüüsida ning milliseid mitte arvesse võtta.

Paljud ettevõtete esindajad märgivad, et Big Data projektide elluviimise raskused on seotud spetsialistide – turundajate ja analüütikute – puudusega. Suurandmetesse tehtud investeeringu tasuvus sõltub otseselt süva- ja ennustava analüüsiga tegelevate töötajate töö kvaliteedist. Organisatsioonis juba olemasolevat tohutut andmete potentsiaali ei saa turundajad ise sageli tõhusalt kasutada vananenud äriprotsesside või sisemiste regulatsioonide tõttu. Seetõttu peavad ettevõtjad Big Data projekte sageli keeruliseks mitte ainult rakendamisel, vaid ka tulemuste – kogutud andmete väärtuse – hindamisel. Andmetega töötamise eripära nõuab turundajatelt ja analüütikutelt, et nad suunaksid oma tähelepanu tehnoloogialt ja aruandluselt konkreetsete äriprobleemide lahendamisele.

Andmevoo suure mahu ja kiiruse tõttu hõlmab andmete kogumise protsess reaalajas ETL protseduure. Viitamiseks:ETL - alatesIngliseVäljavõte, Teisendus, koormus- sõna otseses mõttes "väljavõte, teisendamine, laadimine") - üks peamisi juhtimisprotsesse andmelaod, mis hõlmab: andmete väljavõtmist välistest allikatest, nende teisendamist ja koristus vastavalt vajadustele ETL-i tuleks vaadelda mitte ainult kui andmete ühest rakendusest teise ülekandmise protsessi, vaid ka kui vahendit andmete analüüsiks ettevalmistamiseks.

Ja siis peaks välistest allikatest tulevate andmete turvalisuse tagamise küsimustel olema lahendused, mis vastavad kogutava info mahule. Kuna suurandmete analüüsimeetodid arenevad seni alles pärast andmemahu kasvu, siis on oluline roll analüütiliste platvormide võimel kasutada uusi andmete ettevalmistamise ja koondamise meetodeid. See viitab sellele, et näiteks andmed potentsiaalsete ostjate kohta või massiivne andmeladu, millel on veebipoodide saitidel tehtud klikkide ajalugu, võivad olla huvitavad erinevate probleemide lahendamiseks.

Raskused ei lõpe

Vaatamata kõikidele raskustele Big Data juurutamisel, kavatseb ettevõte sellesse valdkonda investeeringuid suurendada. Gartneri andmetel on 2013. aastal juba 64% maailma suurimatest ettevõtetest investeerinud või plaanivad investeerida Big Data tehnoloogiate juurutamiseks oma äritegevuses, 2012. aastal oli selliseid ettevõtteid aga 58%. Gartneri uuringu kohaselt on suurandmetesse investeerivate tööstusharude liidrid meediaettevõtted, telekomid, pangandussektor ja teenindusettevõtted. Suurandmete juurutamise edukaid tulemusi on juba saavutanud paljud jaekaubanduse suured tegijad RFID-tööriistade, logistika ja kolimissüsteemide abil saadud andmete kasutamise osas (inglise keelest. täiendamine- kogumine, täiendamine - R&T), samuti lojaalsusprogrammidest. Edukas jaemüügikogemus stimuleerib teisi turusektoreid uusi leidma. tõhusaid viise suurandmete monetiseerimine, et muuta nende analüüs ressursiks, mis töötab ettevõtte arendamiseks. Tänu sellele vähenevad ekspertide hinnangul perioodil kuni 2020. aastani investeeringud haldamisse ja salvestamisse iga andmegigabaidi kohta 2 dollarilt 0,2 dollarile, kuid suurandmete tehnoloogiliste omaduste uurimiseks ja analüüsiks kasvavad vaid 40 võrra. %.

Erinevates suurandmete valdkonna investeerimisprojektides esitatud kulud on erineva iseloomuga. Kuluartiklid sõltuvad teatud otsuste põhjal valitud tootetüüpidest. Suurima osa investeerimisprojektide kuludest langeb ekspertide hinnangul andmete kogumise, struktureerimise, puhastamise ja infohaldusega seotud toodetele.

Kuidas seda tehakse

Tarkvara ja riistvara kombinatsioone on palju, mis võimaldavad luua tõhusaid suurandmete lahendusi erinevatele ärivaldkondadele: alates sotsiaalmeediast ja mobiilirakendustest kuni äriandmete kaevandamise ja visualiseerimiseni. Big Data oluliseks eeliseks on uute tööriistade ühilduvus ettevõtluses laialdaselt kasutatavate andmebaasidega, mis on eriti oluline valdkondadeüleste projektidega töötamisel, näiteks mitme kanaliga müügi ja klienditoe korraldamisel.

Suurandmetega töötamise jada seisneb andmete kogumises, saadud teabe struktureerimises aruannete ja armatuurlaudade (armatuurlaua) abil, arusaamade ja kontekstide loomises ning tegevussoovituste sõnastamises. Kuna suurandmetega töötamine toob endaga kaasa suuri kulutusi andmete kogumisele, mille töötlemise tulemus pole ette teada, on põhiülesanne selgelt aru saada, milleks andmed on mõeldud, mitte kui palju neist on. Sellisel juhul muutub andmete kogumine konkreetsete probleemide lahendamiseks äärmiselt vajaliku teabe hankimise protsessiks.

Näiteks telekommunikatsiooniteenuse pakkujad koondavad tohutul hulgal andmeid, sealhulgas geolokatsiooni, mida pidevalt uuendatakse. See teave võib pakkuda ärilist huvi reklaamiagentuuridele, kes võivad seda kasutada sihitud ja lokaliseeritud reklaami esitamiseks, aga ka jaemüüjatele ja pankadele. Sellised andmed võivad mängida olulist rolli otsustamisel, kas avada jaemüügipunkt konkreetses asukohas, tuginedes andmetele võimsa sihitud inimeste voo olemasolu kohta. Londonis on näide reklaami efektiivsuse mõõtmisest välireklaami stendidel. Nüüd saab sellise reklaami katvust mõõta vaid paigutades inimesed reklaamistruktuuride lähedusse spetsiaalse seadmega, mis loendab möödujaid. Võrreldes seda tüüpi reklaami efektiivsuse mõõtmisega on mobiilioperaatoril palju rohkem võimalusi – ta teab täpselt oma abonentide asukohta, teab nende demograafilisi tunnuseid, sugu, vanust, perekonnaseisu jne.

Selliste andmete põhjal avaneb tulevikus väljavaade reklaamsõnumi sisu muuta, kasutades selleks konkreetse stendilt mööduva inimese eelistusi. Kui andmed näitavad, et möödasõitja reisib palju, saab talle kuurordi kuulutust näidata. Jalgpallimatši korraldajad oskavad mängule tulles fännide arvu vaid hinnata. Aga kui neil oleks võimalik küsida mobiilioperaatorilt infot, kus külastajad tund, päev või kuu enne matši olid, siis see annaks korraldajatel võimaluse planeerida kohti järgmiste kohtumiste reklaamimiseks.

Teine näide on see, kuidas pangad saavad pettuste ärahoidmiseks kasutada suurandmeid. Kui klient teatab kaardi kadumisest ja seda kasutades ostu sooritades näeb pank reaalajas kliendi telefoni asukohta ostupiirkonnas, kus tehing toimub, saab pank kontrollida kliendi väljavõtte infot. kas ta püüdis teda petta. Või vastupidine olukord, kui klient poes ostu sooritab, kui pank näeb, et kaart, millel tehing toimub, ja kliendi telefon on samas kohas, saab pank järeldada, et kaardi omanik kasutab seda . Tänu neile Big Data eelistele laienevad piirid, millega traditsioonilised andmeladud on varustatud.

Edukaks Big Data lahenduste juurutamise otsuse tegemiseks on ettevõttel vaja arvutada investeerimisjuhtum ning see tekitab suuri raskusi paljude tundmatute komponentide tõttu. Analüütika paradoks on sellistel puhkudel ennustada tulevikku mineviku põhjal, mille kohta info sageli puudub. Sel juhul on oluline tegur oma esialgsete tegevuste selge planeerimine:

Esiteks on vaja kindlaks määrata üks konkreetne äriprobleem, mille lahendamiseks Big Data tehnoloogiaid kasutama hakatakse, sellest ülesandest saab valitud kontseptsiooni õigsuse määramise tuum. Pead keskenduma just selle ülesandega seotud andmete kogumisele ning kontseptsiooni tõestamise käigus saad kasutada erinevaid tööriistu, protsesse ja juhtimismeetodeid, mis võimaldavad teha edaspidi teadlikumaid otsuseid.
Teiseks on ebatõenäoline, et ettevõte, kellel puuduvad andmeanalüütika oskused ja kogemused, suudab Big Data projekti edukalt ellu viia. Vajalikud teadmised pärinevad alati varasemast analüütikakogemusest, mis on peamine andmetega töö kvaliteeti mõjutav tegur. Olulist rolli mängib andmete kasutamise kultuur, kuna sageli selgub teabe analüüsimisel karm tõde ettevõtte kohta ning selle tõe omaksvõtmiseks ja sellega töötamiseks on vaja väljatöötatud meetodeid andmetega töötamiseks.
Kolmandaks seisneb suurandmete tehnoloogiate väärtus arusaamise pakkumises. Head analüütikud jäävad turule puudu. Neid nimetatakse spetsialistideks, kes mõistavad sügavalt andmete kaubanduslikku tähendust ja teavad, kuidas neid õigesti rakendada. Andmeanalüüs on vahend ärieesmärkide saavutamiseks ning suurandmete väärtuse mõistmiseks on vaja sobivat käitumismudelit ja arusaamist oma tegevusest. Sel juhul annavad suurandmed palju kasulik informatsioon tarbijate kohta, mille põhjal saab teha kasulikke äriotsuseid.

Vaatamata asjaolule, et Venemaa suurandmete turg alles hakkab ilmet võtma, on mõned projektid selles valdkonnas juba üsna edukalt ellu viidud. Mõned neist on edukad andmete kogumise valdkonnas, näiteks projektid Federal Tax Service'ile ja Tinkoff Credit Systemsile, teised aga andmete analüüsi ja tulemuste praktilise rakendamise osas: see on Synqera projekt.

Tinkoff Credit Systems Bank viis ellu projekti EMC2 Greenplumi platvormi juurutamiseks, mis on massiliselt paralleelarvutuse tööriist. ajal Viimastel aastatel panga nõuded kogutud info töötlemise kiirusele ja andmete reaalajas analüüsimisele on suurenenud seoses krediitkaardikasutajate arvu suure kasvutempoga. Pank teatas plaanist laiendada suurandmete tehnoloogiate kasutamist, eelkõige struktureerimata andmete töötlemisel ja töötamiseks erinevatest allikatest hangitud ettevõtteteabega.

Venemaa föderaalne maksuteenistus loob praegu föderaalse andmelao analüütilist kihti. Sellest lähtuvalt ühtne inforuum ja maksuandmetele juurdepääsu tehnoloogia statistiliseks ja analüütiliseks töötlemiseks. Projekti elluviimise ajal tehakse tööd analüütilise teabe koondamiseks enam kui 1200 föderaalse maksuteenistuse kohaliku tasandi allikaga.

Teine huvitav näide reaalajas suurandmete analüüsist on Venemaa idufirma Synqera, mis arendas Simplate platvormi. Lahendus põhineb suurte andmemassiivide töötlemisel, programm analüüsib infot klientide, nende ostude ajaloo, vanuse, soo ja isegi meeleolu kohta. Kosmeetikapoodide võrgustikus olevate kassade juurde paigaldati sensoritega puuteekraanid, mis tunnevad ära klientide emotsioone. Programm määrab inimese meeleolu, analüüsib tema kohta käivat teavet, määrab kellaaja ja skannib kaupluse allahindluste andmebaasi, misjärel saadab ostjale suunatud teateid kampaaniate ja eripakkumiste kohta. See lahendus suurendab klientide lojaalsust ja suurendab jaemüüjate müüki.

Kui rääkida välismaistest edukatest juhtumitest, siis selles osas pakub huvi Big Data tehnoloogiate kasutamise kogemus Dunkin` Donutsis, mis kasutab toodete müügiks reaalajas andmeid. Digitaalekraanidel kauplustes kuvatakse pakkumisi, mis muutuvad iga minuti järel, olenevalt kellaajast ja toodete saadavusest. Kassakviitungite järgi saab ettevõte andmed selle kohta, millised pakkumised pälvisid ostjatelt kõige rohkem vastukaja. Selline andmetöötlusviis võimaldas suurendada kasumit ja kaubakäivet laos.

Nagu näitab Big Data projektide elluviimise kogemus, on see valdkond loodud kaasaegsete äriprobleemide edukaks lahendamiseks. Samas on suurandmetega töötamisel äriliste eesmärkide saavutamisel oluliseks teguriks õige strateegia valik, mis hõlmab nii tarbijate vajadusi tuvastavat analüütikat kui ka uudsete tehnoloogiate kasutamist Big Data valdkonnas.

Econsultancy ja Adobe alates 2012. aastast iga-aastaselt ettevõtete turundajate seas läbiviidava globaalse uuringu kohaselt võivad inimeste tegevust internetis iseloomustavad “suured andmed” palju ära teha. Nad suudavad optimeerida võrguühenduseta äriprotsesse, aidata mõista, kuidas mobiilseadmete omanikud neid teabe otsimiseks kasutavad või lihtsalt "turunduse paremaks muutmiseks", s.t. tõhusam. Veelgi enam, viimane funktsioon muutub aasta-aastalt populaarsemaks, nagu meie diagrammist näha.

Internetiturundajate peamised töövaldkonnad kliendisuhete osas

Allikas: Econsultancy ja Adobe, avaldatudemarketer.com

Pange tähele, et vastajate rahvus suure tähtsusega ei oma. KPMG 2013. aastal läbiviidud küsitluse järgi on "optimistide", s.o. nendest, kes kasutavad suurandmeid äristrateegia väljatöötamisel, on 56% ja kõikumised piirkonniti on väikesed: Põhja-Ameerika riikide 63%-lt EMEA-s 50%-ni.

Suurandmete kasutamine erinevates maailma piirkondades

Allikas: KPMG, avaldatudemarketer.com

Vahepeal meenutab turundajate suhtumine sellistesse “moetrendidesse” mõneti tuntud anekdooti:

Ütle mulle, Vano, kas sulle meeldivad tomatid?
- Mulle meeldib süüa, aga ma ei taha.

Hoolimata asjaolust, et turundajad ütlevad, et nad "armastavad" suurandmeid ja näivad isegi neid kasutavat, on tegelikult "kõik keeruline", kuna nad kirjutavad oma südamlikest kiindumustest sotsiaalvõrgustikes.

Circle Researchi 2014. aasta jaanuaris Euroopa turundajate seas läbiviidud küsitluse kohaselt ei kasuta 4 vastajat viiest suurandmeid (hoolimata sellest, et neile see loomulikult "armastab"). Põhjused on erinevad. Paadunud skeptikuid on vähe - 17% ja täpselt sama palju kui nende antipoode, st. need, kes vastavad enesekindlalt "jah". Ülejäänud kõhklevad ja kahtlevad, “soo”. Nad väldivad otsest vastust, kasutades selliseid usutavaid vabandusi nagu "veel mitte, aga varsti" või "ootame, kuni teised alustavad".

Suurandmete kasutamine turundajate poolt, Euroopa, jaanuar 2014

Allikas:dnx, avaldatud -e-turundaja.com

Mis neid segadusse ajab? Puhas jama. Mõned (täpselt pooled neist) lihtsalt ei usu neid andmeid. Teistel (neid on ka üsna vähe - 55%) on raske "andmete" ja "kasutajate" komplekte omavahel korreleerida. Kellelgi on lihtsalt (ütleme poliitkorrektselt) ettevõttesisene segadus: andmed kõnnivad omanikuta turundusosakondade ja IT-struktuuride vahel. Teiste jaoks ei saa tarkvara töövooluga toime. Jne. Kuna aktsiate koguarv on tublisti üle 100%, on selge, et "mitmekordse barjääri" olukord pole haruldane.

Barjäärid, mis takistavad suurandmete kasutamist turunduses

Allikas:dnx, avaldatud -e-turundaja.com

Seega tuleb tõdeda, et seni on "Big Data" suur potentsiaal, mis vajab veel kasutamist. Muide, see võib olla põhjus, miks Big Data on kaotamas oma “moetrendi” halo, nagu näitavad ka meie poolt juba mainitud Econsultancy ettevõtte läbiviidud uuringuandmed.

Digiturunduse märkimisväärsemad trendid 2013-2014

Allikas: nõustamine ja Adobe

Neid asendab teine kuningas – sisuturundus. Kui kaua?

Ei saa öelda, et suurandmed on mingi põhimõtteliselt uus nähtus. Suured andmeallikad on eksisteerinud aastaid: klientide ostude, krediidiajaloo, elustiili andmebaasid. Ja aastaid on teadlased neid andmeid kasutanud, et aidata ettevõtetel riske hinnata ja klientide tulevasi vajadusi ennustada. Tänaseks on olukord aga muutunud kahes aspektis:

Erinevate andmekogumite analüüsimiseks ja kombineerimiseks on tekkinud keerukamad tööriistad ja meetodid;

Neid analüütilisi tööriistu täiendab uute andmeallikate laviin, mis on ajendatud peaaegu kõigi andmete kogumise ja mõõtmise meetodite digiteerimisest.

Saadaoleva teabe hulk on nii inspireeriv kui ka hirmutav teadlastele, kes kasvasid üles struktureeritud uurimiskeskkonnas. Tarbijameeleolu püüavad kinni veebisaidid ja kõikvõimalik sotsiaalmeedia. Reklaamide vaatamise fakti ei salvesta mitte ainult digiboksid, vaid ka digisiltide ja teleriga suhtlevate mobiilseadmete abil.

Käitumisandmed (nt kõnede arv, ostuharjumused ja ostud) on nüüd saadaval reaalajas. Seega saab suurt osa sellest, mida võis varem uurimistööga õppida, nüüd õppida suurte andmeallikate kaudu. Ja kõiki neid teabevarasid genereeritakse pidevalt, sõltumata uurimisprotsessidest. Need muudatused panevad meid mõtlema, kas suured andmed võivad asendada klassikalise turu-uuringu.

Asi pole andmetes, vaid küsimustes ja vastustes

Enne klassikaliste uuringute jaoks surmanupu tellimist tuleb meelde tuletada, et määrav ei ole mitte ühe või teise andmevara olemasolu, vaid midagi muud. Mida täpselt? Meie võime küsimustele vastata, see on see. Naljakas asi uue suurandmete maailma juures on see, et uute andmevarade tulemused tekitavad veelgi rohkem küsimusi ja neile küsimustele kipuvad kõige paremini vastama traditsioonilised uuringud. Seega näeme suurandmete kasvades paralleelset kasvu "väikeandmete" kättesaadavuses ja nõudluses, mis võivad anda vastuseid suurandmete maailmast pärit küsimustele.

Vaatleme olukorda: suur reklaamija jälgib pidevalt kaupluste liiklust ja müügimahtusid reaalajas. Olemasolevad uurimismetoodikad (mille puhul küsime uuringupaneelides osalejatelt nende ostumotivatsiooni ja käitumist müügikohas) aitavad meil konkreetseid kliendisegmente paremini sihtida. Neid metoodikaid saab laiendada nii, et need hõlmaksid laiemat valikut suurandmevarasid, kuni punktini, kus suurandmed muutuvad passiivse vaatluse vahendiks ja uurimismeetodiks pideva, kitsalt fokusseeritud muutuste või sündmuste uurimist vajavate sündmuste uurimisel. Nii võivad suurandmed vabastada uurimistööd tarbetust rutiinist. Esmased uuringud ei tohiks enam keskenduda sellele, mis toimub (suured andmed seda teevad). Selle asemel võivad esmased uuringud keskenduda selgitamisele, miks me näeme teatud suundumusi või suundumustest kõrvalekaldeid. Teadlane saab vähem mõelda andmete hankimisele ja rohkem sellele, kuidas neid analüüsida ja kasutada.

Samas näeme, et suurandmed lahendavad üht meie suurimat probleemi, liiga pikkade uuringute probleemi. Uuringute endi uurimine on näidanud, et liiga ülepaisutatud uurimistööriistad mõjutavad negatiivselt andmete kvaliteeti. Kuigi paljud eksperdid tunnistasid seda probleemi pikka aega, vastasid nad alati fraasiga: "Aga ma vajan seda teavet kõrgema juhtkonna jaoks" ja pikad intervjuud jätkusid.

Suurandmete maailmas, kus kvantitatiivseid näitajaid on võimalik saada passiivse vaatluse teel, muutub see teema vaieldavaks. Jällegi, mõelgem tagasi kogu sellele tarbimisuuringule. Kui suurandmed annavad meile passiivse vaatluse kaudu aimu tarbimise kohta, siis esmased uuringud uuringute vormis ei pea enam sellist infot koguma ning lõpuks saame oma nägemust lühiküsitlustest toetada mitte ainult heade soovidega, vaid ka midagi tõelist.

Big Data vajab teie abi

Lõpuks on "suur" vaid üks suurandmete omadusi. Tunnus "suur" viitab andmete suurusele ja ulatusele. Loomulikult on see peamine omadus, kuna nende andmete maht on väljaspool kõike, millega oleme varem töötanud. Kuid nende uute andmevoogude muud omadused on samuti olulised: need on sageli halvasti vormindatud, struktureerimata (või parimal juhul osaliselt struktureeritud) ja täis ebakindlust. Tekkiv andmehalduse valdkond, mida nimetatakse tabavalt "olemianalüüsiks", püüab lahendada suurandmete mürast ülesaamise probleemi. Selle ülesanne on neid andmekogumeid analüüsida ja välja selgitada, mitu vaatlust on sama isiku kohta, millised vaatlused on aktuaalsed ja millised neist on kasutatavad.

Selline andmete puhastamine on vajalik müra või vigaste andmete eemaldamiseks suurte või väikeste andmevaradega töötamisel, kuid sellest ei piisa. Samuti peame looma konteksti suurte andmevarade ümber, tuginedes meie varasemale kogemusele, analüütikale ja kategooriateadmistele. Tegelikult osutavad paljud analüütikud suutlikkusele hallata suurandmetele omast ebakindlust kui konkurentsieelise allikat, kuna see võimaldab paremaid otsuseid langetada.

Ja see on koht, kus esmased uuringud ei vabane mitte ainult tänu suurandmetele rutiinist, vaid aitavad kaasa ka suurandmete sisu loomisele ja analüüsile.

Selle suurepärane näide on meie uhiuue brändikapitali raamistiku rakendamine sotsiaalmeedias. (me räägime aastal väljatöötatustMillward Pruunuus lähenemine brändi väärtuse mõõtmiseleThe Mõtetult Erinevad Raamistik- "Oluliste erinevuste paradigma" -R & T ). Seda mudelit testitakse konkreetsetel turgudel käitumise järgi, rakendatakse standardsetel alustel ning seda saab hõlpsasti rakendada ka teistes turundusvaldkondades ja otsustustoetuste infosüsteemides. Teisisõnu, meie brändikapitali mudelil, mis põhineb küsitlusuuringutel (kuigi mitte ainult küsitlustel), on kõik omadused, mis on vajalikud suurandmete struktureerimata, lahtiühendatud ja ebakindla olemuse ületamiseks.

Kaaluge sotsiaalmeedia pakutavaid tarbijate sentimentide andmeid. Toores vormis on tarbijate sentimentide tipud ja orud väga sageli minimaalses korrelatsioonis brändiväärtuse ja käitumise võrguvälise mõõtmisega: andmetes on lihtsalt liiga palju müra. Kuid me saame seda müra vähendada, rakendades tarbijate tähenduse, kaubamärgi eristamise, dünaamika ja identiteedi mudeleid toores tarbijate sentimentandmetele, mis on viis sotsiaalmeedia andmete töötlemiseks ja koondamiseks nendes mõõtmetes.

Kui andmed on meie raamistiku mudeli järgi korraldatud, vastavad tuvastatud suundumused tavaliselt võrguühenduseta saadud brändiväärtuse ja käitumise mõõtmistulemustele. Tegelikult ei saa sotsiaalmeedia andmed enda eest rääkida. Nende kasutamiseks on vaja meie kogemusi ja kaubamärkide ümber ehitatud mudeleid. Kui sotsiaalmeedia annab meile ainulaadset teavet, mis on väljendatud keeles, mida tarbijad kasutavad kaubamärkide kirjeldamiseks, peame kasutama seda keelt oma uurimistöö loomisel, et muuta esmane uuring palju tõhusamaks.

Vabastatud uuringute eelised

See toob meid tagasi tõsiasja juurde, et suurandmed ei asenda mitte niivõrd teadusuuringuid, kuivõrd vabastavad neid. Teadlased vabastatakse iga uue juhtumi jaoks uue uuringu koostamisest. Suurandmete üha kasvavat vara saab kasutada erinevate uurimisteemade jaoks, võimaldades järgnevatel esmastel uuringutel teemasse süveneda ja lünki täita. Teadlased vabanevad liigselt ülepaisutatud küsitlustele tuginemisest. Selle asemel saavad nad kasutada lühikesi uuringuid ja keskenduda kõige olulisematele parameetritele, mis parandab andmete kvaliteeti.

Selle väljaandega saavad teadlased kasutada oma väljakujunenud põhimõtteid ja teadmisi suurandmete varade täpsuse ja tähenduse lisamiseks, mis toob kaasa uued uuringuvaldkonnad. See tsükkel peaks viima mitmete strateegiliste küsimuste sügavamale mõistmiseni ja lõpuks liikumiseni selle poole, mis peaks alati olema meie peamine eesmärk – teavitada ja parandada brändi- ja kommunikatsiooniotsuste kvaliteeti.

Mõiste suurandmed viitab tavaliselt mis tahes hulgale struktureeritud, poolstruktureeritud ja struktureerimata andmetele. Teise ja kolmanda saab ja tuleks aga tellida info hilisemaks analüüsiks. Suurandmed ei võrdu ühegi tegeliku mahuga, kuid suurandmetest rääkides peame enamasti silmas terabaite, petabaite ja isegi ekstrabaite infot. Selline andmemaht võib koguneda igas ettevõttes aja jooksul või juhul, kui ettevõte peab saama palju teavet, siis reaalajas.

Suurandmete analüüs

Suurandmete analüüsist rääkides peame eelkõige silmas erinevatest allikatest info kogumist ja talletamist. Näiteks andmed ostnud klientide kohta, nende omadused, teave käivitatud reklaamikampaaniate kohta ja hinnang selle efektiivsusele, kontaktikeskuse andmed. Jah, kogu seda teavet saab võrrelda ja analüüsida. See on võimalik ja vajalik. Kuid selleks peate looma süsteemi, mis võimaldab teil teavet moonutamata koguda ja teisendada, seda salvestada ja lõpuks visualiseerida. Nõus, suurandmete puhul ei aita mitmele tuhandele leheküljele trükitud tabelid äriotsuste tegemisel kuigi palju kaasa.

1. Suurandmete saabumine

Enamik teenuseid, mis koguvad teavet kasutaja toimingute kohta, saavad eksportida. Selleks, et nad saaksid ettevõttesse struktureeritud kujul siseneda, kasutatakse erinevaid, näiteks Alteryxi. See tarkvara võimaldab teil teavet automaatselt vastu võtta, seda töödelda, kuid mis kõige tähtsam, teisendada see soovitud kujule ja vormingusse ilma seda moonutamata.

2. Suurandmete säilitamine ja töötlemine

Peaaegu alati tekib suurte teabekoguste kogumisel selle salvestamise probleem. Kõigist uuritud platvormidest eelistab meie ettevõte Verticat. Erinevalt teistest toodetest suudab Vertica endasse salvestatud info kiiresti “anda”. Miinustena tuleb välja tuua pikk salvestamine, kuid suurandmete analüüsimisel tuleb esile tagasituleku kiirus. Näiteks kui me räägime koostamisest petabaidi teabe abil, on üleslaadimise kiirus üks olulisemaid omadusi.

3. Suurandmete visualiseerimine

Ja lõpuks, suurte andmemahtude analüüsi kolmas etapp on . Selleks on vaja platvormi, mis suudab visuaalselt kajastada kogu saadud teavet mugaval kujul. Meie arvates saab selle ülesandega toime vaid üks tarkvaratoode Tableau. Kahtlemata üks parimaid lahendusi tänapäeval, mis suudab visuaalselt näidata igasugust infot, muutes ettevõtte töö kolmemõõtmeliseks mudeliks, koondades kõikide osakondade tegevused ühtsesse üksteisest sõltuvasse ahelasse (täpsemalt saab lugeda Tableau võimaluste kohta).

Kokkuvõtte asemel märgime, et peaaegu iga ettevõte saab nüüd luua oma suurandmeid. Suurandmete analüüs ei ole enam keeruline ja kulukas protsess. Nüüd on ettevõtte juhtkonnal kohustus kogutud teabele küsimused õigesti sõnastada, samas kui nähtamatud hallid alad praktiliselt puuduvad.

Laadige alla Tableau