Analýza veľkých množstiev údajov. Veľké údaje: Analytics a riešenia

Iba lenivá nehovorí veľké údaje, ale čo to je a ako to funguje - je nepravdepodobné. Začnime s najjednoduchšou terminológiou. V ruštine sú veľké údaje rôzne nástroje, prístupy a metódy spracovania štruktúrovaných aj neštruktúrovaných údajov s cieľom využiť ich pre konkrétne úlohy a ciele.

Neštruktúrované údaje sú informácie, ktoré nemajú vopred určenú štruktúru alebo nie sú organizované v určitom poradí.

Termín "veľké dáta" predstavil redaktora časopisu Nature Clifford Lynch späť v roku 2008 v osobitnej otázke venovanej výbušnému rastu objemu svetových informácií. Aj keď, samozrejme, veľké údaje samotné existovali predtým. Podľa odborníkov, veľká kategória údajov obsahuje väčšinu dátových tokov nad 100 GB za deň.

Pozri tiež:

Dnes, v tomto jednoduchom termíne, sú skryté iba dve slová a spracovanie údajov.

Veľké údaje - jednoduché slová

V modernom svete je veľkým údajom sociálno-ekonomickým fenoménom, ktorý je spojený so skutočnosťou, že nové technologické schopnosti sa zdali analyzovať obrovské množstvo údajov.

Pozri tiež:

Pre jednoduchosť porozumenia si predstavte supermarket, v ktorom všetok tovar leží v obvyklom poradí. Chlieb vedľa ovocia, paradajková pasta v blízkosti mrazenej pizze, tekutiny na zapaľovanie pred stojana s tamptonmi, na ktorom, okrem iného, \u200b\u200bstojí avokádo, tofu alebo shiitake huby. Veľké údaje nastaviť všetko na svojom mieste a pomôže vám nájsť orechy mlieko, zistiť dátum nákladov a exspirácie, a tiež - kto okrem vás nakupuje také mlieko a ako je to lepšie ako kravské mlieko.

Kenneth Cucier: Veľké dáta - najlepšie údaje

Technologické veľké údaje.

Obrovské objemy dát sú spracované tak, že osoba môže získať špecifické a potrebné výsledky pre ich ďalšie efektívne využívanie.

Pozri tiež:

V skutočnosti sú veľké údaje riešením problémov a alternatívu k tradičným systémom správy údajov.

Techniky a metódy analýzy platné pre veľké údaje podľa McKinsey:

  • Usporiadanie údajov;
  • Crowdsourcing;
  • Integrácia miešania a údajov;
  • Strojové učenie;
  • Umelé nervové siete;
  • Rozpoznávanie vzorov;
  • Predpoveď analýzy;
  • Simulácia;
  • Priestorová analýza;
  • Štatistická analýza;
  • Vizualizácia analytických údajov.

Horizontálna škálovateľnosť, ktorá poskytuje spracovanie údajov - základný princíp spracovania veľkých údajov. Údaje sú distribuované na výpočtové uzly a spracovanie dochádza bez degradácie produktivity. McKinsey zahŕňala systémy relačnej kontroly a obchodné inteligencie v kontexte použiteľnosti.

Technológie:

  • Nosql;
  • Mapreduce;
  • Hreop;
  • Hardvérové \u200b\u200briešenia.

Pozri tiež:

Pre veľké údaje, tradičné definujúce charakteristiky vyrábané meta skupinou stále v roku 2001, ktoré sa nazývajú " Tri V.»:

  1. Objem. - veľkosť fyzického objemu.
  2. Rýchlosť. - Rýchlosť rastu a potreba rýchleho spracovania údajov na získanie výsledkov.
  3. Odroda. - schopnosť súčasne spracovávať rôzne typy údajov.

Veľké údaje: Aplikácia a funkcie

Objemy nehomogénnych a rýchlo prichádzajúcich digitálnych informácií nemožno liečiť tradičnými nástrojmi. Samotná analýza údajov vám umožní vidieť určité a nenápadné vzory, ktoré človek nevidí. To vám umožní optimalizovať všetky sféry nášho života - od vlády na výrobu a telekomunikácie.

Niektoré spoločnosti napríklad bránili svojich zákazníkov pred podvodmi pred niekoľkými rokmi a starajú sa o peniaze klienta, je znepokojenie nad vlastnými peniazmi.

Susan etlyger: Ako sa vysporiadať s veľkými údajmi?

Veľké riešenia založené na dátoch: Sberbank, Beeline a iné spoločnosti

Bilain má obrovské množstvo účastníkov, ktoré používajú nielen na prácu s nimi, ale aj na vytvorenie analytických výrobkov, ako sú externé poradenstvo alebo IPTV Analytics. Beeline segmentoval základňu a chránených zákazníkov z peňažných podvodov a vírusov, pomocou HDFS a Apache Spark a na spracovanie dát - Rapidminer a Python.

Pozri tiež:

Alebo si pamätajte Sberbank so starým prípadom zazvaným ako SAFI. Ide o systém, ktorý analyzuje fotografie na identifikáciu zákazníkov banky a zabraňuje podvodom. Systém bol zavedený v roku 2014, systém je založený na porovnaní fotografií zo základne, ktorý tam prichádza z webkamery na regáloch kvôli počítačovej vízii. Základom systému je biometrická platforma. Vzhľadom k tomu, prípady podvodov sa znížili 10-krát.

Veľké údaje na svete

Do roku 2020, podľa prognóz, ľudstvo vytvorí 40-44 Zettabits informácií. A do roku 2025 bude rásť 10-krát, správu o dátach 2025, ktorá bola pripravená analytici IDC. Správa poznamenáva, že samotné podniky budú generované väčšinu údajov, a nie bežných spotrebiteľov.

Analytici výskumu sa domnievajú, že údaje sa stanú životne dôležitým aktívom a bezpečnosť je kritickým základom v živote. Autori práce sú presvedčení, že technológia zmení ekonomickú krajinu a obvyklý užívateľ bude komunikovať s pripojenými zariadeniami asi 4800 krát denne.

Veľký údajový trh v Rusku

V roku 2017 by sa globálne príjmy na veľkom základe trhu mali dosiahnuť 150,8 miliardy dolárov, čo je o 12,4% viac ako v minulom roku. V celosvetovom meradle ruský trh Veľké dátové služby a technológie sú stále veľmi malé. V roku 2014 to spoločnosť American IDC túto spoločnosť hodnotila na 340 miliónov dolárov. V Rusku sa technológia využíva v bankovom sektore, energetike, logistike, verejnom sektore, telekomunikácii a priemysle.

Pozri tiež:

Pokiaľ ide o trhový trh, pochádza len v Rusku. Vnútri Ekosystému RTB sú poskytovatelia údajov majitelia správy dát (DMP) a výmena údajov (výmena údajov). Telecom prevádzkovatelia v pilotnom režime sú rozdelené spotrebiteľskými informačnými bankami o potenciálnych dlžníkov.

Typicky, veľké údaje pochádzajú z troch zdrojov:

  • Internet (sociálne siete, fóra, blogy, médiá a iné stránky);
  • Podnikové archívy dokumentov;
  • Indikácie snímačov, zariadení a iných zariadení.

Veľké údaje v bankách

Okrem vyššie opísaného systému, v stratégii SBERBANK 2014-2018. Hovorí sa o dôležitosti analýzy dátových supermaní pre kvalitné zákaznícky servis, riadenie rizík a optimalizáciu nákladov. Teraz Banka využíva veľké údaje na kontrolu rizík, boj proti podvodom, segmentácii a úverovým nákladom na kredit, personálny manažment, predpovedanie frontov v kanceláriách, výpočet bonusov pre zamestnancov a iné úlohy.

VTB24 má veľké údaje pre segmentáciu a riadenie odbyt od zákazníkov, tvorbu účtovnej závierky, analýzy spätnej väzby v sociálnych sieťach a fórach. Na tento účel sa uplatňuje Teradata, SAS Visual Analytics a SAS Marketing Optimalizačné riešenia.

Poznáte tento slávny vtip? Veľké údaje sú ako sex až 18:

  • každý si o tom myslí;
  • všetci o tom povedali;
  • každý si myslí, že ich priatelia to robia;
  • takmer nikto to neurobí;
  • ten, kto to robí zlí;
  • každý si myslí, že nabudúce sa ukáže lepšie;
  • nikto nevyberá bezpečnostné opatrenia;
  • niekto hanba priznať, že niečo nevie;
  • ak niekto niečo robí, z toho je vždy veľa hluku.

Ale myslím si, že vždy bude existovať bežná zvedavosť s akýmkoľvek hlukom v blízkosti: aký druh syra-boron je niečo naozaj dôležité? Ak je krátko - áno, tam je. Podrobnosti - nižšie. Vybrali sme pre vás najúžasnejšie a zaujímavé aplikácie veľkých dátových technológií. Tento malý prieskum trhu na zrozumiteľných príkladoch je konfrontovaný s jednoduchou skutočnosťou: Budúcnosť sa nevyskytuje, nie je potrebné "čakať ďalších n rokov a kúzlo sa stane realitou." Nie, už prišiel, ale stále nepostrehol do oka, a preto singularity Cape tiež nehorí známym bodom trhu práce. Ísť.

1 Ako sa vznikli veľké dátové technológie, kde vznikli

Veľké IT spoločnosti sú miesto, kde vznikla dátová veda, takže ich vnútorná kuchyňa v tejto oblasti je najzaujímavejšia. Kampaň Google, Mapa Zmenšiť paradigm ,, ktorého jediným cieľom je trénovať svojich programátorov pre technológie strojárstva. A tým leží svoju konkurenčnú výhodu: po prijatí nových poznatkov, personál zavedú nové metódy v tých projektoch Google, kde neustále pracujú. Predstavte si, ako obrovský zoznam oblastí, v ktorých môže kampaň urobiť revolúciu. Jedným z príkladov: Používajú sa neurónové siete.

Corporation a zavádza stroj na učenie sa všetkým svojim produktom. Jeho výhoda - prítomnosť veľkého ekosystému, ktorý zahŕňa všetky digitálne zariadenia používané v každodennom živote. To umožňuje Apple dosiahnuť nemožnú úroveň: Kampaň má toľko údajov o užívateľoch ako iné. Zásady ochrany osobných údajov je zároveň veľmi prísne: Corporation sa vždy chválil skutočnosťou, že nepoužíva zákaznícke údaje na propagačné účely. V súlade s tým sú informácie o používateľovi šifrované tak, že advokáti Apple alebo dokonca FBI s objednávkou ju nemôžu prečítať. Nájdete tu veľkú recenziu o vývoji Apple v oblasti AI.

2 Veľké údaje na 4 kolesách

Moderné auto - Informačné pohon: Akumuluje všetky údaje na vodiča, životné prostredie, pripojené zariadenia a o sebe. Už čoskoro jedno vozidlo, ktoré je pripojené k sieti, ako je ten, ktorý bude generovať až 25 GB dát za hodinu.

Dopravná telematika využívajú automobilky v priebehu rokov, ale teraz zložitejšia metóda zberu údajov je lobby, ktorá plne využije veľké údaje. A to znamená, že teraz technológie môžu oznámiť vodičovi o zlé podmienky na cestách automaticky aktiváciou anti-lock brzdového a potopenie systému.

Ďalšie obavy, vrátane BMW, používajú veľké dátové technológie v spojení s informáciami zozbieranými z testovaných prototypov zabudovaných do automobilov "pamäť pamäť" a sťažností klienta na určenie slabých bodov modelu v počiatočnom štádiu výroby. Teraz namiesto manuálneho hodnotenia údajov, ktoré trvá mesiace, aplikuje sa moderný algoritmus. Chyby a náklady na ich odstránenie sú znížené, čo vám umožní urýchliť pracovné procesy na analýzu informácií v BMW.

Podľa expertných odhadov sa do roku 2019 dosiahne obrat trhu s jedinou sieťou automobilov 130 miliárd USD. To nie je prekvapujúce, ak beriete do úvahy tempo integrácie automobilov technológií, ktoré sú neoddeliteľnou súčasťou vozidla.

Použitie veľkých údajov pomáha auto bezpečnejšie a funkčné. TOYOTA tak, že vloží informačné komunikačné moduly (DCM). Tento nástroj používaný pre veľké dátové procesy a analyzuje údaje zozbierané DCM, aby sa získali výhody.

3 Aplikácia veľkých údajov v medicíne


Implementácia veľkých dátových technológií v lekárskej sfére umožňuje lekárom starostlivo preskúmať chorobu a zvoliť efektívny priebeh liečby pre konkrétny prípad. Vďaka analýze informácií sa zdravotnícki pracovníci stávajú ľahšie predpovedať relapsy a prijať preventívne opatrenia. V dôsledku toho - presnejšia diagnóza a zlepšené metódy liečby.

Nová technika umožnila pozrieť sa na problémy pacientov na druhej strane, čo viedlo k otvoreniu predtým neznámych zdrojov problému. Niektoré preteky sú napríklad geneticky viac predisponované na choroby srdca, a nie zástupcov iných etnických skupín. Teraz, keď sa pacient sťažuje na určité ochorenie, lekári berú do úvahy údaje o zástupcov jeho rasy, ktoré sa sťažovali na rovnaký problém. Zber a analýza údajov vám umožní dozvedieť sa o pacientoch oveľa viac: z preferencií v potravinách a životnom štýle na genetickú štruktúru DNA a bunkových metabolitov, tkanív, orgánov. Centrum detskej genómovej medicíny v Kansase sa teda používa pacienti a analyzovať mutácie genetického kódu, ktorý spôsobuje rakovinu. Individuálny prístup ku každému pacientovi, berúc do úvahy jeho DNA, zvýši účinnosť liečby na kvalitatívne inej úrovni.

S pochopením, ako sa používajú veľké údaje, prvá a veľmi dôležitá zmena v lekárskej gule nasleduje. Keď pacient podstúpi priebeh liečby, nemocnica alebo iná zdravotnícke zariadenie môže získať veľa významných informácií o osobe. Zozbierané informácie sa používajú na predpovedanie relapsov chorôb s určitým stupňom presnosti. Napríklad, ak pacient utrpel mŕtvicu, lekári študujú informácie o čase poruchách mozgovej vody, analyzujú medziprodukt medzi predchádzajúcimi predchádzajúcimi precedensmi (v prípade takej), venovať osobitnú pozornosť stresovým situáciám a ťažkej fyzickej námahe v živote pacienta. Na základe týchto údajov vydávajú nemocnice jasný plán opatrení na zabránenie možnosti mŕtvice v budúcnosti.

Nositeľné zariadenia, ktoré hrajú svoju úlohu, ktoré pomáhajú identifikovať zdravotné problémy, aj keď osoba nemá žiadne zjavné príznaky jednej alebo inej choroby. Namiesto hodnotenia stavu pacienta dlhým skúškou môže lekár vyvodiť závery založené na zostavenom tracker Fitness Tracker alebo "Smart" informačné hodiny.

Jedným z najnovších príkladov je. Kým pacient prešiel prieskumom kvôli novému útoku kŕčov spôsobeného zmeškaným príjmom liekov, lekári zistili, že človek má oveľa vážnejší zdravotný problém. Tento problém bol predsieňový fibrilácia. Diagnóza bola vykonaná z dôvodu, že zamestnanci oddelenia dostal prístup k telefónu pacienta, a to na konjugátu aplikácie s jeho fitness tracker. Údaje z aplikácie sa ukázali byť kľúčovým faktorom pri určovaní diagnózy, pretože v čase vyšetrenia neexistovali žiadne srdcové odchýlky v čase človeka.

To je len jeden z mála prípadov, ktoré ukazujú prečo používať veľké údaje V lekárskej sfére dnes zohráva významnú úlohu.

4 Analýza dát sa už stala maloobchodnou tyčou

Pochopenie požiadaviek používateľov a zacielenie je jednou z najväčších a najviac vysoko uvedených oblastí pre použitie veľkých dátových nástrojov. Veľké údaje pomáhajú analyzovať klientske návyky, takže v budúcnosti je lepšie pochopiť požiadavky na spotrebiteľov. Spoločnosti sa snažia rozšíriť tradičný súbor údajov s informáciami zo sociálnych sietí a históriu vyhľadávania prehliadača, aby sa vytvoril maximálny plný klientsky obrázok. Niekedy veľké organizácie ako globálny cieľ si vyberajú vytváranie vlastného prediktívneho modelu.

Napríklad cieľové obchody s hlbokou analýzou dát a vlastným predikčným systémom je možné určiť s vysokou presnosťou. Každý klient je fixovaný ID, ktorý je zase pripojený k kreditnej karte, menom alebo e-mailom. Identifikátor slúži ako druh nákupného košíka, kde sú informácie uložené o všetkom, čo kedy získal. Sieť špecialisti zistili, že ženy v predpisoch sa aktívne získavajú zdatívnymi prostriedkami pred druhým trimestrom tehotenstva a počas prvých 20 týždňov sú uvedené na prísadách vápnika, zinku a horčíka. Na základe údajov získaných údajov posiela kupóny pre deti pre deti. Zľavy na tovar pre deti sú "riedené" kupónmi pre iné výrobky tak, aby ponuky na nákup postieľky alebo plienky nevyzerali príliš obsessive.

Dokonca aj vládne oddelenia našli spôsob, ako používať veľké dátové technológie na optimalizáciu volebných kampaní. Niektorí veria, že víťazstvo B. Obamu v amerických prezidentských voľbách v roku 2012 je spôsobené vynikajúcou prácou svojich analytikov tímu, ktoré sa ošetreli obrovské dátové polia v pravom kľúči.

5 Veľké údaje o stráži zákona a poriadku


Za posledných niekoľko rokov sa štruktúry presadzovania práva podarilo zistiť, ako a kedy použiť veľké údaje. Známej skutočnosti je, že Národná bezpečnostná agentúra uplatňuje veľké technológie dát, aby sa zabránilo teroristickým činom. Ostatné oddelenia používajú progresívnu metodiku, aby sa zabránilo menším trestným činom.

Uplatňuje sa policajný oddelenie Los Angeles. Zaoberá sa tým, čo sa bežne používa proaktívnu ochranu presadzovania práva. Používanie správ zločinu na určité časové obdobie, algoritmus definuje oblasti, v ktorých je najväčšia pravdepodobnosť spáchania priestupkov. Systém poznamenáva takéto stránky na mape mestá v malých červených štvorcoch a tieto údaje sa okamžite prenášajú na hliadkové stroje.

Policajt chicago použite veľkú dátovú technológiu Malým spôsobom. Strážcovia presadzovania práva z mesta vetry sú tiež, ale je zamerané na vypúšťanie "rizikového kruhu", pozostávajúce z ľudí, ktorí môžu byť obeťou alebo členom ozbrojeného útoku. Podľa novín New York Times, tento algoritmus priradí osobu posúdenie zraniteľnosti na základe svojej trestnej minulosti (zatknutia a účasť na prestrelkoch, patriacich k zločinným skupinám). Vývojár systému zaručuje, že zatiaľ čo systém študuje trestnú minulosť osoby, neberie do úvahy sekundárne faktory, ako je rasa, pohlavie, etnický pôvod a umiestnenie človeka.

6 Ako veľké dátové technológie pomáhajú rozvíjať mestá


Benám Generálny riaditeľ Joao Baros demonštruje sledovaciu mapu Wi-Fi-Routers v autobusoch mesta Porto

Analýza údajov sa používa aj na zlepšenie viacerých aspektov životne dôležitej činnosti miest a krajín. Napríklad, presne, ako a kedy používať veľké dátové technológie, môžete optimalizovať dopravné toky. Na tento účel sa analyzujú pohyb automobilov online, sociálne médiá a meteorologické údaje. V súčasnosti niekoľko miest absolvoval kurz o používaní analýzy údajov s cieľom spojiť dopravnú infraštruktúru s inými typmi verejných služieb v jednom celom svete. Toto je koncepcia "Smart" mesto, v ktorom autobusy čakajú na neskorý vlak, a semafory sú schopné predpovedať cestovnú jazdu, aby minimalizovali dopravné zápchy.

Na základe technológie veľkých údajov v meste Long Beach, "inteligentné" vodomery pracujú, ktoré sa používajú na obmedzenie nelegálneho zavlažovania. Predtým boli aplikované na zníženie spotreby vody súkromnými domácnosťami (maximálny výsledok je zníženie o 80%). Úspora sladkej vody - otázka je vždy otázkou. Zvlášť, keď štát zažíva najzávažnejšie sucho, ktoré boli nikdy stanovené.

Zoznam tých, ktorí používajú veľké údaje, sa pripojili k zástupcom Ministerstva dopravy Los Angeles. Na základe údajov získaných z cestných kamierových snímačov, úrady produkujú kontrolu nad semaformi, čo vám umožní nastaviť prevádzku. Pod kontrolou počítačového systému je v celom meste približne 4500 tisíc semaforov. Podľa oficiálnych údajov nový algoritmus pomohol znížiť preťaženie o 16%.

7 Pokrok motora v marketingu a predaji


V marketingu vám veľké dátové nástroje umožňujú odhaliť, provízie myšlienky na jednej alebo inej fáze predajného cyklu je najefektívnejšia. Pomocou analýzy dát je určená, ako investície sú schopné zlepšiť systém riadenia zákazníkov, ktorý by mal byť vybraný na zvýšenie konverzného faktora a ako optimalizovať životný cyklus klienta. V podnikaní súvisiace s Cloudovými technológiami sa veľké dátové algoritmy používajú na to, ako minimalizovať cenu prilákania klienta a zvýšiť životný cyklus.

Diferenciácia cenových stratégií V závislosti od intrasystému zákazníka je to pravdepodobne hlavná vec, pre ktorú sa používajú veľké údaje v marketingu. McKinsey zistil, že približne 75% príjmov priemernej spoločnosti predstavuje základné produkty, z ktorých 30% sú nesprávne ceny. Zvýšenie ceny 1% vedie k zvýšeniu prevádzkového zisku o 8,7%.

Forresterovská výskumná skupina sa podarilo určiť, že analýza údajov umožňuje obchodníkom zamerať sa na to, ako splniť vzťahy so zákazníkmi. Skúmanie smeru rozvoja klientov, odborníci môžu odhadnúť úroveň lojality, ako aj rozšíriť životný cyklus v kontexte konkrétnej spoločnosti.

Optimalizácia predajných stratégií a etáp vstupu nových trhov s použitím geoanalitiky sa zobrazuje v biofarmaceutickom priemysle. Podľa McKinsey sú spoločnosti zaoberajúce sa výrobou liekov v priemere od 20 do 30% na spravovanie a predanú správu. Ak sa podniky spustia aktívnejší použite veľké údajeNa určenie najziskovejších a rýchlo rastúcich trhov budú výdavky okamžite znížené.

Analýza údajov je prostriedkom na získanie úplného pohľadu na kľúčové aspekty ich podnikania. Zvýšené príjmy, zníženie nákladov a znižovanie pracovného kapitálu sú tieto tri úlohy, ktoré sa moderné podnikanie snaží riešiť pomocou analytických nástrojov.

Nakoniec, 58% marketingových riaditeľov zabezpečuje, že implementácia veľkých dátových technológií môže byť sledovaná v optimalizácii pre vyhľadávače (SEO), e-mailom a mobilným marketingu, kde analýza údajov hrá najvýznamnejšiu úlohu pri vytváraní marketingových programov. A len o 4% menej respondentov sú presvedčení, že veľké údaje budú zohrávať významnú úlohu vo všetkých stratégiách na trh počas dlhých rokov.

8 Analýza údajov o rozsahu planéty

Nie menej zvedavé. Je možné, že je to stroj-učenie, ktoré bude konečne jediná sila schopná udržať krehkú rovnováhu. Téma ľudského vplyvu na globálne otepľovanie stále spôsobuje veľa sporov, takže len spoľahlivé prediktívne modely založené na veľkom množstve údajov môžu poskytnúť presnú odpoveď. V konečnom dôsledku nám pomôže pokles emisií všetkých: budeme tráviť menej energie.

Teraz veľké údaje nie sú abstraktné koncepcie, ktoré možno nájsť svoje použitie za pár rokov. Ide o úplne pracovný súbor technológií, ktoré môžu mať prospech v takmer všetkých oblastiach ľudskej činnosti: z ochrany medicíny a verejného poriadku na marketing a predaj. Krok aktívnej integrácie veľkých údajov do nášho každodenného života začal, a kto vie, čo bude úlohou veľkých údajov za pár rokov?

Veľké dáta.- Angličtina "Veľké dáta". Termín sa prejavil ako alternatíva k DBMS a stala sa jedným z hlavných trendov IT infraštruktúry, keď väčšina obvitacích priemyslu - IBM, Microsoft, HP, Oracle a iní začali používať tento koncept v ich stratégiách. Pod veľkým údajom pochopte obrovské (stovky terabyte) rad údajov, ktoré nemôžu byť spracované tradičnými spôsobmi; Niekedy - nástroje a metódy spracovania týchto údajov.

Príklady veľkých zdrojov údajov: RFID udalosti, komunikácia v sociálnych sieťach, meteorologické štatistiky, informácie o umiestnení odberateľov mobilných mobilných sietí a dát z audio / video rekordérov. Preto sa "veľké dáta" široko používajú vo výrobe, zdravotnej starostlivosti, verejnej správe, internetovom podnikaní - najmä pri analýze cieľovej skupiny.

Charakteristický

Známky veľkých údajov sú definované ako "TROJE V": Hlasitosť - objem (naozaj veľký); Odroda - heterogénnosť, sada; Rýchlosť - rýchlosť (potreba veľmi rýchleho spracovania).

Veľké údaje sú najčastejšie neštruktúrované a na ich spracovanie sú potrebné špeciálne algoritmy. Metódy analýzy veľkých údajov zahŕňajú:

  • ("Ťažba dát") - komplex prístupov k odhaleniu skrytých užitočných poznatkov, ktoré nemožno získať štandardnými metódami;
  • Crowdsourcing (dav - "vraca", získavanie - použitie ako zdroj) - riešenie významných úloh so všeobecným úsilím dobrovoľníkov, ktorí nie sú v povinnej pracovnej zmluve a vzťahy koordinujúce činnosti s využitím nástrojov IT;
  • Dátová fúzia a integrácia ("miešanie a implementácia údajov") - súbor metód pripojenia množstva zdrojov ako súčasť hlbokej analýzy;
  • Strojové vzdelávanie ("strojový tréning") - pododdiel výskumu umelého spravodajstva, ktorý štúdie metódy využívania štatistickej analýzy a získanie predpovedí na základe základných modelov;
  • rozpoznávanie obrazu (napríklad rozpoznávanie tváre v hľadáčiku fotoaparátu alebo kamkordéra);
  • priestorová analýza - použitie topológie, geometrie a geografia na výstavbu dát;
  • vizualizácia dát je výstup analytických informácií vo forme ilustrácií a grafov pomocou interaktívnych nástrojov a animácií sledovať výsledky a výstavbu nadácie pre ďalšie monitorovanie.

Skladovanie a analýza informácií sa vykonáva na veľkom počte vysoko výkonných serverov. Kľúčovou technológiou je prevrat, open source.

Vzhľadom k tomu, množstvo informácií v čase sa zvýši, zložitosť nie je získať údaje, ale ako ich spracovať s maximálnym prínosom. Vo všeobecnosti proces práce s veľkými údajmi zahŕňa: zhromažďovanie informácií, jeho štruktúrovanie, vytváranie pohľadov a kontextov, vypracovanie odporúčaní pre činnosť. Ešte pred prvou etapou je dôležité jasne definovať cieľ práce: aké presne sú potrebné údaje, napríklad definícia cieľového publika produktu. V opačnom prípade existuje riziko získania mnohých informácií bez pochopenia toho, ako konkrétne môže byť použitý.

Predpovedalo sa, že celkový globálny objekt vytvorených a replikovaných údajov v roku 2011 môže predstavovať približne 1,8 satta (1,8 bilióna GIGABYTE) - Asi 9-krát viac ako to, čo bolo vytvorené v roku 2006.

Komplexná definícia

Avšak ` veľké dáta`Pozvite viac ako len analýzu obrovských informácií. Problém nie je, že organizácie vytvárajú obrovské množstvo údajov av skutočnosti, že väčšina z nich sú prezentované vo formáte, zle relevantné pre tradičný štruktúrovaný databázový formát - to sú webové protokoly, videozáznamy, textové dokumenty, strojový kód, alebo , Napríklad geopriestorové údaje. To všetko je uložené v mnohých rôznych archívoch, niekedy aj mimo organizácie. Výsledkom je, že spoločnosť môže mať prístup k obrovskému množstvu ich údajov a nemá požadované nástrojeZriadiť vzťahy medzi týmito údajmi a založené na nich významné závery. Pridajte tu skutočnosť, že údaje sú teraz aktuálne a častejšie aktualizované a dostanete situáciu, v ktorej sa dostanete tradičné metódy analýzy informácií, ktoré nemôžu ovplyvniť obrovské množstvo neustále aktualizovaných údajov, ktoré nakoniec a otvárajú cestné technológie veľké údaje.

Najlepšia definícia

V podstate, koncepcia veľké údaje To znamená prácu s informáciami o obrovskom objeme a rôznym zložením, veľmi často aktualizovaný a nachádzajúci sa v rôznych zdrojoch s cieľom zvýšiť efektívnosť práce, vytváranie nových produktov a zvýšenie konkurencieschopnosti. Poradenská spoločnosť FORRESTER poskytuje krátke znenie: ` Veľké dáta Kombinovať techniky a technológie, ktoré odstránia význam údajov o extrémnom limite praktickosti ".

Aký veľký je rozdiel medzi obchodnými analýzami a veľkými údajmi?

CRAIG BATI, výkonný riaditeľ marketingu a riaditeľa technológií Fujitsu Austrálie, uviedol, že obchodná analýza je popisný proces na analýzu výsledkov dosiahnutých podnikmi v určitom časovom období medzitým ako rýchlosť spracovania veľké údaje Umožňuje vykonať analýzu prediktívne, schopný ponúknuť obchodné odporúčania do budúcnosti. Veľká dátová technológia vám tiež umožní analyzovať viac typov údajov v porovnaní s nástrojmi Business Analytics, čo umožňuje zamerať nielen na štruktúrované skladovacie zariadenia.

Matt Slocum z O "Reilly Radar verí, že hoci veľké dáta A obchodní analytici majú rovnaký cieľ (hľadať odpovede na otázku), odlišujú sa od seba v troch aspektoch.

  • Veľké údaje sú navrhnuté tak, aby zvládli významnejšie množstvo informácií ako obchodný analytik, a to samozrejme zodpovedá tradičnej definícii veľkých údajov.
  • Veľké údaje sú určené na rýchlejšie spracovanie a meniace sa informácie, čo znamená hlboký výskum a interaktivita. V niektorých prípadoch sa výsledky vytvárajú rýchlejšie ako načítaná webová stránka.
  • Veľké údaje sú určené na spracovanie neštruktúrovaných údajov, ktorých metódy používania začneme študovať len po tom, ako dokážu vytvoriť ich zber a skladovanie, a potrebujeme algoritmy a možnosť dialógu s cieľom uľahčiť vyhľadávanie trendov obsiahnutých v týchto poliach.

Podľa Bielej knihy zverejnenej spoločnosti Oracle `Oracle Information Architecture: Architect's Guide for Big Data.

Práca s veľkými údajmi nie je podobná procesu obvyklého obchodného spravodajstva, kde jednoduchý pridanie známych hodnôt prináša výsledok: napríklad výsledok pridania platených účtov sa stáva objemom predaja za rok. Pri práci s veľkými údajmi sa výsledok získa v procese čistenia ich postupným modelovaním: najprv sa predpokladá, že je postavená štatistická, vizuálna alebo sémantická model, lojalita k hypotézam rozšírená jeho základňa sa skontroluje a potom Ďalej sa predkladá. Tento proces vyžaduje výskumného pracovníka alebo interpretácie vizuálnych hodnôt alebo zostavovanie interaktívnych dotazov založených na vedomostiach, alebo vývoj adaptívnych algoritmov "strojového tréningu, ktorý je schopný získať požadovaný výsledok. A životnosť takéhoto algoritmu môže byť dosť krátka.

Metódy analýzy veľkých údajov

Existuje mnoho rôznych metód na analýzu dátových polí, ktoré sú založené na nástrojoch požičaných zo štatistík a počítačovej vedy (napríklad strojového vzdelávania). Zoznam nepredstiera, že je úplný, ale odráža prístupy najnáročnejšie v rôznych priemyselných odvetviach. Zároveň by sa malo zrejmé, že výskumníci naďalej pracujú na vytváraní nových techník a zlepšovania existujúcich. Okrem toho niektoré z týchto metód nie sú nevyhnutne aplikované výlučne na veľké dáta a môžu byť úspešne použité pre menšie polia (napríklad testovanie A / B, regresná analýza). Samozrejme, že sa analyzuje viac všeobecného a diverzifikovaného poľa, presnejšie a relevantné údaje možno získať na výstupe.

Testovanie A / B. Technika, v ktorej je kontrolná vzorka striedavo v porovnaní s ostatnými. Je teda možné identifikovať optimálnu kombináciu ukazovateľov, aby sa dosiahla napríklad najlepšia reakcia spotrebiteľov na marketingovú ponuku. Veľké dáta Umožnite vám stráviť obrovské množstvo iterácií, a tak získať štatisticky spoľahlivý výsledok.

Asociácia Pravidlo Učenie. Súbor techník na identifikáciu vzťahov, t.j. Associatívne pravidlá medzi premennými vo veľkých dátových poliach. Použité B. Údaje baníctvo..

Klasifikácia. Súbor techník, ktoré vám umožní predpovedať správanie spotrebiteľov v konkrétnom segmente trhu (pri rozhodovaní o kúpe, odtoku, objem spotreby atď.). Použité B. Údaje baníctvo..

Analýza klastra.. Štatistická metóda klasifikácie objektov podľa skupín detekciou neznámych spoločných prvkov. Použité B. Údaje baníctvo..

Crowdsourcing.. Metódy zberu údajov z veľkého počtu zdrojov.

Dátová fúzia a integrácia údajov. Súbor techník, ktoré vám umožní analyzovať pripomienky používateľov sociálnych sietí a porovnanie s výsledkami predaja v reálnom čase.

Údaje baníctvo.. Súbor techník, ktoré vám umožní určiť najcitlivejšie pre postupné produkty alebo kategóriu služieb spotrebiteľov, identifikujú vlastnosti najúspešnejších zamestnancov, predpovedajú správanie modelu spotrebiteľov.

Ensemble Učenie. V tejto metóde sa na úkor, z ktorých sa uskutočnilo kvalita predpovedí.

Genetické algoritmy.. V tejto technike možné riešenia Predstavujú vo forme `chromozóm ', ktorý môže byť kombinovaný a vzájomne sa. Rovnako ako v procese prirodzeného evolúcie, najviac prispôsobený individuálne prežije.

Stroje. Smer v počítačovej vede (historicky meno " umela inteligencia"), Ktorý sleduje cieľ vytvoriť algoritmy samoštúdia na základe analýzy empirických údajov.

Spracovanie prirodzeného jazyka. (NLP.). Sada požičaných z počítačových vedeckých a lingvistikov na uznanie prirodzeného jazyka osoby.

Sieťová analýza. Súbor metód analýzy odkazov medzi uzlami v sieťach. S ohľadom na sociálne siete vám umožní analyzovať vzťah medzi jednotlivými užívateľmi, spoločnosťami, spoločenstvami atď.

Optimalizácia. Nasadiť sa numerické metódy Pre redesign komplexné systémy a procesy na zlepšenie jedného alebo viacerých ukazovateľov. Pomáha pri vytváraní strategických rozhodnutí, napríklad zloženie trhu produktový vládcov, Vykonávajte investičnú analýzu a tak ďalej.

Rozpoznávanie vzorov. Súbor techník s vlastným vzdelávacími prvkami na predpovedanie modelu správania spotrebiteľa.

Prediktívne modelovanie. Metódy, ktoré vám umožňujú vytvoriť matematický model Pred daným pravdepodobným scenárom pre rozvoj udalostí. Napríklad analýza databázy CRM pre prípadné podmienky, ktoré predplatia budú vyzvaní na zmenu poskytovateľa.

Regresia. Súbor štatistických metód na identifikáciu vzorov medzi zmenou závislej premennej a jednej alebo viacerých nezávislých. Často sa používa na prognózovanie a predpovede. Používané v ťažbe dát.

Analýza sentimentu. Metódy hodnotenia Consumer Sentiment sú založené na technikách rozpoznávania ľudských jazykov. Umožňujú, aby ste sa vytiahli zo všeobecného informačný tok Správy týkajúce sa predmetu záujmu (napríklad spotrebiteľským výrobkom). Ďalej odhadnúť polaritu úsudku (pozitívny alebo negatívny), stupeň emocionality, a tak ďalej.

Spracovanie signálu.. Požičané z rádiového inžinierstva súbor techník, ktoré sleduje cieľový uznávanie cieľa proti pozadia hluku a jeho ďalšej analýzy.

Priestorová analýza. Súbor čiastočne vypožičaných zo štatistických metód na analýzu priestorových údajov - topológie terénu, geografických súradníc, geometrie objektov. Zdroj veľké údaje V tomto prípade sa geografické informačné systémy často vykonávajú (GIS).

  • Revolúcia Analytics (na základe Rnižnice R pre podložku.

Zvláštny záujem o tento zoznam predstavuje Apache Hadoop - Open Source, ktorý v posledných piatich rokoch bol testovaný ako analyzátor údajov väčšinou zdieľaných akcií. Akonáhle Yahoo otvoril kód Hadop s Open Source Community, celý smer na vytváranie produktov založených na Hadoop sa objavil v IT priemysle. Takmer všetky moderné prostriedky analýzy veľké údaje Poskytnite integračné nástroje s HOWOOP. Ich vývojári pôsobia ako začínajúce a známe svetové spoločnosti.

Riešenia pre správu veľkých údajov

Veľké dátové platformy (BDP, veľká dátová platforma) ako prostriedok na boj proti digitálnym koore

Schopnosť analyzovať veľké dáta, V prekvapení nazývaných veľké údaje, vnímané ako dobré a určite. Ale je to naozaj? Čo môže Ramantná akumulácia údajov? S najväčšou pravdepodobnosťou skutočnosť, že domáci psychológovia vo vzťahu k človeku sa nazývajú patologické skladovanie, silhloromicia alebo obrazne "Plushkin syndróm". V angličtine, začarovaná vášeň zbierať všetko v rade sa nazýva lemovanie (z anglického hromadu - "akcie"). Podľa klasifikácie duševných chorôb sa chorodovanie počíta na duševné poruchy. Digitálne hromadenie (digitálne hromadenie) sa pridáva do digitálnej éry, môžu trpieť jednotlivými identitami aj celými podnikmi a organizáciami ().

Svetový a ruský trh

Veľká dátová krajina - Hlavné dodávatelia

Záujem o nástroje na zber, spracovanie, správu a analýzu veľké údaje Vystavené všetky vedúce IT spoločnosti, ktoré sú celkom prirodzené. Po prvé, priamo čelia tomuto fenoméne vo vlastnom podnikaní, po druhé, veľké dáta Otvorte vynikajúce možnosti pre rozvoj nových výklenkov na trhu a prilákať nových zákazníkov.

Na trhu sa objavilo veľa spustení, ktoré robí podnikanie o spracovaní obrovských súborov údajov. Niektoré z nich používajú hotovú cloudovú infraštruktúru poskytovanú hlavnými hráčmi ako Amazon.

Teória a prax veľkých údajov v priemyselných odvetviach

História rozvoja

2017

Tmaxsoft Predpoveď: Ďalej "vlna" veľké dáta si vyžadujú aktualizáciu DBMS

Podniky sú známe, že v ich nahromadených obrovských množstvách údajov obsahujú dôležitá informácia o ich podnikaní a zákazníkov. Ak spoločnosť môže úspešne použiť tieto informácie, potom bude mať významnú výhodu v porovnaní s konkurentmi, a to bude môcť ponúknuť to najlepšie ako oni, produkty a služby. Mnohé organizácie však stále nemôžu účinne používať veľké dáta Vzhľadom k tomu, že ich zdedená IT infraštruktúra nie je schopná poskytnúť potrebnú kapacitu skladovacích systémov, výmena procesov, nástrojov a aplikácií potrebných na spracovanie a analýzu veľkých polí neštruktúrovaných dát na získanie cenných informácií z nich uvedených v Tmaxsoft.

Okrem toho zvýšenie kapacity procesora potrebného na analýzu neustáleho zvyšovania objemu údajov môže vyžadovať významné investície do zastaranej IT infraštruktúry organizácie, ako aj ďalšie zdroje podpory, ktoré by sa mohli použiť na rozvoj nových aplikácií a služieb.

Dňa 5. februára 2015 Biely dom vydal správu, v ktorej bola otázka diskutovaná ako veľké dáta»Zaviesť rôzne ceny pre rôznych kupujúcich - prax známy ako" cenovej diskriminácie "alebo" diferencované ceny "(personalizované ceny). Správa opisuje výhodu "veľkých údajov" pre predajcov aj kupujúcich, a jeho autori dospeli k záveru, že mnohé problematické otázky vyplývajúce z príchodu veľkých údajov a diferencovaných cien možno vyriešiť v rámci existujúcich právnych predpisov o antidiskriminácii a Zákony Ochrana práv spotrebiteľov.

Správa poznamenáva, že v tomto čase existujú len individuálne skutočnosti, ktoré uvádzajú, ako spoločnosti využívajú veľké údaje v kontexte individuálneho marketingu a diferencovaného oceňovania. Tieto informácie ukazujú, že predajcovia používajú metódy oceňovania, ktoré možno rozdeliť do troch kategórií:

  • Štúdium krivky dopytu;
  • Usmernenie (riadenie) a diferencované ceny založené na demografických údajoch; a
  • cieľový behaviorál marketing (behaviorálna zacielenie - zacielenie správania) a individualizované ceny.

Štúdium CurveS cieľom objasniť dopyt a štúdium správania spotrebiteľov, obchodníci často vykonávajú experimenty v tejto oblasti, počas ktorého jeden z dvoch možných cenových kategórií je náhodne vymenovaný klientmi. "Technicky, tieto experimenty sú formou diferencovaných cien, pretože ich dôsledok sa stáva rôznymi cenami zákazníkov, aj keď sú" nediskriminačné "v tom zmysle, že všetci zákazníci majú pravdepodobnosť" dostať "za vyššiu cenu toho istého "

Riadenie): Toto je prax prezentácie výrobkov spotrebiteľom na základe ich príslušnosti do konkrétnej demografickej skupiny. Teda webová stránka počítačovej spoločnosti môže ponúknuť rovnaký notebook s rôznymi typmi zákazníkov za rôznych cenách, vyrovnané na základe informácií, ktoré uviedli (napríklad v závislosti od toho, či tento užívateľ Zástupca štátnych orgánov, vedeckých alebo obchodných inštitúcií alebo súkromnou osobou) alebo z ich geografickej polohy (napríklad definovanej IP adresa počítača).

Cieľový marketing a individualizované ceny: V týchto prípadoch sa osobné údaje kupujúcich používajú na cielené reklamy a prispôsobené ceny určitých produktov. Napríklad, online inzerenti používajú zozbierané reklamnými sieťami a prostredníctvom cookies tretích strán údajov o činnosti používateľov na internete s cieľom zamerať sa na odoslanie svojich propagačných materiálov. Takýto prístup, na jednej strane, umožňuje spotrebiteľom prijímať reklamu na tovar a služby pre nich, ale môže spôsobiť obavy tých spotrebiteľov, ktorí nechcú určité druhy svojich osobných údajov (napr. Návšteva stránok súvisiace s lekárskymi a finančnými otázkami) boli zhromaždené bez ich súhlasu.

Hoci cieľový marketing behaviorálneho marketingu je rozšírený, v online prostredí je relatívne málo dôkazov o individualizovanom oceňovaní. V správe sa naznačuje, že to môže byť spôsobené tým, že sa stále vyvíjajú zodpovedajúce metódy, alebo so skutočnosťou, že spoločnosti nie sú ponáhľaní používať individuálne ceny (alebo uprednostňujú chválu) - možno sa obávajú negatívnej reakcii spotrebiteľov.

Autori správy veria, že "pre individuálneho spotrebiteľa je využívanie veľkých údajov nepochybne z dôvodu možného návratu a rizík." Uznávajúc, že \u200b\u200bpri využívaní veľkých údajov sa objavia problémy transparentnosti a diskriminácie, správa zároveň tvrdí, že existujúce antidiskriminačné zákony a zákony o ochrane spotrebiteľa sú dostatočné na ich vyriešenie. Správa však tiež zdôrazňuje potrebu "nepretržitého monitorovania" v prípadoch, keď spoločnosti používajú dôverné informácie Opatrne, buď metódy, ktoré nie sú zahrnuté do existujúceho regulačného rámca.

Táto správa je pokračovaním úsilia Bieleho domu študovať používanie "veľkých údajov" a diskriminačné ceny na internete a príslušné dôsledky pre amerických spotrebiteľov. Skoršie sa už uvádza, že pracovná skupina Bieleho domu pre veľké údaje zverejnil svoju správu o tejto otázke v máji 2014. Spolková provízia pre obchod (FTC) tiež tieto otázky počas seminára v seminári o diskriminácii v septembri 2014 v septembri 2014 v dôsledku používania veľkých údajov.

2014

Gartner rozptýli mýty o "veľkých údajoch"

V analytickej poznámke na jeseň roka 2014 Gartner uviedol niekoľko mýtov spoločných medzi IT manažérmi o veľkých údajoch a ich vyvrátenie.

  • Každý implementuje veľké systémy na spracovanie dát rýchlejšie ako my

Záujem o väčšie dátové technológie sa zaznamenávajú: 73% organizácií skúmaných analytikmi Gartner v tomto roku už investuje do príslušných projektov alebo sa zbierajú. Väčšina z týchto iniciatív je však stále v najskorších štádiách, a len 13% respondentov už takéto riešenia implementovalo. Najťažšou vecou je určiť, ako získať príjem z veľkých údajov, rozhodnúť, kde začať. Mnohé organizácie sú uviaznuté v pilotnom štádiu, pretože nemôžu viazať novú technológiu na špecifické obchodné procesy.

  • Máme toľko údajov, že nie je potrebné sa starať o malé chyby v nich

Niektorí manažéri IT sa domnievajú, že malé chyby v údajoch neovplyvňujú celkové výsledky analýzy obrovských objemov. Ak existuje veľa údajov, každá chyba samostatne má menej vplyvov na výsledok, značku analytikov, ale tiež sa stáva viac. Okrem toho je väčšina analyzovaných údajov externá, neznáma štruktúra alebo pôvod, takže pravdepodobnosť chýb rastie. Vo svete veľkých údajov je teda kvalita skutočne dôležitejšia.

  • Veľká dátová technológia zruší potrebu integrovať dáta

Veľké údaje sľubujú schopnosť spracovať dáta v pôvodnom formáte s automatickou tvorbou okruhu, ako je čítané. Predpokladá sa, že to umožní analyzovať informácie z rovnakých zdrojov pomocou viacerých dátových modelov. Mnohí sa domnievajú, že to tiež umožní koncovým používateľom interpretovať akýkoľvek súbor údajov podľa vlastného uváženia. V skutočnosti väčšina používateľov často potrebuje tradičný spôsob s hotovou schémou, keď sú údaje naformátované, a existujú dohody o úrovni integrity a ako by sa mala vzťahovať na používanie skriptu.

  • Dátový sklad nemá zmysel používať pre komplexnú analýzu

Mnohí administrátori systémov správy informácií sa domnieva, že nemá zmysel tráviť čas vytváraním dátového skladu, pričom sa zohľadní, že komplexné analytické systémy používajú nové typy údajov. V skutočnosti, v mnohých systémoch komplexného analýzy využíva informácie z ukladania údajov. V iných prípadoch musia byť navyše pripravené nové typy údajov na analýzu vo veľkých systémoch spracovania údajov; Je potrebné rozhodnúť o vhodnosti údajov, princípy agregácie a potrebnú úroveň kvality - takýto prípravok sa môže vyskytnúť mimo úložiska.

  • Dátové jazerá prídu na zmenu zariadení na ukladanie údajov

V skutočnosti sú dodávatelia zavádzajúce zákazníci, umiestnite dátové jazerá (dátové jazero) ako nahradenie skladovacích zariadení alebo ako kritické prvky analytickej infraštruktúry. Základné technológie jazier údajov nemajú splatnosť a zemepisnú šírku funkčnosti, ktoré sú obsiahnuté v skladovacích zariadeniach. Preto vedúci predstavitelia zodpovední za správu údajov by mali počkať, kým sa jazerá nedosiahnu rovnakú úroveň vývoja, verte v Gartner.

Accenture: 92% implementačného systému veľkých údajov je spokojný s výsledkom

Medzi hlavné výhody veľkých údajov, respondentizovali:

  • "Hľadanie nových zdrojov príjmu" (56%),
  • "Zlepšenie skúseností so zákazníkmi" (51%),
  • "Nové produkty a služby" (50%) a
  • "Prílivom nových zákazníkov a zachovanie staršej lojality" (47%).

V zavedení nových technológií, mnohé spoločnosti čelia tradičným problémom. Pre 51% nárazový blok bol bezpečnosť bezpečnosti, pre 47% - rozpočet na 41% - nedostatok potrebných rámov a 35% - zložitosť pri integrácii existujúci systém. Takmer všetky skúmané spoločnosti (asi 91%) plánujú vyriešiť problém s nedostatkom personálu a prenajímateľom špecialistov z veľkých údajov.

Spoločnosti optimistické hodnotí budúce technológie veľkých údajov. 89% verí, že budú meniť obchod takľou internetom. 79% respondentov poznamenalo, že spoločnosti, ktoré nemajú veľké údaje, stratia konkurenčnú výhodu.

Respondenti sa však zaoberali názorom, že to stojí za to byť veľké. 65% respondentov sa domnieva, že ide o "veľké dátové karty", 60% sú presvedčení, že je to "Rozšírená analýza a analýza" a 50% je, že ide o "údaje vizualizačných nástrojov".

Madrid strávi 14,7 mil. EUR na riadenie veľkých údajov

V júli 2014 sa stalo známe, že Madrid by využil veľké dátové technológie na riadenie mestskej infraštruktúry. Náklady na projekt je 14,7 mil. EUR, základom realizačných riešení budú technológie na analýzu a riadenie veľkých údajov. Pomocou ich pomoci bude mestská administratíva riadiť prácu s každým poskytovateľom služieb a zaplatiť ju v závislosti od úrovne služieb.

Hovoríme o dodávateľoch správy, ktoré nasleduje stav ulíc, osvetlenie, zavlažovanie, zelené výsadby, vykonávajú čistenie územia a vývozu, ako aj spracovanie odpadu. Počas projektu bolo pre špeciálne vybraných inšpektorov vyvinutých 300 kľúčových ukazovateľov výkonnosti mestských služieb, na základe ktorých sa denne vykoná 1,5 tis. Rôzne kontroly a merania. Okrem toho, mesto začne používať inovatívnu technologickú platformu s názvom Madrid Inteligentte (Mint) - Smart Madrid.

2013

Odborníci: Módny vrchol na veľkých údajoch

Každý bez výnimky pre dodávateľa na trhu riadenia údajov v tomto čase, technológie vyvíjajú technológie pre veľké riadenie dát. Tento nový technologický trend je tiež aktívne diskutovaný profesionálnym spoločenstvom, vývojármi aj odvetvovými analytikmi a potenciálnymi spotrebiteľmi takýchto riešení.

Ako zistil, že Datashift zistil, od januára 2013, vlna diskusií okolo " veľké údaje"Prekročili všetky predstaviteľné veľkosti. Po analýze počtu zmien veľkých údajov o sociálnych sieťach bol datashift vypočítaný, že v roku 2012 tento termín bol použitý približne 2 miliardy krát v príspevkoch vytvorených asi 1 milión rôznych autorov na celom svete. To je ekvivalentné 260 príspevkov za hodinu, s vrcholom odkazov predstavoval 3070 referencií za hodinu.

Gartner: Každý druhý IT riaditeľ je pripravený utrácať peniaze na veľké dáta

Po niekoľkých rokoch experimentov s veľkými dátovými technológiami a prvými implementáciami v roku 2013 sa prispôsobenie takýchto rozhodnutí výrazne zvýši, predpovedal v Gartner. Výskumníci vypočúvali IT LEADERS na celom svete a zistili, že 42% respondentov už investovalo do veľkých dátových technológií alebo plán na vykonanie takýchto investícií do budúceho roka (údaje na marec 2013).

Spoločnosti sú nútení stráviť peniaze na technológiu spracovania. veľké údajeKeďže informačná krajina sa rýchlo mení, náročné nové prístupy k spracovaniu informácií. Mnohé spoločnosti si už uvedomili, že sú kritické veľké dátové polia a práca s nimi umožňuje dosiahnuť výhody, ktoré nie sú k dispozícii pri použití tradičných zdrojov informačných a spracovateľských metód. Okrem toho, trvalá povinnosť k téme "veľkých dát" v médiách je záujem o relevantné technológie.

Frank Buytendijk, viceprezident Gartner, dokonca vyzval spoločnosť na zmiernenie prachu, pretože niektoré sa obávajú, že zaostávajú za konkurentmi vo vývoji veľkých údajov.

"Nie je potrebné sa obávať príležitosť na implementáciu nápadov na základe" veľkých dát "technológie sú v skutočnosti nekonečné," povedal.

Podľa Gartner, do roku 2015, 20% globálnych 1000 zoznam spoločností bude mať strategické zameranie na "infraštruktúru".

V očakávaní nových funkcií, ktoré s nimi prinesú technológiu spracovania "Veľké údaje", teraz mnoho organizácií organizujú proces zhromažďovania a skladovania rôznych druhov informácií.

Pre vzdelávacie a vládne organizácie, ako aj priemyselné spoločnosti, najväčší potenciál pre obchodnú transformáciu je položená v kombinácii akumulovaných údajov s tzv. Tmavými dátami (doslova "tmavé dáta"), tieto správy zahŕňajú správy e-mail, Multimédiá a iný podobný obsah. Podľa Gartner, to je tí, ktorí sa naučia, ako zvládnuť údaje z najreobýchových zdrojov informácií.

Cisco Survey: Veľké údaje pomôžu zvýšiť rozpočet IT

Počas štúdie (jar 2013), s názvom Cisco pripojená Svetová technológia správa, ktorá sa uskutočnila v 18 krajinách nezávislou analytickou spoločnosťou InsightExpress, 1800 vysokoškolskí študenti boli vypočutí a rovnaký počet mladých profesionálov vo veku od 18 do 30 rokov. Prieskum bol vykonaný, aby zistil úroveň pripravenosti IT oddelení na realizáciu projektu Veľké dáta. a získať predstavu o súvisiacich otázkach, technologických nedostatkoch a strategickej hodnote takýchto projektov.

Väčšina spoločností zhromažďuje, píše a analyzuje údaje. Avšak, správa hovorí, že mnohé spoločnosti v súvislosti s veľkými údajmi čelia mnohým problémom komplexných obchodných a informačných technológií. Napríklad 60% respondentov si uvedomuje, že veľké dátové riešenia môžu zlepšiť rozhodovacie procesy a zvýšiť konkurencieschopnosť, ale iba 28% vyhlásilo, že sa už získajú skutočné strategické výhody nahromadených informácií.

Viac ako polovica manažérov IT manažérov sa domnievajú, že veľké dátové projekty pomôžu zvýšiť rozpočty na IT v ich organizáciách, pretože budú zvýšené požiadavky na technológie, personálne a odborné zručnosti. V rovnakej dobe, viac ako polovica respondentov očakáva, že takéto projekty na zvýšenie rozpočtov na IT v ich spoločnostiach už v roku 2012. 57% je presvedčený, že veľké údaje zvýšia svoje rozpočty v nasledujúcich troch rokoch.

81 Percento respondentov uviedlo, že všetky (alebo aspoň niektoré) veľké dátové projekty budú vyžadovať cloud computing. Tak, distribúcia technológia cloud Môže to ovplyvniť rýchlosť distribúcie veľkých dátových riešení a hodnôt týchto obchodných riešení.

Spoločnosti zbierajú a používajú údaje najviac odlišné typyako štruktúrované a neštruktúrované. Tu je z akého zdroja Údaje účastníkov prieskumu dostávajú (správa Cisco Concription Svetová technológia):

Takmer polovica (48 percent) IT manažérov predpovedá zdvojnásobenie zaťaženia v sieti v nasledujúcich dvoch rokoch. (Toto je obzvlášť charakteristické pre Čínu, kde je 68% respondentov a Nemecka dodržiavané v pohľade - 60%). 23 Percento respondentov čakalo na tribúne sieťového zaťaženia v nasledujúcich dvoch rokoch. Zároveň len 40 percent respondentov vyhlásilo svoju pripravenosť na výbušninu v sieti.

27 Percento respondentov uznalo, že potrebujú lepšie opatrenia týkajúce sa informačných a informačných opatrení.

21% musí expandovať šírku pásma.

Veľké údaje opotrebujú nové príležitosti pred oddeleniami, aby zvýšili hodnotu a tvorili úzky vzťah s obchodnými jednotkami, čo umožňuje zvýšiť príjem a posilniť finančnú pozíciu spoločnosti. Veľké dátové projekty, aby IT oddelenia so strategickým partnerom obchodných jednotiek.

Podľa 73% respondentov je IT oddelenie, ktoré sa stane hlavnou lokomotívou implementácie veľkej dátovej stratégie. Zároveň zvažujú respondentov, ostatné oddelenia sa budú pripojiť aj k implementácii tejto stratégie. V prvom rade sa týka oddelení financií (24% respondentov), \u200b\u200bvýskum (20%), funkčné (20%), inžinierstva (19%), ako aj marketingové oddelenia (15%) a predaj (14%) .

Gartner: Na zvládnutie veľkých údajov sú potrebné milióny nových pracovných miest.

Svetové IT náklady boli do roku 2013 dosiahli 3,7 miliardy dolárov, čo je 3,8% viac výdavkov na informačné technológie v roku 2012 (prognóza na konci roka je 3,6 miliardy USD). Segment veľké údaje (Veľké údaje) sa vyvíjajú oveľa vyššie sadzby, správa Gartner hovorí.

Do roku 2015 bude vytvorených 4,4 milióna pracovných miest v oblasti informačných technológií, aby slúžila na veľké údaje, z toho 1,9 milióna pracovných miest je v roku 2006. \\ T Okrem toho, každé takéto pracovisko bude znamenať vytvorenie troch ďalších pracovných miest mimo IT gule, takže len v Spojených štátoch v nasledujúcich štyroch rokoch bude človek pracovať na udržiavaní informačnej ekonomiky.

Podľa Gartner expertov je hlavným problémom, že v priemysle to nie je dostatok talentov: súkromný aj štátny vzdelávací systém, napríklad v Spojených štátoch, nie je schopný dodať priemyslu dostatočným počtom kvalifikovaných pracovníkov. Takže z uvedených nových pracovných miest v IT sa zabezpečí len jeden z troch.

Analytici sa domnievajú, že úloha maľby kvalifikovaných IT personálu by sa mala venovať priamo spoločnosti, ktorá ich potrebuje, pretože títo zamestnanci pre nich prenesú na nové informačné hospodárstvo budúcnosti.

2012

Prvý skepticizmus pre "veľké dáta"

Analytici vajíčok a gartnerových spoločností naznačujú, že pre módne v témach 2012 veľké údaje môže prísť čas oslobodenia od ilúzií.

Termín "veľké dáta", v tomto okamihu, spravidla označujú stále rastúce množstvo informácií prichádzajúcich v prevádzkovom spôsobe zo sociálnych médií, zo sietí senzorov a iných zdrojov, ako aj rastúcich rozsah nástrojov používaných na údaje spracovanie a identifikácia dôležitého podnikania na základe nich. - Útes.

"Vzhľadom k humbuku (alebo napriek tomu), pokiaľ ide o myšlienku veľkých údajov, výrobcovia v roku 2012 s veľkou nádejou sa na túto tendenciu pozreli na túto tendenciu," povedal Tony Bayer, vajíčkový analytik.

Bayer povedal, že DataSift vykonal retrospektívnu analýzu zmien o veľkých údajoch

Volkova Julia Sergeyená, 4. ročník študent, finančná univerzita pod vládou Ruská federácia, KALUGA BRANCH, KALUGA [Chránené e-mail]

Veľké údaje v modernom svete

Anotácia. Umenie sú venované zavedeniu veľkých dátových technológií v našej modernej spoločnosti. Hlavné charakteristiky veľkých údajov boli preskúmané, hlavné aplikácie, ako je banková guľa, maloobchod, súkromný a verejný sektor, a dokonca aj každodenný život. Štúdia odhalila nedostatky využívania veľkých dátových technológií. Potreba rozvíjať normatívnu reguláciu používania veľkých údajov je určená. Vitajte slová: veľké údaje, banky, bankové gule, maloobchod, súkromný sektor, verejný sektor.

Ako stupeň vyšetrovania finančných prostriedkov, technológie informačných technológií rôznych smerov moderná spoločnosť Požiadavky na ich adaptivity úloh oddanosti sa zvyšujú, čo naznačujú obrovské množstvo údajov. Tam sú takéto informácie, ktoré nemôžu byť spracované tradičnými metódami, vrátane štruktúrovaných údajov, médií a náhodných objektov. A ak sa s analýzou prvých existujúcich technológií dnes vyrovnáva s existujúcimi technológiami, potom analýza druhého a tretieho takmer zostáva neznesiteľná. Štúdie ukazujú, že objemy mediálnych jazykov, ako sú výsledky video sledovania, letecká fotografia, digitálne lekárske informácie a náhodné objekty uložené v mnohých archívoch a oblakoch, zvyšujú rok od roku. Výška údajov sa stala globálnym procesom a prijatím definícia veľkých údajov. Štúdia veľkých údajov je venovaná prác zahraničných aj ruských vedcov: James Mixika, Michael Chui, TOPORKOV V.V., Buduzko V.I. Podstatné skladovanie v štúdii tejto technológie vykonáva veľké svetové spoločnosti, ako napríklad: McKinsey & Company, CNEWS Analytics, SAP, Oracle, IBM, Microsoft, Teradata a mnoho ďalších. ONI-BY-MAKING Spracovanie a analýza údajov a na základe veľkých údajov vytvárajú program na zariadenie. Podľa správy McKinsey Institute: "Veľké údaje sú súborom údajov, ktorých veľkosť presahuje možnosti typických databáz Softvérové \u200b\u200bnástroje na zachytenie, skladovanie, správu a analýzu dát. " Koncepcia veľkých údajov v podstate zahŕňa prácu s informáciami o obrovskom objeme a rôznym zložením neustále aktualizovaným a nachádzajúcim sa v rôznych zdrojoch s cieľom zvýšiť efektívnosť práce, vytváranie nových produktov a zvýšenie konkurencieschopnosti. Poradenská spoločnosť FORRESTER poskytuje stručné a pomerne jasné znení: "Veľké dátové metódy a technológie, ktoré odstránia význam údajov o extrémnom limite praktickosti." Dnes je najväčší dátový sektor charakterizovaný nasledujúcimi značkami: objem objemu, Akumulovaná databáza je veľkým množstvom informácií., Speed, táto funkcia označuje, ako sa rastúca rýchlosť akumulácie údajov (90% informácií zozbierala za posledné 2 roky) .Vitures-rozmanitosť, t.j. Možnosť simultánneho spracovania, štruktúrované neštruktúrovanými informáciami o variantoch. Odborníci z marketingov milovali pridať ich "v". KTOTO hovorí viac o spoľahlivosti (pravdivosť), iní dodávajú, že veľká dátová technológia musí určite prospech podnikať (hodnota). Očakáva sa, že do roku 2020 sa nahromadené množstvo informácií o planéte zdvojnásobí každé dva roky. Hojnosť údajov vyvoláva túžbu používať ich na analýzu a prognózovanie. Kolosové objemy vyžadujú relevantné technológie. Dnes by spoločnosti mali zvládnuť obrovské množstvo údajov v objemoch, ktoré je ťažké predložiť, to vedie k tomu, že tradičné databázy sa nedokážu vyrovnať s takýmto úlohou, čo vedie k potrebe implementácie veľkých dátových technológií. Porovnávacia charakteristika veľkých údajov a tradičných databáz sa preosia. Základom pre tvorbu tejto tabuľky boli štúdie Buduzko V. I. a Moskva Exchange. Tabuľka 1 porovnávacie charakteristiky veľkých údajov a tradičných údajov

Tradičné databázy produktivity

Jedna alebo viac oblastí predmetu sa používa používaním všeobecných dátových technológií. Z identifikácie preferencií zákazníkov pred analýzou rizikových kúziel. Dátové údaje striktne štruktúrované dátové polia s komplexnou nehomogenous a alebo neistú skladovaciu štruktúru. Údaje o skladovaní a spracovanie. Rozsah tradičných databáz sa teda vzťahuje len jeden alebo viac, S takýmito oblastiami musia byť obsiahnuté štruktúrovanými údajmi. Pokiaľ ide o veľké údaje, rozsah ich aplikácie je rozsiahly s obrovskými funkciami informácií s komplexnou štruktúrou. Podľa výsledkov štúdie CNOWS Analytics, prezentované na obrázku 1, ruský trh prichádza na taký fenomén ako veľké údaje, ktorý ukazuje zvýšenie úrovne zrelosti spoločností. Mnohé firmy sa prenášajú do technológie veľkých údajov v dôsledku objemu ich spracovaných dát, už teraz viac ako 44% generujú asi 100 terabajtov a v 13% tieto objemy dát express 500 terabajtov.

Obr. Objemy informácií spracovaných v spoločnostiach

Takéto objemy nemôžu byť spracované tradičnými databázami, takže takéto spoločnosti pozri riešenie prechodu na veľké údaje, ktoré nie sú len ako spracovanie obrovských zväzkov, ale aj ako zvýšenie konkurencieschopnosti, čo zvyšuje lojalitu kupujúceho k svojmu produktu a priťahuje nové. Najaktívnejšími zákazníkmi takýchto riešení sú banky, telekomunikačné a maloobchodné, ich percentuálny pomer je prezentovaný na obrázku 2. Počet spoločností, ktoré používajú alebo budú pripravené použiť veľké údaje v dopravnom priemysle a energii, je viditeľný. Prvé príklady používania veľkých údajov sa objavili vo verejnom sektore.

Obr.2. Sektorová štruktúra využívania veľkých údajov

Pokiaľ ide o západnú vládu, differencitné odhady, digitálne hospodárstvo je od 3% do 21% krajín HDP veľkých dvadsiatich. Ruský gosso ešte nedosiahol významné výsledky v práci s veľkými údajmi. Dnes v Rusku sa takéto technológie najviac zaujímajú o obchodné podniky: obchodné siete, banky, telekomunikačné spoločnosti. Prijatie ruských spoločenstiev spoločenstva, objem digitálnej ekonomiky VRF je len 1 bilión. trieť. -Ocline 1,5% demontáž. URF je však obrovský potenciál pre rast digitálneho hospodárstva. Napriek malým funkčným termínom existencie veľkého sektora údajov existujú aj odhady efektívneho využívania týchto technológií na základe skutočných príkladov. Banky dnes sú v priemere približne o 3,8 drobitových dát, využívajú veľké dátové technológie na dosiahnutie určitých úloh: • Kreditná karta s použitím dátovej karty;  uvedenie údajov údajov;  Úverové údaje; 44% 16% 13% 7% 20% BankekteleCometlgossegorgergieBie Zákaznícke údaje Zberné údaje;  Údaje o ukladaní zákazníkov. Banky tvrdia, že potom, čo sa začali vychutnať veľké dátové technológie, boli schopní prilákať nových zákazníkov, je lepšie spolupracovať s novými aj starými zákazníkmi a so starými zákazníkmi a udržiavať ich lojalitu. V roku 2015 CNEWS Analytics prieskum medzi tridsiatych rokov najväčších ruských bánk o kumulatívnych aktívach, aby zistili, ktorá technológia veľkých údajov, ktoré používajú, a s akými cieľmi. V porovnaní s prieskumom roka 2014 sa počet bánk TOP30, ktorý vykazoval na používanie generických dátových technológií, ale táto zmena je skôr kvôli zmene v top 30 zložení. Obrázok 3 má porovnanie porovnávania prieskumu 2015 v porovnaní s rokom 2014, rovnako prieskum Kiryanovaya A.

Obr. 3. Použitie veľkých údajov TOP30 Ruské banky

Podľa odhadov IBS, 80% bánk, ktoré zodpovedajúce pozitívne, implementovali veľké dátové zariadenia-softvérové \u200b\u200bvybavenie na ukladanie a spracovanie údajov. Tieto riešenia zvyčajne pôsobia ako analytické alebo transakčné úložisko, ktorých hlavnou výhodou je dobrý výkon pri práci s veľkými objemami dát. Prax používania veľkých údajov v ruských bankách je však v štádiu stať sa. Dôvodom takejto pomalej adaptácie v Rusku je preukázaná dutinami zákazníkov na nové technológie. Necítia dôveru, že veľká dátová technológia pomôže riešiť problémy v plnom rozsahu. A to je to, čo sa týka amerického trhu sa týkajú, tam banky už nahromadili 1 skúšobné údaje, ktoré možno porovnať s 275 miliárd mp3 záznamov. Počet zdrojov z miesta, kde informácie pochádzajú z, extenzívne, môžete zdôrazniť Classic:  Zákazníci zákazníkov kancelárskych kancelárií banky; • Zákazníkov zákazníkov zákazníkov zákazníkov; • Zákaznícke sociálne siete;  Operácie operácie kreditnej karty iné. Analyzujte správanie kreditných operácií , konštrukčné cesty obchodnej miestnosti, riadne likvidovať tovar, plánovanie obstarávania a nakoniec zvyšujú predaj. Vo veľkých údajoch je samotný predajný mechanizmus postavený na veľkých údajoch: Používatelia ponúkajú produkty založené na predchádzajúcich nákupoch a ich osobných preferenciách, informácie o tom, ktoré sa zhromažďujú, napríklad v sociálnych sieťach. V oboch prípadoch analýza veľkých údajov pomáha znížiť náklady, zvýšiť lojalitu zákazníkov a pokrývať veľké publikum. Ako rozvoj obchodného potenciálu spoločností sa tradičná databáza zastaví stretnutie s rastúcimi obchodnými požiadavkami, vďaka ktorej systém nemôže poskytnúť primerané riadenie účtovníctva. Pokiaľ ide o veľké údaje, nové technológie vám umožňujú optimalizovať riadenie lodnej dopravy, dosiahnuť význam údajov a efektívnosť ich spracovania dôsledkov rozhodnutí o riadení, rýchlo vytvoriť správy o riadení. Celkové množstvo nahromadených údajov je viac ako 100 exubutt, pričom iba Walmart s použitím veľkých dátových procesov 2,5 petabajty dát za hodinu. Pri použití veľkých dátových technológií, 60% zvyšuje prevádzkovú ziskovosť, ako aj štatistiku Radop po implementácii veľkých údajov sa zvyšuje výkon analytiky na liečbu 120 algoritmov a zisk rastie na 710%. Ak beriete do úvahy Podľa ruského maloobchodu, potom tu sú veľké, dáta sa práve začínajú získať hybnosť, pretože vypúšťanie spracovania informácií je veľmi odlišné. Napríklad je to 18-krát menej ako v Číne a celá cirkulácia údajov, ktorá sa vyrába v online tlačidlách 4,5 krát menej ako jeden obchod Amazon. Zároveň sa počet internetových obchodov v Rusku, ktoré využívajú veľké údaje menej ako 40 tisíc, zatiaľ čo Európa, počet takýchto obchodov je viac ako 550 tisíc. Čo charakterizuje ruský maloobchodný trh, ako sa stále vyvíja a nie úplne vytvoril. Pokiaľ ide o náš každodenný život, sa tu používajú technológie veľkých údajov, o ktorých sme ani nemysleli na 1 milión skladieb každý deň, a to je asi 1,5 ~ 2 petabajty, procesov Shazam, hudobné služby, po celom svete a na základe tohto Potom hudobní výrobcovia predpovedajú popularitu umelca. Veľké údaje sa používajú aj na spracovanie informácií o kreditnej karte, ako je napríklad MasterCard a Visa. Tak, 65 miliárd transakcií za rok s pomocou 1,9 miliardy kariet v 32 miliónoch obchodných firiem spracováva MasterCard, aby predpovedal obchodné trendy. Každý deň ľudia píšu v sociálnych sieťach po celom svete, ako je Twitter a Facebook, na 19 terabajtov údajov. Odovzdávajú a spracovávajú fotografie, zapisujú, posielajú správy a tak ďalej. Infraštruktúra využíva aj veľké dátové technológie, z trolejbusov baní a rakiet. Tak, v Londýnskom metre každý deň, turnikety zaznamenávajú asi 20 miliónov priechodov, v dôsledku analýzy vykonanej na základe veľkých dátových technológií, bolo identifikovaných 10 všetkých druhov epicentra, čo sa zohľadňuje aj pri ďalšom rozvoji metra. Nepochybne, rozmanitosť a množstvo údajov vyplývajúcich zo všetkých druhov interakcií je silnou obchodnou základňou pre budovanie a objasnenie prognóz, identifikácia vzorov, hodnotenia účinnosti atď. Avšak, Celkovo existujú ASUSUPPORTS, ktoré musia tiež zohľadniť. Napriek explicitným a potenciálnym výhodám využívania veľkých údajov, ich použitie má svoje nevýhody, ktoré sú primárne spojené s veľkým množstvom informácií, rôzne metódy prístupu a často nedostatočné poskytovanie zdrojov. funkcie informačná bezpečnosť v organizáciách. Problémy, ktoré súvisia s používaním generických údajov, sú uvedené na obrázku 4.

Obr. 4. Problémy s používaním veľkých údajov

Všetky tieto problémy vedú k tomu, že mnohé spoločnosti s MAS zavádzajú veľké dátové technológie, pretože pri práci s tretími stranami, samy o sebe vznikajú problém zverejnenia vnútra, ktorý spoločnosť nemohla zverejniť len prostriedky. Podľa môjho názoru, Najdôležitejším krokom na ceste úplného zavedenia technológií na základe veľkých údajov, musí to byť legislatívny aspekt. Teraz existujú zákony, ktoré obmedzujú zber, používanie, skladovanie určitých typov osobných údajov, ale neobmedzujú úplné údaje, preto by sa pre nich mali existovať osobitná legislatíva. S cieľom rýchlo sa menia sa a nové zákony musia spoločnosti splniť počiatočný zoznam príslušných regulačných právnych aktov a pravidelne aktualizovať tento zoznam. Napriek vyššie uvedeným nedostatkom, ako aj skúsenosti so západnými zástupcami ukazujú, veľké údaje Technológia pomáha úspešne riešiť ako moderné obchodné cvičenie a zvyšovanie konkurencieschopnosti a ciele spojené priamo s životom ľudí. Ruské spoločnosti sú už na ceste zavádzania veľkých dátových technológií v výrobnej sfére a na verejnosti, pretože množstvo informácií každý rok zvyšuje takmer dve. Postupom času sa mnohé oblasti nášho života zmení pod vplyvom veľkých údajov.

Odkazy na zdroje1.budzkov. I. Vysoká dostupnosť systémy a veľké údaje // veľké údaje v národnej ekonomike roku 2013. P. 1619.2. COROTKOVA T. "EMC dátové jazero 2.0 - prechod na analytik veľkých údajov a digitálnej ekonomiky" http: // bigdata .cNews.ru / Novinky / Linka / 20151203_EMC_DATA_LAKE_20_POMOZHET_PEREJTI_K_ANALITIKE.3.KRIANOVA A. "Veľké údaje sa nestali hlavným prúdom v ruských bankách" http://www.cnews.ru/news/top/bolshie_dannye_ne_stali_mejnstrimóm 4.cnews "Infigure: Veľké údaje prišli do Ruska "http: //bigdata.cNews.ru/articleshi/infografika_bolshi_Dannye_prishli_v_rossiyu.5.cNews" Infographics: Ako Maloobchod využíva veľké údaje "http://bigdata.cnews.ru/articles/infografika_kak_roznitsa_ispolzuet Neexistujú žiadne osobitné právne predpisy Na svete v súvislosti s veľkými údajmi o veľkých údajoch by sa mali skryť, aby sa zachovali zdroje zdrojových údajov týchto spoločností, musia byť presvedčení, že všetky požiadavky na bezpečnosť údajov sú monitorované a podporované implementáciou veľkých prenosových údajov Či sa vytvorí alebo zistíte predtým riadenie dôverných informácií. Udržiavanie požiadaviek na bezpečnosť údajov pre bezpečnosť údajov. Banky »http://bigdata.cNews.ru/articles/bigografika_chto_mogut_bolshie_dannye.8. Moskovskaya Exchange" Analytical SumbigData "http: // Habrahabr. RU / COMPANY / MOEX / BLOG / 256747 / 9. Veľké údaje (Bigdata). http://www.tadviser.ru/index.php/statimateschet_data_(big_data) .10.Bigdata-Electricity XXIVEK http://bit.samag.ru/archive/article/1463.11.mckinsey Global Institute "Bigdata: nasledujúci hranica Pre inovácie, CompetistionAnd Produktivita »(jún 2011).