Kdo shromažďuje velká data a proč?

Na podzim roku 2019 propukl skandál se službou Apple Card: při registraci vystavila různé úvěrové limity pro muže a ženy. Dokonce i Steve Wozniak měl smůlu:

O rok dříve vyšlo najevo, že platforma Netflix zobrazuje uživatelům různé plakáty a upoutávky v závislosti na jejich pohlaví, věku a národnosti. Za to byla služba obviněna z rasismu.

A konečně, Mark Zuckerberg je pravidelně kárán za údajné shromažďování, prodej a manipulaci s daty svých uživatelů ze strany Facebooku. V průběhu let byl obviněn a dokonce souzen za manipulaci během amerických voleb, napomáhání ruským speciálním službám, podněcování k nenávisti a radikálním názorům, nevhodné reklamě, úniku uživatelských dat, maření vyšetřování pedofilů.

Facebook příspěvek od zuck

Zároveň online služba Pornhub každoročně zveřejňuje zprávy o tom, jaké porno lidé různých národností, pohlaví a věku hledají. A z nějakého důvodu to nikoho netrápí. I když jsou všechny tyto příběhy podobné: v každém z nich máme co do činění s velkými daty, která se v XNUMX století nazývá „nová ropa“.

Co jsou velká data

Velká data – jsou to také velká data (angl. Big Data) nebo metadata – je pole dat, která přicházejí pravidelně a ve velkých objemech. Jsou shromažďovány, zpracovávány a analyzovány, což vede k jasným modelům a vzorům.

Pozoruhodným příkladem jsou data z Velkého hadronového urychlovače, která přicházejí nepřetržitě a ve velkém množství. S jejich pomocí vědci řeší mnoho problémů.

Velká data na webu však nejsou pouze statistikou pro vědecký výzkum. Lze je použít ke sledování toho, jak se uživatelé různých skupin a národností chovají, čemu věnují pozornost a jak interagují s obsahem. Někdy se za tímto účelem neshromažďují data z jednoho zdroje, ale z několika, přičemž se porovnávají a identifikují určité vzory.

O tom, jak jsou velká data na síti důležitá, se začalo mluvit, když jich bylo opravdu hodně. Na začátku roku 2020 bylo na světě 4,5 miliardy uživatelů internetu, z toho 3,8 miliardy bylo registrováno na sociálních sítích.

Kdo má přístup k Big Data

Podle průzkumů se více než polovina našich zemí domnívá, že jejich data v síti využívají třetí strany. Zároveň mnozí zveřejňují na sociálních sítích a aplikacích osobní údaje, fotografie a dokonce i telefonní číslo.

Kdo shromažďuje velká data a proč?
Kdo shromažďuje velká data a proč?
Kdo shromažďuje velká data a proč?
Kdo shromažďuje velká data a proč?

Je potřeba to vysvětlit zde: první osobou je sám uživatel, který umístí svá data na jakýkoli zdroj nebo aplikaci. Zároveň souhlasí (zaškrtne souhlas) se zpracováním těchto údajů druhá strana – tedy vlastníci zdroje. Třetí stranou jsou ti, kterým mohou vlastníci zdroje převádět nebo prodávat uživatelská data. Často je to napsáno v uživatelské smlouvě, ale ne vždy.

Třetí stranou jsou vládní agentury, hackeři nebo společnosti, které nakupují data pro komerční účely. První může získat údaje rozhodnutím soudu nebo nadřízeného orgánu. Hackeři samozřejmě nepoužívají žádná oprávnění – jednoduše hacknou databáze uložené na serverech. Společnosti (ze zákona) mají přístup k údajům pouze tehdy, pokud jste jim to sami povolili – zaškrtnutím políčka pod smlouvou. V opačném případě je to nezákonné.

Proč společnosti využívají Big Data?

Velká data v komerční oblasti se používají desítky let, jen to nebylo tak intenzivní jako nyní. Jde například o záznamy z monitorovacích kamer, data z GPS navigátorů nebo online platby. Nyní, s rozvojem sociálních sítí, online služeb a aplikací, lze toto vše propojit a získat nejúplnější obrázek: kde potenciální zákazníci bydlí, co rádi sledují, kam jezdí na dovolenou a jakou mají značku auta.

Z výše uvedených příkladů je zřejmé, že pomocí velkých dat chtějí firmy především cílit reklamy. Tedy nabízet produkty, služby nebo jednotlivé možnosti pouze správnému publiku a dokonce produkt přizpůsobit konkrétnímu uživateli. Reklama na Facebooku a dalších velkých platformách je navíc stále dražší a ukazovat ji všem za sebou se vůbec nevyplácí.

Informace o potenciálních zákaznících z otevřených zdrojů aktivně využívají pojišťovny, soukromé kliniky i zaměstnavatelé. Ti první mohou například změnit podmínky pojištění, pokud uvidí, že často sháníte informace o některých nemocech nebo lécích, a zaměstnavatelé mohou posoudit, zda máte sklony ke konfliktům a asociálnímu chování.

Je tu ale ještě jeden důležitý úkol, který se v posledních letech trápí: přiblížit se nejsolventnějšímu publiku. To není tak snadné, i když tento úkol výrazně usnadňují platební služby a elektronické kontroly prostřednictvím jediného OFD (operátor fiskálních dat). Aby se společnosti dostaly co nejblíže, snaží se dokonce vystopovat a „vychovat“ potenciální zákazníky již od dětství.: prostřednictvím online her, interaktivních hraček a vzdělávacích služeb.

Jak to funguje?

Největší příležitosti pro sběr dat mají globální korporace, které vlastní několik služeb najednou. Facebook má nyní více než 2,5 miliardy aktivních uživatelů. Zároveň společnost vlastní i další služby: Instagram – více než 1 miliarda, WhatsApp – více než 2 miliardy a další.

Google má ale ještě větší vliv: Gmail používá 1,5 miliardy lidí na světě, dalších 2,5 miliardy mobilní OS Android a více než 2 miliardy YouTube. A to nepočítám aplikace Vyhledávání Google a Mapy Google, obchod Google Play a prohlížeč Chrome. Zbývá upevnit svou online banku – a Google o vás bude vědět doslova vše. Mimochodem, Yandex je v tomto ohledu již o krok napřed, ale pokrývá pouze rusky mluvící publikum.



???? V první řadě se firmy zajímají o to, co zveřejňujeme a lajkujeme na sociálních sítích. Pokud například banka uvidí, že jste vdaná a aktivně se vám líbí dívky na Instagramu nebo Tinderu, je pravděpodobnější, že spotřebitelský úvěr schválíte. A hypotéka na rodinu je pryč.

Důležité také je, na jaké reklamy klikáte, jak často a s jakým výsledkem.

(Tj Dalším krokem jsou soukromé zprávy: obsahují mnohem více informací. Zprávy unikaly na VKontakte, Facebooku, WhatsApp a dalších instant messengerech. Podle nich je mimochodem snadné sledovat geolokaci v době odeslání zprávy. Určitě jste si všimli: když s někým diskutujete o nákupu nebo jen objednání pizzy, okamžitě se ve feedu objeví relevantní reklama.

🚕 Velká data aktivně využívají a „unikají“ doručovacími a taxislužbami. Vědí, kde žijete a pracujete, co milujete, jaký je váš přibližný příjem. Uber například ukazuje cenu vyšší, pokud jedete domů z baru a evidentně jste to přehnali. A když máte v telefonu hromadu jiných agregátorů, tak naopak nabídnou levnější.

(Tj Existují služby, které pomocí fotografií a videí shromažďují co nejvíce informací. Například knihovny počítačového vidění – Google jednu má. Skenují vás a vaše okolí, aby zjistili, jakou jste velikost nebo výšku, jaké značky nosíte, v jakém autě jezdíte, zda máte děti nebo domácí mazlíčky.

(Tj Ti, kteří bankám poskytují SMS brány pro své korespondence, mohou sledovat vaše nákupy na kartě – znát poslední 4 číslice a telefonní číslo – a poté tato data prodat někomu jinému. Proto všechen ten spam se slevami a pizzou jako dárkem.

🤷️️ Nakonec i my sami prosakujeme naše data do levých služeb a aplikací. Vzpomeňte si na ten humbuk kolem Getcontactu, kdy každý rád vyplnil své telefonní číslo, aby zjistil, jak to napsali ostatní. A nyní najděte jejich souhlas a přečtěte si, co říká o předání vašich údajů (spoiler: vlastníci je mohou převést na třetí strany podle svého uvážení):

Kdo shromažďuje velká data a proč?

Korporace mohou úspěšně shromažďovat a dokonce prodávat uživatelská data po celá léta, dokud nedojde k soudnímu sporu – jako se to stalo se stejným Facebookem. A rozhodující roli pak sehrálo porušování GDPR – zákona v EU, který omezuje používání dat mnohem přísněji než ten americký. Dalším příkladem z poslední doby je antivirový skandál Avast: jedna z dceřiných služeb společnosti shromáždila a prodala data od 100 do 400 milionů uživatelů.

Ale má to všechno pro nás nějaké výhody?

Jak velká data pomáhají nám všem?

Ano, má to i světlou stránku.

Velká data pomáhají chytit zločince a předcházet teroristickým útokům, najít pohřešované děti a chránit je před nebezpečím.

S jejich pomocí jsme dostáváme skvělé nabídky od bank a osobní slevy. Díky nim my neplatíme za mnoho služeb a sociálních sítí, které vydělávají pouze na reklamě. Jinak by nás samotný Instagram stál několik tisíc dolarů měsíčně.

Samotný Facebook má 2,4 miliardy aktivních uživatelů. Jejich zisk za rok 2019 přitom dosáhl 18,5 miliardy dolarů. Ukázalo se, že společnost vydělává až 7,7 $ ročně od každého uživatele prostřednictvím reklamy.

Konečně se to někdy hodí: když už služby vědí, kde jste a co chcete, a nemusíte si potřebné informace shánět sami.

Další perspektivní oblastí pro uplatnění Big Data je vzdělávání.

Na jedné z amerických univerzit ve Virginii proběhla studie, která měla sbírat data o studentech tzv. rizikové skupiny. Jsou to ti, kteří se špatně učí, vynechávají hodiny a jsou před odchodem. Faktem je, že ve státech se ročně odečte asi 400 lidí. To je špatné jak pro univerzity, kterým se snižuje rating a omezuje financování, tak pro samotné studenty: mnozí si berou půjčky na vzdělání, které se po odečtení stejně budou muset splácet. Nemluvě o ztraceném čase a kariérních vyhlídkách. Pomocí velkých dat je možné včas identifikovat zaostávající a nabídnout jim tutora, další kurzy a další cílenou pomoc.

To se mimochodem hodí i pro školy: pak systém upozorní učitele a rodiče – říkají, dítě má problémy, pomozme mu společně. Big Data vám také pomohou pochopit, které učebnice fungují lépe a kteří učitelé látku snáze vysvětlují.

Dalším pozitivním příkladem je profilování kariéry.: to je, když se dospívajícím pomáhá při rozhodování o jejich budoucí profesi. Velká data zde umožňují shromažďovat informace, které nelze získat pomocí tradičních testů: jak se uživatel chová, čemu věnuje pozornost, jak interaguje s obsahem.

Ve stejných USA existuje program kariérového poradenství – SC ACCELERATE. Využívá mimo jiné technologii CareerChoice GPS: analyzuje data o povaze studentů, jejich sklonech k předmětům, silných a slabých stránkách. Data se pak použijí k tomu, aby pomohla dospívajícím vybrat si pro ně ty správné vysoké školy.


Přihlaste se k odběru a sledujte nás na Yandex.Zen – technologie, inovace, ekonomika, vzdělávání a sdílení na jednom kanálu.

Napsat komentář