„Big Data”– Thika me dy teha

1

Skender Mustafi
MSc. Sistemet Informative të Biznesit
BSc. Administrim Biznesi
Shkarko në PDF: Big Data - thika me dy teha (171) 

Parathënie

“Shëtitja” e lirë në internet, nëpër aplikacionet e mjeteve elektronike, shëtitja me mjetet elektronike i ngjason shëtitjes së lirë nëpër rrugë pa mos u interesuar fare nëse ato janë për këmbësorë, për biçikleta, për automjete, rrugë kryesore, apo autostrada. – Skender Mustafi

big data
Big Data (Hibbard, 2012)

Është ky termi “Big Data” (shqiptohet Big Dejta) që kohëve të fundit ka marrë përmasa të mëdha në botën e menaxhimit të informacioneve. Nuk është gjë e re, por që “ka ardhur koha” e aplikimit të diturisë së përmbledhur në këtë fushë. “Është koha e fundit” që të fillohet të vilen të mbjellat në fushën e inteligjencës artificiale të aplikuar. Ky artikull nuk është një shfryrje e ndjenjave të mia e e mendimit tim mbi këtë fushë edhe pse ka shumë hapësirë për tu folur, diskutuar e spekuluar. Qëllimi është që përmes kësaj analize të hidhet dritë mbi gjendjen aktuale të rrjedhës, grumbullimit, analizës e përpunimit të të dhënave – që paraqet konceptin “Big Data” – si dhe shfrytëzimin e këtyre të dhënave për të nxjerrë informacione e për të marrë vendime. Ky artikull, plotësisht, lë anash aspektin social e moral të veprimeve të realizuara në këtë fushë. Gjithashtu, në asnjë mënyrë, nuk shtjellon veprimet e metodat e ndërmarrjeve e institucioneve për të mbledhë e shfrytëzuar të dhënat.

Hyrje

 “Përmbytja me informacione nuk do të thotë se i kemi informacionet e duhura ose se jemi në kontakt me njerëzit e duhur.” – Bill Gates

Mirë se vini tek Fjalaime! (shprehje farsë). Vetëm me hapjen e kësaj faqeje, sapo kemi mbledhur këto të dhëna nga ju: IP adresën, shtetin nga i cili vini, faqen nga e cila e keni parë faqen tonë, kohën që keni kaluar në faqe, artikuj që keni vizituar/lexuar, kohën që keni kaluar për secilin artikull, fjalët që keni shfrytëzuar për të kërkuar artikuj, … Nëse vizitoni një faqe tjetër të ndonjë kompanie si ajo e Google Inc. lista e më sipërme është më ndryshe; shumë më e plotë, më e organizuar dhe e marrë me seriozitet duke qenë e mbështetur nga aplikacion/e dhe teknologji profesionale.

Nuk ka të ndalur nëse fillojmë të numërojmë këndet nga të cilat thithen të dhënat tona, entitetet të cilat i thithin ato, i ruajnë, i përpunojnë dhe i shfrytëzojnë për interes të vetin. Kështu, big data është term i cili shfrytëzohet “për të përshkruar rritjen e vazhdueshme dhe qasjen ndaj të dhënave, qoftë të strukturuara apo të pa strukturuara” (SAS Institute, 2014). Kjo nënkupton faktin se teknologjia moderne mundëson ruajtjen e të dhënave të shumta të llojeve të ndryshme “përgjithmonë”. “Përgjithmonë” në këtë rast nënkupton periudhën kohore që nga regjistrimi i të dhënave e deri në kohën e zhdukjes së tyre nga faktorë të ndryshëm përmes ndonjë akti të pa dëshirueshëm nga njerëzit/institucionet të cilët kanë mbledhur ato të dhëna. Këtë gjendje në mënyrë shumë profesionale e përshkruan (IBM, 2014) përmes qëndrimit “Big data gjenerohet nga çdo gjë rreth nesh në të gjitha kohët. Çdo proces digjital dhe çdo shkëmbim në mediet sociale e zhvillon atë. Sistemet, senzorët dhe mjetet elektronike celulare transmetojnë atë. Big data vije nga burime të shumta me një shpejtësi alarmante.”

Në përshkrimin e më sipërm mund të shkëpusim terme të rëndësishme të cilave u është dhënë theks i veçantë. “Çdo gjë rreth nesh” nënkupton ambientin, pjesë të të cilit (pra ueb faqet) përshkrova më sipër, i cili është në gjendje për të mbledhur të dhënat e llojeve të caktuara ose të dhënat e të gjitha llojeve. “Mediet sociale” janë burimi kryesorë i cili i ka dhënë kuptim të plotë këtij koncepti. Në mediet sociale njerëzit me vullnet dhe pajtueshmëri të plotë shpërndajnë të dhënat e tyre qoftë në publik, me shokët e tyre ose për veten e tyre, e që të gjitha janë të njohura për mbledhësin e tyre dhe të ruajtura në bazë të përgatitur mirë. Në rast të mos ekzistimit të rrjeteve sociale big data në fushën e trajtimit individual do të ishte shumë e vështirë për shkak të konfliktit që ka ky koncept me ligjet e të drejtave të njeriut, lirisë së të shprehurit, lirisë së mbrojtjes së personalitetit dhe privatësisë. E gjithë kjo “torturë” është shmangur me idenë e realizuar në rrjetet sociale ku e gjithë dëshira për të qenë privat hidhet në ujë nga shumica e njerëzve. Dhe së fundi vënia e theksit mbi mjetet elektronike të cilat mundësojnë transmetimin e të dhënave të ndryshme, ku për shumicën e të dhënave madje shfrytëzuesit e tyre as nuk e kanë idenë që i shpërndajnë.

Të dhënat dhe mbledhja e tyre

 “Lufta kundër terrorizmit nuk është vetëm luftë ushtarake, por fillimisht luftë mbi informacionet.” – Ahmed Chalabi

Tani më ka kaluar kohë që ideja e ruajtjes së të dhënave “përgjithmonë” është pranuar dhe realizohet nga shumë shtete e madje edhe kompani të mëdha botërore, suksesi i të cilave varet nga të dhënat. Grumbullimi i të dhënave realizohet qoftë përmes kompjuterëve, mjeteve të ndryshme elektronike ashtu edhe përmes mjeteve tjera të komunikimit e të ruajtjes së të dhënave të llojeve të ndryshme qofshin ato me karakter privat, të sigurisë apo publike.

Kompanitë i mbledhin të dhënat në mënyrë që të mund të ofrojnë shërbimet e tyre sa më të përshtatshme me dëshirat dhe nevojat e konsumatorëve. Në shumë raste, meqë informacionet janë rezultat i angazhimit të një stafi të një spektri të gjerë profesional nisur nga ata me prapavijë teknike e deri tek ata me prapavijë socio-psikologjike, konkluzionet e nxjerra janë befasuese edhe për vetë konsumatorin dhe me një ndikim shumë të madh. Informacionet e nxjerra nuk merrem vetëm si bazë për të zhvilluar strategji të cilat nxisin konsumatorët për të kënaqur dëshirat e për të plotësuar nevojat e tyre me shërbimet/produktet e ndërmarrjeve, por gjithashtu edhe për të ndryshuar qëndrimin e konsumatorëve gjë që është veprim i cili tejkalon kufijtë e efektit të marketingut tradicional.

Shtetet dhe institucionet e tyre, në anën tjetër, mbledhin të dhënat jo vetëm për të identifikuar shtetasit e banorët e tyre, por edhe për të rritur nivelin e sigurisë si përbrenda kufijve ashtu edhe jashtë tyre. Bashkëveprimi në shkëmbimin e informacioneve është mase i rëndomtë, kuptohet sundues janë shtetet e forta mbi ato të dobëtat, që paraqet një fluks të pa balancuar të rrjedhës së të dhënave.

Trajtimi i të dhënave

Është gjë shumë pikëlluese që në ditët e sodit ka aq pak informacione të padobishme.” – Oscar Wilde

Ajo që është shumë me rëndësi në rastin e marrjes së vendimit për të mbledhë të dhëna dhe për të ruajtur ato, është gjetja e rrugës së duhur për të shfrytëzuar ato. Nëse kemi dhjetë profile njerëzish me të dhëna bazë të cilat i regjistrojnë institucionet shtetërore, pa mos i përfshirë të dhënat shtesë të mbledhura nga teknologjitë moderne, është e lehtë për t’i analizuar brenda një dite dhe për të nxjerrë informacione e për të marrë vendime përbrenda mundësive që na ofrojnë ato të dhëna. Por, nëse nga këta dhjetë nxjerrim një person për ta analizuar, pa mos larguar asnjë të dhënë nga do që kemi mbledhur, është shumë vështirë për të nxjerrë përfundime e edhe më e vështirë të mos lëshohet asnjë pikë meqë kornizat janë shumë më të gjëra dhe numri i kombinacioneve është shumë i madh.

Atëherë si mund të analizohen profilet e miliona njerëzve të cilët përmes veprimeve të tyre vetëm në internet duke lënë anash veprimet reale në jetë brenda 60 sekondave ngarkojnë 72 video në internet, realizojnë 2 milion kërkime në Google, dërgojnë 204 milion posta elektronike, realizojnë 2460000 shkrime në Facebook, … (Kennedy, 2013)?

Për këtë arsye shkencëtarët e ndryshëm të teknologjive informative janë përpjekur dhe janë në përpjekje të mëtejme për të zhvilluar teknologji dhe gjuhë të cilat i përgjigjen kapacitetit të këtij fluksi marramendës të të dhënave. Është e nevojshme që teknologjia t’i përgjigjet veprimeve të veta, jo se ka përgjegjësi morale, por sepse njeriu nuk është në gjendje të kuptojë këtë fluks të të dhënave e jo të mund të zbërthejë, rigrupojë sipas nevojës, të analizojë, të nxjerrë informacione, të analizojë informacionet e në fund të marrë vendime. Ky varg i analizave përputhet me zbërthimin e thjeshtë që bën Clofford Stoll (2011) me shprehjen: “të dhënat nuk janë informacion, informacioni nuk është dituri, dituria nuk është të kuptuar, të kuptuarit nuk është mençuri.”

Teknologjia e cila në masë të madhe tanimë është në përdorim për shumë nevoja ngrihet mbi të ashtuquajturin “programim logjik” (për më shumë lexoni ligjëratën hyrëse nga profesori Frank Pfenning nga Universtiteti Carnegie Mellon (2007)). Programimi logjik përmes kapacitetit të vetë i cili mbështetet në logjikën e vetë zhvilluesve të softuerëve, përpiqet jo vetëm të përzgjedhë, grupojë e ndërlidhë informacionet e një entiteti, por gjithashtu përpiqet që të ndërlidhë informacionet e një entiteti me një entitet tjetër – me shumë entitete tjera/me të gjitha entitetet –, të krahasojë informacionet e entiteteve të ndryshme në kohë të ndryshme si dhe të nxjerrë përmbledhje ose/dhe deklarata, nëse më lejohet t’i emëroj si të tilla.

Pra programimi logjik mundëson që përmes dy të dhënave të sjellë një përfundim logjik. Shembull, nëse kemi dy fakte si 1) Skenderi është shqiptar dhe 2) shqiptarët bartin plisa, atëherë teknologjia moderne e ngritur mbi programim logjik vije në përfundim se “skenderi bart plis”. Gjë që na le të kuptojmë se edhe pse është shembull i thjeshtë është bazë për mospajtim e diskutime. Për më shumë, programimi logjik gjithashtu mbështetë ndërlidhjen e informacioneve të llojeve të ndryshme për tu përputhur me përgjigjet e paradefinuara, siç është, ndër shembujt tjerë, shembulli i bashkimit të informacionit në video material me të dhënat e personave ose/dhe objekteve të paradefinuara (shembull i përcjelljes dhe identifikimit biometrik në video materialet e realizuara nga video kamerat aktive (UAB, 2012))  Nëse marrim shembuj tjerë banal si ky, shpesh herë mund të jenë pak sa të komplikuar dhe jo të lehtë për t’i kuptuar me të parën. Atëherë si do të ishte të lidhen të dhëna të ndryshme të natyrave të ndryshme, nga burime të ndryshme?!

Nxjerrja e informacioneve

“Tanimë nuk jemi në kohën e informacionit. Ne jemi në kohën e menaxhimit të informacionit“. – Chris Hardwick

Teknologjitë të cilat janë në gjendje të detektojnë, thithin dhe ruajnë këtë fluks trishtues të të dhënave si dhe “logjika” e cila është në gjendje t’i shtrydhë ato për të nxjerrë përfundime të llojeve të ndryshme të cilat janë aq logjike sa janë logjike pyetjet e programuara, nuk janë në gjendje dhe të besueshme të merren si “fjala e fundit” për të marrë vendime dhe veprime konkrete. Për të dëshmuar këtë, po marr një shembull banal, ku le të themi që big data i përgjigjet pyetjes sonë “cilat vetura kanë më pak defekte në Shqipëri?” me “veturat e verdha”. Nëse këtë përgjigje e marrim si informacion, atëherë të gjithë ose do të duhet të blejmë vetura të verdha ose do të duhet t’i ngjyrosim me të verdhë ato që i kemi, që të kemi më pak defekte. Në të kundërtën, nëse përgjigjen e marrim si të dhënë, atëherë lindin pyetje tjera të cilat sqarojnë përgjigjen e marrë dhe në bazë të përgjigjeve të pyetjeve tjera marrim vendimin e duhur.

Nga shembulli i thjeshtë paraqitur më sipër mund të shohim sa shpejtë mund të komplikohen gjërat kur marrim përgjigjet nga big data dhe sa larg logjikës së shëndosh njerëzore mund të jetë ky koncept. Madje, në situata komplekse kur duhet parashtruar një varg pyetjesh komplekse, nevojitet njohuri profesionale dhe përvojë e ngritur mbi baza të shëndosha për të qenë në gjendje fillimisht për të parashtruar pyetjet e duhura, për të kuptuar përgjigjet e madje edhe për të marrë vendime. Për këtë “për të nxjerrë informacione me vlerë domethënëse nga big data, duhet fuqi optimale e procesimit, mundësi analitike dhe aftësi” (IBM, 2014), ku njeriu zë vendin e pa zëvendësueshëm në pikën e tretë.

Përfundim

“Njerëzit të cilët duan informacione alternative duhet të mundohen aq shumë për ta gjetur.” – Edwidge Danticat

Ne nuk kemi të ndalur në shpërndarjen e informacioneve tona. Ne jo vetëm që kemi shënuar të dhënat personale, por na është shumë me rëndësi që të shprehemi lirisht, madje edhe të tregojmë çfarë kemi ngrënë për mëngjes, çfarë i kemi thënë shokut para dy minutash/çfarë po i themi për momentin, çfarë…

Sa më shumë që flasim, sa më shumë teknologjik që jemi. Pra, meqë kemi celularë të mençur me shumë aplikacione, shumicën e të cilëve madje nuk i kuptojmë tërësisht në mënyrën e funksionimit, kemi profile kudo nëpër shërbimet e ndryshme në internet, lexojmë, shpërndajmë e komentojmë artikuj e video të ndryshme, aq më mirë është për kompanitë e ndryshme dhe për shtetet e ndryshme dhe institucionet e tyre.

Duke tentuar të mos kaloj në subjektivitet, nëse të tërë bazat e të dhënave do të shfrytëzoheshin mbi baza morale e ligjore duke respektuar të gjitha të drejtat morale e ligjore të njerëzve, atëherë ky do të ishte një veprim shumë i mirë, një diell i nxehtë i cili e lufton të ftohtin e krimit, një teh i thikës i cili mundëson të prihen më me lehtësi paketat e vendimeve. Por, nga zhvillimet reale mund të shohim qartë se si në biznes ashtu edhe në sferën politike e të “sigurisë” big data shfrytëzohet për interesa të caktuara duke mprehur kështu tehun e dytë i cili nuk ka të bëjë aspak me të vërtetën dhe interesin social.

Sidoqoftë, edhe më delikate në cilin do aspekt të trajtimit të të dhënave, është mungesa e kapacitetit njerëzorë për të trajtuar të dhënat në mënyrë profesionale. Këtë dëshmon dhe Garner ku parasheh 4.4 milion vende pune në analizën dhe përpunimin e të dhënave për vitin 2015 e që një e treta e tyre mungojnë. (IBM, 2014). Përkundër këtij dhe fakteve tjera të cilat dëshmojnë për gjendjen aktuale të big data dhe kapacitetit analitik që e rrethon, shtetet e ndryshme tanimë kanë filluar të aplikojnë këtë koncept dhe teknologjitë mbështetëse në jetën e përditshme duke u dhënë shpesh herë, “si nevojë e patjetërsueshme për shkaqe sigurie”, personave të pakualifikuar mundësinë për të marrë vendime jetësore nga të dhënat/informacionet e ofruar nga big data (shembull i Departamentit të Policisë së Los Angeles – LAPD (Yu, 2014).

Le të përmbledhim, të dhënat tona vetëm sa shkojnë e shtohen në baza të ndryshme qoftë në vendin ku jetojmë qoftë në ndonjë vend të pa njohur në botë. “Shëtitja” e lirë nëpër internet, nëpër aplikacionet e mjeteve elektronike, shëtitja me mjetet elektronike i ngjason shëtitjes së lirë nëpër rrugë pa mos u interesuar fare nëse ato janë për këmbësorë, për biçikleta, për automjete, rrugë kryesore, apo autostrada. Kështu që, varësisht cilës rrugë i biem me shëtitjen tonë të pa kontrolluar, po me ato pasoja do të përballemi. Kësaj gjendje nëse i shtojmë dhe analizuesit e të dhënave dhe moralin e tyre, sikur grahësit jo profesional dhe morali i tyre, atëherë mund me lehtësi të kuptojmë gjendjen në të cilën ndodhemi.

Kjo gjendje vetvetiu na paralajmëron për nevojën e pasjes kujdes në veprimet tona të pa matura meqë shumë shpejtë mund të bëhemi preh e ndonjë veprimi të pa lejuar ose mund të jemi preh e ndonjë manipulimi rezultati i të cilit mund të jetë fatal.

Referencat

  • Hibbard, S. (2012). Business and Big Data or Small Data. Retrieved from The Marketing Bit, div. of Hibbard & Veto LLC: http://www.themarketingbit.com/marketing-2/business-and-big-data-or-small-data/
  • IBM. (2014). What is Big Data? Retrieved from IBM: http://www.ibm.com/big-data/us/en/
  • Kennedy, J. (2013). What happens on the internet in 60 seconds (infographic). Retrieved from Silicon Republic Knowledge & Events Management Ltd: http://www.siliconrepublic.com/new-media/item/33702-what-happens-on-the-interne
  • Pfenning, F. (2007). Logic Programming. Retrieved from Carnegie Mellon University: http://www.cs.cmu.edu/~fp/courses/lp/lectures/lp-all.pdf
  • SAS Institute, I. (2014). What is Big Data? Retrieved from SAS: http://www.sas.com/en_us/insights/big-data/what-is-big-data.html
  • Stoll, C. (2011). Data . Retrieved from BrainyQuote: http://www.brainyquote.com/quotes/quotes/c/cliffordst212166.html
  • UAB, N. (2012). VeriLook Surveillance biometric face recognition technology demonstration. Retrieved from Youtube: https://www.youtube.com/watch?v=mdhvRNYX0PI
  • Yu, W.-M. (2014). Big Data Analytics Helps Protect Communities. Retrieved from UBM LLC: http://www.informationweek.com/government/big-data-analytics/big-data-analytics-helps-protect-communities/d/d-id/1113720

1 Koment

PËRGJIGJU

Kodi i sigurisë *