FörstÄ Big Data med fördelar, egenskaper och exempel pÄ Big Data-applikationer

FörstÄ Big Data

Att förstÄ Big Data Àr

Begreppet Big Data dök först ut 2000 av en industrianalytiker frÄn vÀst med namnet Doug Laney. Globalt sett Àr Big Data data om mÄnga saker som samlas in i mycket stora volymer med snabb hastighet. Big data kan analyseras och behandlas för beslutsÀndamÄl (desicion att göra), affÀrsstrategi och affÀrsförutsÀgelser.

I terminologin för klassisk datahantering, relaterad till ökningen i volym, kan Big data betraktas som data som inte kan lösas av databasen (databas) och traditionella databehandlingsapplikationer. Varför blir vi stötande databasen? Eftersom i sin implementering kan begreppet Big Data kallas databasen som Àr mycket stor i storlek, Mycket stor databas (VLDB) vars konfiguration anvÀnder Databashanteringssystem (DBMS).

I en Big Data, blandad data mellan strukturerad data och ostrukturerad data. Om du tycker att NoSQL Ă€r ganska komplicerat Ă€r Big data tiotals gĂ„nger mer komplicerat Ă€n sĂ„. Även om det finns program eller applikationer som Ă€r specifikt utformade för att hantera dem, krĂ€ver de algoritmisk design och frĂ„gan vilket inte Ă€r vanligt.

Framework och applikationer som anvÀnds för att hantera stora data Àr inte direkt anslutna till all data utan anvÀnder istÀllet analysmetoder. Framework eller applikation för att hantera stora data kallas ofta "ramdata för big data-applikationer"Men vissa mÀnniskor kallar det"big data-verktyg'Alone.

Fördelarna med Big Data

FörstÄ Big Data och dess fördelar

Big data kan bara vara anvÀndbart efter analys. Vi kan analysera denna analys hÀr ram vilket Àr mycket mindre, som nÀr vi gör det frÄgan mot databaser pÄ SQL-server. Men pÄ en mycket stor och massiv datamÀngd kommer datatyperna att vara mer varierade, datamÀngden blir större och strukturen mer komplex. Eftersom detta teknologikoncept myntades, implementerades och utvecklades ramBig data har kunnat ge mÀnskliga liv fördelar.

Citera information frÄn techinasia.com, hÀr Àr en kort sammanfattning av exempel pÄ anvÀndningen av Big Data i Indonesien som presenterades vid konferensen "Big Data Week Indonesia" 2015 (4 Är sedan).

1, Jordbruksinformationssystem

Regi Wahyu, VD för Mediatrac, ett Big Data-analysföretag, rekryterade ett antal begÄvade studenter frÄn Padjadjaran University för att bedriva forskning inom ett risfÀltomrÄde i VÀstra Java.

Informationen som erhÄllits frÄn resultaten frÄn dessa studier samlas in i en Big Data som kan anvÀndas av jordbrukare för att öka grödproduktionen, förutsÀga rÀtt tid att odla grödor och andra.

2, Informationssystem för beskattning

Big data-analys pÄ Generaldirektoratet för skatter (generaldirektoratet för skatter) fortfarande under utveckling. Med Big Data-analys förvÀntas det kunna lösa problem relaterade till samhÀllets lÄga medvetenhet om att betala skatter.

Chefen för den dÄvarande skattedirektören Iwan Djuniardi presenterade i sin presentationsdemo detaljerade visualiseringar sÄsom analys av slÀkttrÀd, typer och tillgÄngar, samt skattetyper och skattebetalningsstatus.

3, Informationssystem för katastrofer

Quick Disaster Àr en applikation för Google Glass som hjÀlper anvÀndare under och efter en katastrof. Till exempel, nÀr en jordbÀvning intrÀffar, kommer Google Glass att meddela information om vad anvÀndare behöver göra och sedan ge rekommendationer för evakueringsvÀgar efter en katastrof intrÀffat. Quick Disaster-applikationen utvecklades av en forskare frÄn Gajah Mada University (UGM) med namnet Daniel Oscar Baskoro.

4, HĂ€lsoinformationssystem

Fortfarande frÄn UGM, en forskare inom hÀlsosektorn vid namn Anis Fuad, förklarade att kliniker och sjukhus i Indonesien fortfarande anvÀnder sina egna applikationer för att registrera patientdata. Uppgifter som skickas till hÀlsoavdelningen Àr fortfarande minimala och ofullstÀndiga.

Genom att anvÀnda Big Data-analys för hÀlsosektorn kommer centralt att öka noggrannheten i sjukdomsförutsÀgelser och befolkningshÀlsans nivÄ i hela landet. För nÀrvarande följs problemet lÄngsamt upp genom att börja bygga databasen pÄ BPJS-systemet pÄ nÀtet,

5, SprÄkinformationssystem

Ruli Manurung frÄn University of Indonesia (UI) uppgav att vi kan klassificera och klassificera miljoner ord pÄ indonesiska med hjÀlp av Big Data. Det kan ocksÄ anvÀndas för att kartlÀgga meningar för att stödja tillÀmpningen av frÀmmande sprÄköversÀttning till indonesiska eller vice versa.

Big Data-egenskaper (5V)

FörstÄ Big Data och dess egenskaper

Big data har 3V grundlÀggande tecken, nÀmligen volym, Velocity, och Variety, Men utvecklingen lades till igen vÀrde och sanningshalten, sÄ det Àr nu kÀnt att ha en grundlÀggande 5V-karaktÀr. Följande beskriver de fem egenskaperna.

1, volym

Detta innebÀr en insamling av data i mÀngden och volymen vilket Àr mycket stort och ibland ostrukturerat. Till exempel foder Twitter, Istagram-flöden, chatttextdata och Whatsapp-status, klickflöde anvÀndaren frÄn sidan webben, Dessa dataflöden kan dimensioneras upp till tusentals Terrabytes (TB) per sekund.

2, Velocity

Data kan nÄs med en hastighet som Àr sÄ snabb att den kan anvÀndas omedelbart pÄ samma sekund. Sedan eran molnlagring och molnberÀkning Under de senaste Ären har internetanvÀndare kÀnt hastigheten för denna datatillgÄngsfacilitet.

Ett bevis Àr att det finns ett operativsystem pÄ nÀtet baserat pÄ Microsoft Silverlight, kontorsapplikationer (office) baserat webben som Office365, molnlagring som Dropbox och GDrive, sidÄtkomsthastighet webben Javascript baserat, ritningsdesignbaserat program webben som Pixlr, applikation utvecklaren Android-baserade appar webben som Kodular och MIT App Inventor, designerapplikationer flödesschema som Draw.io, och mÄnga fler.

3, Variety

Det betyder att den innehÄller olika typer filen, bÄde strukturerade och ostrukturerade. Analys av ostrukturerad data kommer att krÀva nÄgot olika algoritmer, sÄsom text-, bild-, ljud- och videodata.

För sÄdana data kommer att krÀva mer tid att bearbeta den, eftersom det kan vara att i den ostrukturerade informationen finns det fortfarande andra data eller nya data som kan extraheras. Till exempel i MP3-uppgifterna IDv1 och IDv2-tagg, i JPEG-uppgifterna finns det data om vilken typ av kamera som anvÀnds, i PDF-uppgifterna finns namnet pÄ applikationsmakaren och mÄnga fler.

4, vÀrde (Standard)

Syftet med vÀrde Àr hur vÀrdefull eller meningsfull data Àr. Till exempel kommer en anstÀllds biodata för ett tryckföretag inte att vara av vÀrde för att analysera förutsÀgelsen att anstÀlla i lÀkemedelsföretag.

Uppgifterna kanske inte Àr viktiga eller vÀrdefulla i ett fall, men de kan vara mycket viktiga och mycket vÀrdefulla i ett annat fall. Data som inte har nÄgot vÀrde i vilket fall som helst kommer inte att filtreras i Big Data Analys-applikationssystemet.

5, sanningshalten (Ärlighet)

karaktÀr sanningshalten leder till hur exakta och tillförlitliga uppgifterna Àr. FortsÀtt ett exempel i poÀng vÀrde ovan kan det vara inne i MP3-filen IDv1-taggdet har Àndrats sÄ att Àktheten för MP3-filen ifrÄgasÀtts, Àndras IDv1-tagg det kan vara pÄ grund av resultaten utgÄngen ljudbehandlingsapplikation eller filomvandlare MP3. Uppgifter som inte har karaktÀr av Àrlighet eller Àkthet kommer inte att filtreras in i analyssystemet.

TillÀmpningsexempel Framework Big Data-analys

Exempel pÄ applikationsramar för Big Data-analys

Apache Hadoop Àr en samling applikationer öppen kÀllkod som anvÀnds för att samla in och analysera servicedata pÄ nÀtet, MÄnga kallar det bara en Hadoop. Hadoop började tillverkas omkring 2005, officiellt slÀppt 2006 under det officiella namnet Apache Hadoop.

Hadoop Àr designad med Java-programmeringssprÄket, sÄ det kan köras pÄ olika plattformar / operativsystem. Hadoop Àr en samling applikationer som kan fungera som basmodul, undermodul, ekosystem eller samling av ytterligare ett programvarupaket (ytterligare) som kan installeras pÄ den eller sida vid sida med sjÀlva Hadoop-systemet. Hadoop-applikationskollektionen inkluderar: Apache Pig, Apache Hive, Apache HBase, Apache Phoenix, Apache Spark, Apache ZooKeeper, Cloudera Impala, Apache Flume, Apache Sqoop, Apache Oozie och Apache Storm.

Big Data: s historia och koncept började pÄ 1970-talet, det Àr tiden dÄ folk inom informationsteknologi började öppna sin insikt i dataanalys och dess relation till statistik. FortsÀtter fram till Är 2000, en tid dÄ sociala medier började vÀxa snabbt och gjorde mÀnniskor medvetna om vikten av dataanalys pÄ dessa sociala medieplattformar.

Uppgifter som matas in i sociala medier Àr för stora för att kunna lagras och behandlas i ett centraliserat lagermedium. Sedan framkom lÄngsamt nya tekniker för att övervinna detta problem, begreppet NoSQL utvecklades i Apache Cassandra och ram Big data-analys pÄ Apache Hadoop.

Det Àr en förklaring till förstÄelsen av big data tillsammans med fördelarna och applikationsexemplen som kan anvÀndas för att analysera big data. Förhoppningsvis anvÀndbar och lÀtt att förstÄ!

0 Shares