Tietotieteilijöille iso raha on avoimen lähdekoodin käytettävissä

Big data tarkoittaa suurta korvausta tiedemiehille. Mutta se, millainen tietotekijä olet, määrittelee suurelta osin vain sen, kuinka suuri palkkasi on. Kuten uusi O'Reilly -kysely paljastaa, avoimen lähdekoodin tekniikoihin keskittyvät tiedemiehet ansaitsevat enemmän rahaa kuin ne, jotka edelleen myyvät omaa tekniikkaa. Mitä avoimempia ohjelmistoja tiedät, sitä enemmän rahaa ansaitset isoissa tiedoissa.

Suuri data, iso raha

Koska Big Data on kiinnostunut suuresta arvosta, ei ole yllättävää, että yritykset ovat halukkaita maksamaan mojovaisia ​​palkkoja huipulahjojen rekrytoimiseksi, etenkin kun otetaan huomioon vaikeudet hankkia tällainen kyky. Vuonna 2012 NewVantage Partners valitsi suhteellisen pienen, mutta erittäin pätevän ryhmän avainhenkilöitä suurissa organisaatioissa ja totesi, että 100 prosenttia tutkituista oli ainakin “jonkin verran haaste” rekrytoida tietotekijöitä. Koko 40 prosenttia pitää sitä erittäin vaikeaksi tai mahdottomaksi.

Tätä puutetta vastaan ​​tietotieteilijät hinnoitellaan premium-hinnalla.

Glassoors -tietojen mukaan Yhdysvaltain tietotekijöiden mediaanipalkka on 117 500 dollaria. Sitä vastoin yritysanalyytikko voi odottaa ansaitsevansa noin 61 000 dollaria ja data-analyytikko noin 55 000 dollaria. Gartner-analyytikko Svetlana Sicular hauskaa koko tietotekniikan luokkaa ja nauraa, että ”tietotekijä on 1) Kalifornian tietoanalyytikko tai 2) alle 35-vuotias tilastotieteilijä”.

Se on iso hintahyppy ammattinimikkeen kiillottamiseen.

Tietotekniikan kaupan työkalut

Todellisuudessa tietotieteilijäksi on muutakin kuin pelkästään ammattinimikkeen päivittäminen. Kuten O'Reillyn vuoden 2013 tietojen tiedepalkkakysely osoittaa, "suurten tietojen kenttä on ohjannut uusien, monimutkaisten työkalujen saapumisen, jotka suhteellisen harvat ihmiset ymmärtävät tai ovat jopa kuulleet." Näiden työkalujen tunteminen tuottaa niin suuret palkat.

Mutta millä työkaluilla tietotieteilijä hallitsee, osoittautuu olevan merkittävä, olennainen vaikutus hänen ansaintavoimaansa.

Tärkein tietotyökalu on SQL, mikä ei ole yllättävää: data-analyysi on ollut olemassa jo kauan ennen, kun sille annettiin seksikäs ”data science” -etiketti, ja tietojen käyttäminen SQL: n kautta on pitkään ollut tietojen analysoinnin standardi. Tämä ei muutu yön yli.

Vuoden 2013 tietojen tiedepalkkakysely (luotto: O'Reilly)

Mutta kun siirrymme SQL: n ulkopuolelle, se kertoo kuinka suuri osa eniten käytetyistä Big Data -työkaluista on avoimen lähdekoodin ohjelmia: R, Python, Hadoop ja enemmän. Mielenkiintoisempaa on kuitenkin hajoaminen sen välillä, jota O'Reilly kutsuu ”Hadoop-ryhmäksi” (oranssi) ja “SQL / Excel-ryhmäksi” (sininen):

Vuoden 2013 tietojen tiedepalkkakysely (luotto: O'Reilly)

Tietotieteilijät, jotka käyttävät yhtä työkaluryhmää, eivät käytä toista: teollisuus on karkeasti jaettu kahteen leiriin, ja punainen ryhmä muodostaa olennaisesti reunan Hadoop-ryhmän ympärille. Kuten O'Reilly-raportti ehdottaa: ”Kahdessa klusterissa ei ole yhteisiä työkaluja ja ne ovat korrelaation suhteen kaukana: kahden ryhmän välillä on vain neljä positiivista korrelaatiota (lähinnä Tableaun kautta), kun taas mahtavia 51 negatiivista korrelaatiota on. ”

Rahat ovat avoinna

Vaikka jonkin verran mielenkiintoista on, että tietotieteilijät jakautuvat puolueiden suuntaan - Hadoop vs. SQL, avoin vs. suljettu -, mielenkiintoisempi havainto, jota O'Reillyn raportti tekee, on vain kuinka paljon tämä jako johtaa palkkaeroihin.

Mitä enemmän datatyökaluja datatutkija käyttää, sitä enemmän hänen palkansa nousee. Kun tietotekijä käyttää vähintään kymmentä työkalua, hänen palkansa nousee huomattavasti:

Vuoden 2013 tietojen tiedepalkkakysely (luotto: O'Reilly)

Mielenkiintoista on, että avoimen lähdekoodin / Hadoop-klusterin käyttäjät käyttävät yleensä paljon enemmän työkaluja ja siten ansaitsevat huomattavasti enemmän rahaa. Kuten raportin kirjoittajat huomauttavat, "Median peruspalkka nousee yleensä Hadoop-klusterissa käytettyjen työkalujen määrän kanssa, 85k dollarista niille, jotka eivät käytä mitään sellaisia ​​työkaluja, 125k dollariin niille, jotka käyttävät vähintään kuutta." Suojattujen / SQL-maissa työskentelevien käyttäminen viiden tai useamman patentti klusterin työkalun avulla johtaa huomattavaan palkanlaskuun.

Vaikka on olemassa tapoja selittää palkkojen ilmeinen ero, kirjoittajat päättelevät:

"Vaikuttaa erittäin todennäköiseltä, että R, Python-, Hadoop-kehysten, D3: n ja skaalautuvien koneoppotyökalujen käytön tuntemus antaa analyytikolle korkeammin palkatut tehtävät - enemmän kuin SQL-, Excel- ja RDB-alustojen tuntemisen. Voimme. päättele myös, että mitä enemmän työkaluja analyytikko tietää, sitä parempi: jos aiot oppia työkalun Hadoop-klusterista, on parempi oppia useita. "

Ja sitten he huomauttavat erittäin sanovasti:

"Hadoop-klusterin työkaluilla on yhteinen piirre: ne kaikki sallivat pääsyn suuriin tietokokonaisuuksiin ja / tai tukevat suurten tietojoukkojen analysointia. Analyytikkojen, jotka osaavat työskennellä suurten tietojoukkojen kanssa, kysyntä kasvaa, etenkin niille, joille jotka voivat suorittaa edistyneempiä koneoppimis-, kuvaaja- ja reaaliaikaisia ​​tehtäviä suurissa tietokokonaisuuksissa. Ennen kuin tällaisten analyytikoiden tarjonta saa kiinni, heidän palkansa luonnollisesti lisätään. "

Toisin sanoen avoimen lähdekoodin työkalut saattavat sopia paremmin suurten tietojoukkojen käsittelemiseen, kun taas omistamilla työkaluilla on yleensä kapeampi, kyselypohjainen apuohjelma. Lisäksi työkalut, kuten Python ja R, antavat käyttäjälle laajan liikkumavaraa muokata data-analytiikkaa sen sijaan, että asettavat rajoituksen, jonka omistaja toimittaa.

Mitä tämä voi tarkoittaa, on se, että SQL / Excel-reitin käyttäminen on kunnollinen tapa viettää vanhan koulun tietojen analysointia, mutta jos haluat todella syventää tietotekniikkaa ja saada palkkaa komeasti ponnisteluistasi, sinun on todella mene auki Hadoopin, Pythonin, NoSQL: n ja muiden johtavien avoimen lähdekoodin suurten tietotyökalujen kanssa.

© Copyright 2020 | mobilegn.com