Du kan bli en dataminer även om du bara kan Excel-analys

När jag ser dataminers prata om storskalig databearbetning och maskininlärningsalgoritmer tror jag att det är så här en dataanalytiker ska se ut, det här är mästaren.

Till exempel, eftersom byrån har hanterat en partners datautvinningsteam, när det är nödvändigt att utvärdera prestandan för varje dataminer, visar det sig att den starkaste tekniska förmågan ofta rankas efter, och den högsta utvärderingen är ofta den person som har en idé och är villig att samarbeta, den personen kommer inte ens att skriva R eller Python, utan bara EXCEL-analys.

Varför?

Att ranka först en gång kan sägas vara slumpmässigt, men varje gång det är den första måste det finnas en inneboende faktor, respekterar vi verkligen inte tekniken, kan inte tekniken effektivt skapa produktivitet?

Uppenbarligen inte, författaren anser att vår kognition av data miner har avvikit, kommer att vara algoritmer, kommer verktyg, kommer att bearbeta naturligtvis är ett effektivt sätt, men uppenbarligen inte det enda sättet att stödja det slutliga beslutet, eller ens det viktigaste sättet , detta är vad många människor inte kan se, anledningen till att inte kan se, kan ha något att göra med metafysik, såsom datautvinning Dessa ord i sig är ur perspektivet av sätt att beskriva inlägget, med en stark teknisk färg, t.ex. som att begränsa data, begränsa gruvdrift, Låt alla tro att ju mer avancerade professionella gruvmetoder som används inom dataområdet, desto mer sannolikt är det att generera intäkter, men verkligheten är mycket mer komplicerad.

Så vad gör en bra dataminer?

Först och främst, låt oss förstå vad som kallas verklig professionell kunskap, författaren berättar först en historia, Cheng Jia gav ett sådant exempel i boken "Studera väl":

"Xiao Ying är chefredaktör för Luo Ji Thinkings "Elite Daily Class" i appen, den här tjejen är hård, ofta klockan tre eller fyra på morgonen, om du inte har "fått" samarbete med Luo Ji Thinking, du kommer inte att veta hur galna människorna i det här laget arbetar. ”

"Få människor, mer arbete och mer krävande - det verkar som att detta inte bara är smärtan för designindustrin, utan också en sann skildring av att "få" lagets arbete. Men enligt min mening har många ofullbordade uppgifter utförts av Xiaoying väl, med hennes ord: här måste vi leva ensamma som ett team. ”

"Vilken typ av team har Xiao Ying blivit som person?" Hon är ensam ansvarig för temaplanering, ljudinspelning, ljudredigering, innehållsgranskning, granskning av meddelanden, brytning av nya författare, underhåll av gamla författare, utveckling av nytt innehåll, planering av marknadsföringskopiering... När hon kastade sig in i ett team som kunde fullborda förmågan att " spaning, "bakhåll", "prickskytt" och "omringningspunkt" när som helst, blev hon en slash-ungdom. ”

Därför, för att göra ett bra jobb, är det inte så att det räcker att bara lära sig kunskapen om ett visst yrke, och det är inte heller bara att lära sig detta, det vill säga också att lära sig, utan att lära sig alla kärnförmågor relaterade till att lösa en viss typ av problem, som måste bryta igenom de professionella begränsningarna.

Det vi kallar yrken, som marknadsföring, juridik, politik, historia, litteratur, IT eller dataminers, är bara artificiella klassificeringsetiketter, men världen fungerar inte separat inom varje yrke enligt de etiketter du delar upp. Bakom ett marknadsföringsproblem finns det ofta juridiska, politiska, historiska och kulturella faktorer, men våra så kallade professioner bryr sig inte om dessa: du lär dig 4P (produkt, pris, kanal, marknadsföring), marknadssegmentering och andra koncept, du kan ta examen, kommer denna förståelse i hög grad att hindra oss från att lära oss den kunskap som vi verkligen borde lära oss.

Dataminers stödjer beslutsfattande, så vilken kunskap handlar det om att fatta beslut?

Om du vill tjäna pengar externt baserat på data måste du förstå de olika vertikala industrierna, vilket är det viktigaste inom datautvinning, om de grundläggande begreppen på det finansiella området inte är tydliga, säg inte att du gör riskkontroll modeller för andra, en av de största utmaningarna för operatörer att göra extern realisering är att de inte förstår branschen.

Om du vill lägga data för precisionsmarknadsföring måste du lära dig lite marknadsföringskunskap, för att känna till 4P, det grundläggande konceptet för marknadssegmentering, är marknadens affärsprocess inte tydlig, den så kallade datadrivna verksamheten är också drog, effekten av data mining är relaterad till policyer, produkter, kanaler, var är bara en fråga om data?

Du måste förstå gruvdriftens behov du måste kommunicera med människor, den här gången måste du lära dig lite psykologi, grundläggande emotionell intelligens eller att ha, envishet är datamineraren för att vara ett problem, en bra gruvarbetare är först och främst en bra lyssnare, gör data mining inte engagera sig i någon ensamvarg och hjältemod.

Om du vill visa dina resultat måste du förstå punktpyramidens princip, veta hur du uttrycker resultaten av din analys tydligt och korrekt, låta folk förstå på ett ögonblick, kanske har du använt beslutsträdsalgoritmen otaliga gånger, men du kanske inte känner till hierarkianalysmetoden.

Du behöver lämna uppgifterna till omvärlden, men måste också förstå en del juridisk kunskap, känna till statens policys kring personlig integritetsskydd och företagets regelverk för informationssäkerhet, annars få dumt nog få ut listan, göra ett stort väsen men kommer att dömas .

Dataminerare ramas ofta in av sekulära etiketter för att rama in sina egna möjligheter, så att lära sig är att lära sig vad som finns inuti etiketten, läsa en massa algoritmböcker, lära sig en massa språk och förstå många EXCEL- och PPT-färdigheter, men dessa ensam kan faktiskt inte göra saker.

Vad författaren vill säga är att i den här världen, om du vill uppnå det ultimata, måste du lära dig "onyttig användning", värdelös användning, för att vara till stor nytta.

Om vi ​​förstår förmåga ur detta perspektiv måste vi hoppa ur begränsningarna, och vi behöver lära oss tre nivåer av kurser under vår livstid: (1) Offentliga grundkurser: exekutiv förmåga; (2) Obligatoriska yrkeskurser: yrkesskicklighet; (3) Allmän obligatorisk kurs: strukturell förmåga.

För dataminerare är den offentliga grundkursen den exekveringsförmåga som var och en av oss använder varje dag, såsom tidshantering, affärsetikett, kommunikation, EXCEL, PPT, mindmapping etc. Det finns ett stort antal böcker på marknaden för att introducera dessa kunskaper, och det är bekvämare för oss att lära oss och bemästra.

Som nämnts tidigare hänvisar denna major inte till ordet gruvdrift, utan hänvisar till summan av alla förmågor som kan lösa ett beslutsfattande problem med data från början till slut, man måste tänka och lösa problem över discipliner, och en person lever som ett team. Kunskapen om denna typ av systematisk problemlösning är ofta implicit, och vi måste förstå finesserna i kunskapskonvergens över flera domäner i processen av kontinuerligt övningar och tänkande, för att flexibelt kunna kalla kunskapen mellan flera discipliner när som helst och vinna en kamp, ​​förutom traditionella data, plattforms- och algoritmkunskaper, men inkluderar även matematisk kunskap, marknadsföringskunskap, branschkunskap, psykologisk kunskap, säkerhetskunskap, analysmetoder och så vidare.

De allmänna obligatoriska kurserna är vad jag såg från Chengjias "Good Learning", och jag tror att detta är en del kunskap som går mot en högre kognitiv nivå, som Newtons andra lag F=ma, som kan styra våra handlingar bredare och mer allmänt. , även kallad "kritisk kunskap", kallade Charlie Munger "universell visdom", såsom sammansatt ränteeffekt, sannolikhetsteori, gyllene sinnescirkel, evolution, systematiskt tänkande, två åtta regler och så vidare.

Till exempel betonar systemtänkande "relation", snarare än "människor och saker", även om datamodellering är mycket viktig, men viktigare är relationen, det vill säga behovet av att öppna upp effektdata och den ursprungliga modellen för denna feedback optimeringsprocessen, ChengJia också genom relationsanalysen av Wei Zexi-incidenten, bedömde att grundorsaken till Baidus "ondska" är avsaknaden av en normaliserad återkopplingsmekanism för sökeffekten, Taobao är osannolikt att ha ett så dåligt problem på grund av köparen recensioner.

Till exempel två-åtta-principen, datautvinning har spenderat för mycket pengar på databehandling, variabelberedning och modellsläpp, denna del tar lång tid, värdet är litet, uppfyller uppenbarligen inte två-åtta-principen, det är nödvändigt för att minska längden på denna del så mycket som möjligt, vilket är anledningen till att författaren hoppas kunna göra en del genombrottsarbete inom agilt datautvinning.

För dataminers är att kunna stå ensam förkroppsligandet av omfattande kvalitet, och dess nivå representeras definitivt inte av att behärska flera algoritmer och flera verktyg, vilket kan förklara varför vissa människor som inte är särskilt bra på algoritmverktyg fortfarande har så stark data analysförmåga ser vi ofta bara den "synliga" professionella förmågan och ignorerar ofta odlingen av "osynlig" professionell förmåga.

Var den första att kommentera

Lämna ett svar

E-postadressen publiceras inte.


*