Big Data時(shí)代到來!留學(xué)生該如何把握!站在風(fēng)口上
任何行業(yè)都需要數(shù)據(jù)的支撐
和數(shù)據(jù)有關(guān)的職位成了大熱門
和數(shù)據(jù)有關(guān)的能力變成了求職必備技能
麥肯錫公司的研究預(yù)測(cè)稱,
2018年,“具有深入分析能力的人才”,
美國(guó)可能面臨著14萬到19萬的缺口,
“利用大數(shù)據(jù)分析來做出有效決策的經(jīng)理和分析師”
缺口則會(huì)達(dá)到150萬。
該領(lǐng)域目前異?;鸨?!
今天就來細(xì)數(shù)一下,大數(shù)據(jù)的專業(yè)、職位到底有哪些?
● 數(shù)據(jù)相關(guān)的專業(yè)有哪些
1.BA專業(yè):BA 全稱 BusinessAnalytics,是以商業(yè)知識(shí)為基礎(chǔ),數(shù)理編程為手段,從數(shù)據(jù)分析出發(fā),以決策優(yōu)化來創(chuàng)造價(jià)值的新興專業(yè),實(shí)現(xiàn) Big Data 的商業(yè)應(yīng)用。一個(gè) BA 應(yīng)該是深入了解商業(yè)模式又有技術(shù)背景的數(shù)據(jù)分析專家。
2.Data Science :數(shù)據(jù)科學(xué)是研究數(shù)據(jù)的產(chǎn)生、獲取、存儲(chǔ)、傳輸、處理、可視化、利用及其相互關(guān)系的學(xué)科,它是當(dāng)代科學(xué)的前沿學(xué)科,對(duì)幾乎所有其他學(xué)科都有很強(qiáng)的協(xié)同性和滲透性,生動(dòng)地體現(xiàn)出整個(gè)基礎(chǔ)學(xué)科在大數(shù)據(jù)時(shí)代科技進(jìn)步中的先導(dǎo)作用。
3.統(tǒng)計(jì)專業(yè):統(tǒng)計(jì)學(xué)是一門很專的學(xué)科,但是一個(gè)好的統(tǒng)計(jì)學(xué)工作者也必須是一個(gè)通才,不僅熟悉統(tǒng)計(jì)工具的運(yùn)用,也需要了解行業(yè)特點(diǎn),才能做好數(shù)據(jù)決策。這也是統(tǒng)計(jì)工作的一個(gè)好處,可以結(jié)合你的興趣與幾乎所有其他領(lǐng)域的科學(xué),技術(shù)或業(yè)務(wù)。
4.數(shù)學(xué)專業(yè):數(shù)學(xué)是抽象的研究數(shù)量、結(jié)構(gòu)、空間和變化的科學(xué)。主要是研究從客觀世界中抽象出來的數(shù)學(xué)規(guī)律的內(nèi)在聯(lián)系,也可以說是研究數(shù)學(xué)本身,而不以應(yīng)用為目的的學(xué)問;而應(yīng)用數(shù)學(xué)著眼于說明自然現(xiàn)象,解決實(shí)際問題,是純粹數(shù)學(xué)與科學(xué)技術(shù)之間的橋梁。
● 數(shù)據(jù)相關(guān)的職業(yè)有哪些
和數(shù)據(jù)相關(guān)的職位包括 Data Analytics / Data Science / Business Analytics/ Data Architect/ Data Engineering...都需要數(shù)據(jù)處理的能力。只是側(cè)重點(diǎn)有所不同,通過 Data這個(gè)詞后面所加的單詞就可以看出,不同領(lǐng)域的 Data 技能同樣重要,有偏向科技方面的,有偏向商業(yè)方面的,也有偏向工程方面的。不管是什么領(lǐng)域的 Data 工作,都是通過數(shù)據(jù)分析去引領(lǐng)決策。下面我們具體來看下數(shù)據(jù)專業(yè)的薪資有多少?
1. Business Analyst:商業(yè)分析師
2. Data Analyst:數(shù)據(jù)分析師
3. Data Architect:數(shù)據(jù)架構(gòu)師
4. Data Engineer:數(shù)據(jù)工程師
5. Data Scientist:數(shù)據(jù)科學(xué)家
6. Marketing Analyst:市場(chǎng)分析員
7. Quantitative Analyst:定量分析
8. Statistician:統(tǒng)計(jì)學(xué)家
● 看看這些薪資真是夠誘人的。那么數(shù)據(jù)專業(yè)的你可以去哪些行業(yè)呢?哪些行業(yè)急需數(shù)據(jù)專業(yè)的人才?
隨著數(shù)據(jù)時(shí)代的到來,未來幾年 Data 相關(guān)的 Open position 也會(huì)日益增多并且炙手可熱。處理 Data 已經(jīng)不僅僅局限在傳統(tǒng) IT 公司。還有以下行業(yè),尤其是金融業(yè)對(duì)于數(shù)據(jù)人才的需求也在持續(xù)擴(kuò)大。
具體來看下四大、金融機(jī)構(gòu)和咨詢公司為什么愛招數(shù)據(jù)專業(yè)的人:
四大
美國(guó)注會(huì)協(xié)會(huì)會(huì)長(zhǎng) Barry Melancon 最近發(fā)言說,“會(huì)計(jì)師事務(wù)所非常適合在解讀和使用大數(shù)據(jù)實(shí)現(xiàn)戰(zhàn)略業(yè)務(wù)目標(biāo)方面發(fā)揮領(lǐng)導(dǎo)作用。鑒于金融專業(yè)人士每天都遇到的大型數(shù)字?jǐn)?shù)據(jù)集,掌握數(shù)據(jù)分析是必要的,而不是一種選擇。另外,CFO 也應(yīng)該幫助公司創(chuàng)造一種文化:管理者應(yīng)該更多的使用預(yù)測(cè)分析來做決定,而不是像從前一樣依靠經(jīng)驗(yàn)和本能。”例如,畢馬威(KPMG)已經(jīng)在其“全球數(shù)據(jù)分析解決方案”的五年投資項(xiàng)目中投入了5億。他們與 McLaren Applied Technologies 組成了戰(zhàn)略聯(lián)盟,并且開始將其預(yù)測(cè)分析技術(shù)應(yīng)用到了其審計(jì)和咨詢業(yè)務(wù)當(dāng)中。
金融機(jī)構(gòu)
數(shù)據(jù)貨幣化預(yù)計(jì)將在2017年成為一個(gè)熱門話題。各種組織看好內(nèi)部數(shù)據(jù)的價(jià)值,畢竟數(shù)據(jù)就是黃金。下一步是與客戶、合作伙伴和供應(yīng)商一起最大限度地提高收集的外部數(shù)據(jù)的經(jīng)濟(jì)效益。因此從數(shù)據(jù)中獲得價(jià)值的能力將成為數(shù)字商業(yè)生態(tài)系統(tǒng)中戰(zhàn)略的不可分割的一部分。
咨詢公司
數(shù)據(jù)分析是 Consulting 的老本行,隨著技術(shù)的不斷變革,咨詢行業(yè)也越來越需要能夠處理集成大數(shù)據(jù)的人才來更好地為客戶服務(wù)。在數(shù)據(jù)人才炙手可熱的今天,咨詢公司的薪資也是蹭蹭蹭地在飆漲。
● 數(shù)據(jù)行業(yè)必備技能
必備技能
1、Data Hacking
要有獨(dú)立從各種各樣的地方把數(shù)據(jù)化為己用的能力。可能會(huì)用到的:
SQL:用來存儲(chǔ)和查詢Structured 數(shù)據(jù)
Programming:比如用 Python forparsing/scraping data 。如果既會(huì)一門 Scripting language,又會(huì)一門 Compiled/object oriented language,會(huì)是優(yōu)勢(shì)。主要是用來處理Unstructured數(shù)據(jù)。
Hadoop/parallelprocessing:你處理的數(shù)據(jù)可能太大無法一次性裝入內(nèi)存,而你需要對(duì)數(shù)據(jù)進(jìn)行快速的分析,這就需要 MapReduce 等技術(shù)。
這其中,SQL 和 Programming 是最基本的,你必須會(huì)用 SQL 查詢數(shù)據(jù)、會(huì)快速寫程序分析數(shù)據(jù)。
要想更深入的分析問題,你可能還會(huì)用到:
Exploratory analysisskills,可以使用 Python、R、Matlab 等各種工具,IT 公司用 SAS 和 SPSS 相對(duì)較少,盡管有些 Job ads/descriptions 里提到了,當(dāng)然也不是完全不可以。但是如果你只會(huì) SAS,那么選擇無疑要少很多。
Optimization、Simulation:有些職位需要研究顧客需求變化,調(diào)整產(chǎn)品或者服務(wù)價(jià)格,來幫助公司最大化盈利。
Machine Learning、Data Mining:比如有人用數(shù)據(jù)挖掘技術(shù),發(fā)現(xiàn)很多人在超市里買尿布的同時(shí),也買了啤酒 – 現(xiàn)在還沒理解為啥,但是也許尿布和啤酒應(yīng)該放一起賣;另外比如手機(jī)廣告的精準(zhǔn)投放。
Modeling:你需要理解不同的統(tǒng)計(jì)模型有什么應(yīng)用范圍、有什么限制和特長(zhǎng)。
必備技能
2、ProblemSolving
你不光要理解 What users say they want,你還需要真正的理解 What theyactually mean、轉(zhuǎn)化定義出一個(gè)可以用數(shù)據(jù)解決的問題,然后選擇正確的分析工具,量化分析和解決問題。
必備技能
3、Communication
數(shù)據(jù)科學(xué)家會(huì)跟公司的很多不同部門的人打交道,如果你希望接觸像市場(chǎng)營(yíng)銷這樣的部門,希望跟上級(jí)領(lǐng)導(dǎo)多多打交道,那你需要有較強(qiáng)的交流能力。
你需要知道區(qū)分什么是問題本質(zhì)、什么是技術(shù)細(xì)節(jié),要有能力給上層領(lǐng)導(dǎo)講 High level 的分析和推薦,有能力給同事講解和 Defend 你的技術(shù)細(xì)節(jié),也就是”見什么人說什么話”,這不是說要你油滑,而是說要知道什么時(shí)候需要隱藏技術(shù)細(xì)節(jié),而只展現(xiàn)跟聽眾最相關(guān)的信息。
你很可能要經(jīng)常做 Presentation,需要很強(qiáng)的Visualization 的能力,熟悉 Edward Tufte 和 Nathan Yau 的東西,會(huì)很有幫助。另外,也許你很喜歡高深的方法,覺得你懂你NB,但是一切的解決方案,都要從產(chǎn)生 Business revenue 的角度來考慮是否合理。你也可能需要跟 Software development team 合作,需要講清楚需要他們實(shí)現(xiàn)什么、需要告訴他們什么地方需要改進(jìn)。