數據科學、大數據和物聯網正在以令人炫目的速度發展和演進,而商業(ye) 界正以緩慢的速度將更多來自不同渠道的數據整合起來,並能從(cong) 中洞察更多信息。本文是 Andrew Dipper 對數據科學行業(ye) 2017年的展望,並列舉(ju) 了四大重要趨勢。
大數據技術的崛起
在過去一年,我們(men) 已經見證了大數據技術驚人的成長,但隨著大數據技術在企業(ye) 界中被廣泛接受,下一年留給大數據技術的預算會(hui) 快速增加。大多數企業(ye) 已經確認需要在業(ye) 務的數據方向上進行改進,這轉而會(hui) 需要更多的數據科學家來處理企業(ye) 需要檢索的大量額外數據。
如果你在追求一份數據科學領域的職業(ye) ,那麽(me) 有關(guan) 大數據和數據框架的知識是必備的。你可以特別注意一下以下幾個(ge) 平台:Apache Hadoop, HDFS, Hbase, Spark, Storm, Solr 和 Kafka。
數據科學從(cong) 業(ye) 資格的變化
雖然 Elon Musk認為(wei) 機器學習(xi) 正在“召喚惡魔”,但是它仍將繼續發展。Amazon, Facebook 和 Google都在最近幾年加入到了人工智能的競賽中。在2017年,越來越多的企業(ye) 會(hui) 招募最頂尖的機器學習(xi) 數據科學家。
但同時,工作崗位的競爭(zheng) 也變得更加激烈。在越來越多的大學將 AI 列入課程要求的背景下,從(cong) 2017年開始,機器學習(xi) 會(hui) 成為(wei) 數據科學行業(ye) 入門的必備條件。如果你想在競爭(zheng) 中取得先機,有不少的AI和機器學習(xi) 的認證課程供你選擇。雖然有一些課程的價(jia) 格達到1萬(wan) 美元,不過在 Coursera 或者 edX 上也有為(wei) 數不少免費或低價(jia) 的培訓課程。
如果你擁有很強的科技和編程能力,也能夠幫助你在數據科學領域獲得一席之地,尤其是 R 和 Python 語言。同時,SAS 和 MATLAB 的經驗自然也是加分項。
而且,你需要能夠自如地使用關(guan) 係型數據庫,所以SQL也是一項非常重要的技能。在2015年一項綜合了 3500 個(ge) Linkedin 招聘廣告的研究中,SQL被列為(wei) 最重要的技能。另外,Hadoop, Python和 Java 也同樣流行。
物聯網和數據科學的融合
雖然存在一些關(guan) 鍵的不同點,但是數據科學和物聯網經常被視為(wei) 一個(ge) 硬幣的兩(liang) 麵。數據科學家會(hui) 更多地需要從(cong) 設備中讀取實時數據,進行複雜的分析或以此作出決(jue) 策。在這樣的背景下,這兩(liang) 個(ge) 行業(ye) 在明年將會(hui) 有更深的融合。