數據科學與大數據技術 萬物分析的大數據
時間:2022-01-07 作者:高考在線 點擊:次
一 專業解析
什么是大數據?
進入互聯網時代,中國的網民人數已超7億,大數據的應用涉及到生活的方方面面。例如,你在網站上買書,商家就會根據你的喜好和其他購書者的評價給你推薦另外的書籍;手機定位數據和交通數據可以幫助城市規劃;甚至用戶的搜索習慣和股市都有很大關系。
在談到大數據的時候,人們往往知道的就是數據很大,但大數據≠大的數據。對外經濟貿易大學信息學院副院長華迎教授介紹:“現在的大數據包括來自于多種渠道的多類數據,其中主要來源網絡數據。數據分析不是新的,一直都有,但是為什么叫大數據呢?主要是因為網絡數據的格式、體量、價值,都超出了傳統數據的規模。對這些海量信息的采集、存儲、分析、整合、控制而得到的數據就是大數據。大數據技術的意義不在于掌握龐大的數據信息,而在于對這些數據進行專業化處理,通過‘加工’實現數據的‘增值’,更好地輔助決策。”
數據科學與大數據技術專業
本科專業中和大數據相對應的是“數據科學與大數據技術”專業,它是2015年教育部公布的新增專業。2016年3月公布的《高校本科專業備案和審批結果》中,北京大學、對外經濟貿易大學和中南大學3所高校首批獲批開設“數據科學與大數據技術”專業。隨后第二年又有32所高校獲批“數據科學與大數據技術”專業。兩次獲批的名單中顯示,該專業學制為四年,大部分為工學。
“數據科學與大數據技術是個交叉性很強的專業,很難說完全歸屬于哪個獨立的學科。所以,不同的學校有的是信息學院申報,有的是計算機學院牽頭申報,有的設在統計學院,還有的在經管學院。像北京大學這個專業是放在理學下,授予理學學位。大多數是設在工學計算機門類下,授予的是工學學位。”華迎教授說:“數據科學很早就存在,是個比較經典的學科,現在和大數據技術結合形成了這個專業。目前教育部設定的本科專業名稱為‘數據科學與大數據技術’,專科名稱是‘大數據技術與應用’。”
數據科學與大數據技術學什么?
以對外經濟貿易大學該專業為例,專業知識結構包括數學、統計、計算機和大數據分析四大模塊,具體課程設置如下:
數學:數學分析一、數學分析二、高等代數、離散數學。統計學:概率論與數理統計、多元統計分析、隨機過程。計算機:數據結構、計算機組成原理、操作系統、數據庫系統原理、C++程序設計、Java程序設計、Python與大數據分析、科學計算與Matlab應用、R語言等。大數據分析:數據科學導論、機器學習與數據挖掘、信息檢索與數據處理、自然語言處理、智能計算、推薦系統原理、大數據分析技術基礎、數據可視化、大數據存儲與管理、大數據分析實踐等課程。
華迎教授介紹:“數據科學與大數據技術是一門實踐性很強的新興交叉復合型學科,無論是開設在哪個學院下,數學、統計學、計算機三大塊課程是必須得有。各高校在這幾門背景學科的基礎上,交叉融合其他的專業知識技能。如我校在數學、統計學、計算機知識體系模塊中又增加了體現學校特色的財經類行業應用和外語模塊,以提升學生的行業應用能力和國際化水平。根據各校偏重的專業方向,課程設置有所差異,感興趣的同學可以具體查看各校的專業和課程設置情況。”
二 專業與就業
行業增速快 人才缺口180萬
隨著移動互聯網和智能終端的普及,信息技術與經濟社會的交匯融合,引發了數據迅猛增長。新摩爾定律認為,人類有史以來的數據總量,每過18個月就會翻一番。而海量的數據蘊含著巨大生產力和商機。
2011年至2014年四年間,我國大數據處于起步階段,每年均增長在20%以上。2015年,大數據市場規模已達到98.9億元。2016年增速達到45%,超過160億元。預計2020年,我國大數據市場規模將超過8000億元,有望成世界第一數據資源大國。但數據開放度低、技術薄弱、人才缺失、行業應用不深入等都是產業發展中亟待解決的問題。
根據領英發布《2016年中國最熱職位人才報告》顯示,有六類熱門職位的人才當前都處于供不應求狀態,稀缺程度各有不同,其中,數據分析人才的供給指數最低,僅為0.05,屬于高度稀缺。
中國商業聯合會數據分析專業委員會資料顯示,未來3至5年,中國需要180萬數據人才,但截至目前,中國大數據從業人員只有約30萬人。同時,大數據行業選才的標準也在不斷變化。初期,大數據人才的需求主要集中在ETL研發、系統架構開發、數據倉庫研究等偏硬件領域,以IT、計算機背景的人才居多。隨著大數據往各垂直領域延伸發展,對統計學、數學專業的人才,數據分析、數據挖掘、人工智能等偏軟件領域的需求加大。
大數據主要就業方向
2015年9月國務院印發《促進大數據發展行動綱要》,系統部署大數據發展工作。《綱要》明確提出了七方面政策機制,其中第六條就是加強專業人才培養,建立健全多層次、多類型的大數據人才培養體系。目前,大數據主要有三大就業方向:大數據系統研發類、大數據應用開發類和大數據分析類。具體崗位如:大數據分析師、大數據工程師等。
“大數據分析師是用適當的統計分析方法對收集來的大量數據進行分析,強調的是數據的應用,側重于統計層面內容會多一些。比如做產品經理,可以通過數據建立金融模型,來推出一些理財產品。而大數據工程師則側重于技術,主要是圍繞大數據平臺系統級的研發,偏開發層面。”華迎教授介紹:“我們把大數據分析在業務中使用的流程總結起來,分為以下幾個步驟:數據獲取和預處理、數據存儲管理、數據分析建模、數據可視化。在這個應用流程中,畢業生可以根據自己的興趣和特長,在不同的環節選擇就業。”
三 報考指南
院校開設情況
教育部關于公布2015年度普通高等學校本科專業備案和審批結果的通知
教育部關于公布2016年度普通高等學校本科專業備案和審批結果的通知
在“教育部2015年度普通高等學校本科專業備案和審批結果”中北京大學、中南大學、對外經貿大學成為首批開設 “數據科學與大數據技術”本科專業的高校,隨后中國人民大學、北京郵電大學、復旦大學等32所高校成為第二批成功申請該專業的高校。目前,我國已有35所高校獲批“數據科學與大數據技術”本科專業,第三批申請結果也即將公布。
數據科學與大數據技術是個交叉性強、跨學科的專業,很難說是完全歸屬與那個獨立的學科。高校牽頭申報的學院不同,培養重點和授予的學位可能不一樣。因為課程來自于不同的學院,也有高校是聯合一些學院單獨成立機構來申報。從名單可以看出,在大部分開設院校中該專業都屬于工學類,有個別院校將其歸屬在理學門類,授予理學學位。
有志于學習數據科學與大數據技術專業的學生,可以從大學的傳統優勢領域和行業背景考慮選擇。比如,復旦大學的大數據技術本科專業是設在大數據學院下;北京大學是在數學院開設了該專業,偏數學的內容更多一些。對外經濟貿易大學該專業設在信息學院,因為財經是學校傳統優勢,專業還會偏重經濟、金融等相關學科領域的知識。
錄取分數不低
從2017年數據科學與大數據技術專業的錄取情況看,該專業的錄取分數還是比較高的。以對外經濟貿易大學和重慶理工大學為例,2017年對外經貿大學數據科學與大數據技術專業在京理科一批錄取最高分653分,最低分646分,平均分650分,平均分高出北京一本批次線113分。
重慶理工大學理學院院長李波介紹,學校理學院有金融數學、數學與應用數學、信息與計算科學、應用統計學、應用物理學、新能源科學與工程專業,數據科學與大數據技術是2017年獲批后開設的。盡管該專業屬于本科二批招生,但首批數據科學與大數據技術專業所招73名學生的平均分超一本線20分左右,并且第一志愿錄取率達百分之百。
只招理科生 注意大類招生
考生報考時要注意,目前獲批開設的院校并非在所有省都有招生計劃,還有的高校是按大類招生。如北京郵電大學該專業2017年本科就是按計算機大類招生。隨著各省高考改革的實施,越來越多的省份加入新高考的序列,未來會有更多的高校施行按大類招生。
值得注意的是,數據科學與大數據技術只招理科生,但女生的比例并不低。據華迎教授介紹:“第一年招生時,我們以為這純工科專業絕大部分都會是男生報考,錄取后發現女生還是很多的,女生比例大概占了這個專業總人數的一半兒。” 重慶理工大學2017年的首批73名學生中,男生45人,女生28人,女生比例占總人數38%。