當前位置: 首頁 精選范文 大數據時代的概述范文

        大數據時代的概述精選(五篇)

        發布時間:2024-03-05 14:39:02

        序言:作為思想的載體和知識的探索者,寫作是一種獨特的藝術,我們為您準備了不同風格的5篇大數據時代的概述,期待它們能激發您的靈感。

        大數據時代的概述

        篇1

        關鍵詞:學習分析;數據挖掘;大數據

        隨著信息化技術的飛速發展,傳統的教育方式也發生了翻天覆地的變化。MOOCs、云課堂等大量的在線教育模式的出現,使得教育信息化程度不斷深入。各類在線學習系統已經獲取和存儲了海量的學生信息以及與學習過程相關的數據。如何獲取、挖掘、理解、處理和利用在教育領域中產生的海量數據已成當務之急,學習分析應時而生。

        一、學習分析的定義

        2011年,在第一屆學習分析與知識國際會議上,將學習分析定義為測量、收集、分析和報告關于學習者及其學習情景的數據,以期了解和優化學習和學習發生的情境。美國新媒體聯盟(New Media Consortium)對學習分析也有類似的定義,認為學習分析是利用松散耦合的數據收集工具和分析技術,研究分析學習者學習參與、學習表現和學習過程的相關數據,進而對課程、教學和評價進行實時修正。

        可以這樣理解,學習分析所研究的數據是整個教育活動所產生的海量數據和學習分析過程中所產生的中間數據。這些數據包括集中式學習環境下,學生上傳下載的學習資料、登錄次數、每次學習時間、考試成績等學習活動日志,以及分布式學習環境下,學生們通過郵件、短信、社交網絡開展的學習討論等。

        隨著可穿戴設備的不斷推廣和普及,可穿戴設備所捕獲到的心率等各項身體活動數據,也將成為研究的數據來源。在此基礎上,評估或預測學生的學習活動,并從中發現潛在的問題,為教育活動相關者提供決策支持,并進一步優化學習過程,設計更適合的學習情境。

        例如,學習分析可以及時發現學生存在的問題,缺少前驅知識、某個知識技能掌握不達要求等等。這時,教師們就可以針對不同情況合理干預學生的學習活動,修改教學內容、改善教學方式等。當時,這只是一方面,學習分析所能做的遠不止于此。

        二、學習分析的研究內容及應用

        學習分析在對學習者知識、學習者行為以及學習者本身建模的基礎上發現潛在問題,通過解決問題優化教學資源和教學策略,預測未來學習趨勢和結果等。能從學習分析中受益的包括教育系統相關的各個參與者,如學生、教師、研究人員、教育管理者和政策制定者等。

        研究者通過學習者在線學習過程中,應答的正確率、回答問題時間、重復修改次數等抽取學習者與在線系統之間所產生的交互數據,以此來建立學習者知識模型。從模型中可以清楚地了解學習者所學習的知識和技能的掌握情況。這樣,系統就可以在學習者需要時推送合適的學習內容。

        學習行為建模是從在線交互數據中提取知識的學習順序、每個知識點的點擊次數、完成學習所花費的時間、線上和線下考試成績、學習行為的變化情況等建立學習行為與學習結果之間的對應關系,以此來研究什么樣的學習行為可以取得更好的學習成績,哪些學習存在學習失敗的可能性。

        對學習者本身建模,是為了構建個人學習特性,例如學習的風格、偏好、目標,完成情況等,這樣做的目的是對有同樣學習特性的人進行分組和聚類。通過研究該模型,可以有針對性的提供個性化的學習環境,從而提高學習效率。

        學習分析可以應用于優化教學資源和教學策略。它可以幫助教師實時監控網絡教學情況,評估課程設計的效果,從而為教師在教學實踐中做出合理決策。通過對大量的相關數據的采集和分析,能夠發現隱藏在每個學習者背后的學習偏好和學習模式,為學習者提供真正適合個人的個性化學習環境和學習建議,有效提高學習效果。

        云計算、數據挖掘、社會網絡分析、物聯網等技術使學習分析成為可能。但學習分析目前仍處于發展初期,還面臨著多方面的挑戰。數據來源多樣、分布存儲等使得數據預處理過程復雜繁瑣,如何從海量數據中獲取適合開展學習分析的有效數據占了大部分工作量。另外,學生隱私和檔案的道德問題也是我們要格外關注的重點。隨著學習分析的不斷深入研究,它也將得到更加廣泛的應用,為每一個學生提供更適合自己的個性化教育資源,不斷深化教育信息化的發展。

        參考文獻:

        [1]SIEMENS G, LONG P. Penetrating the fog: Analytics in learning and education[J]. Educause Review, 2011, 46(5): 30-32.

        篇2

        個人健康大數據,是大數據時代里醫療大數據的內容之一,指個人從出生到死亡的全生命周期過程中,因免疫、體檢、門診、住院等健康活動所產生的大數據。按照歸整的部門分為醫療衛生領域、金融保險領域、公安領域等。留存于醫療衛生領域的大數據,被理解為醫療大數據。

        國家對于醫療大數據也早已做了頂層設計,2014年衛計委了“46312”工程,對國家衛生、計生資源整合做了頂層設計規劃,其中的“3”就是指三大數據庫,分別為電子健康檔案數據庫、電子病歷數據庫和全員人口個案數據庫。

        醫改試點城市上海,已經在信息化、大數據支持上推進醫改。具體來說,就是用大數據建立分析標準、評價體系、管理機制,以及基于大數據的決策和公立醫院運行模式。對于曾經的評價方式,上海市醫改辦副主任許速稱,“現在醫院的評價體系是收入、門診量、住院病人,但這會使醫院的規模越做越大、收入越來越高、病人和財政的負擔越來越重。公立醫院產出評價體系和管理機制,應以衛生信息化為基礎,建立以公益性和效率為核心的機制。”

        他表示,“公立醫院的產出應主要是病種,并通過大數據研究病種和寄主的關系,病種和資源的關系,資源和醫務人員的效率、符合的關系,建立標準是上海醫改的核心。”

        具體來說,就是基于客觀數據,按照疾病診斷和技術應用設定病種組合指數,測算公立醫院平均病種組合指數,形成公立醫院醫療服務產出評價的度量衡。分析病種與效率、技術、費用、資源的關系,科學評價公立醫院服務效率、技術水平、費用控制、資源配置的合理性。以此來落實政府政策和政府管理。

        此外,利用大數據分析疾病的病理和病因還將發現其他機會,如肺癌和胃腸道癌在中國的發病率較高,這些樣本和分析對于正在尋找研發目標的制藥企業也極具價值。

        在大數據的驅動下,未來醫療資源優化配置的路徑也將發生變化,在方正證券研究所的一項報告指出,醫療衛生領域三大數據庫分為健康檔案庫、人口庫、電子病歷庫,其中醫院內部所產生的醫療數據價值最高,尤以基于電子病歷的臨床數據更甚。醫療衛生信息化產品搶占數據入口,應重點關注三類產品:基于電子病歷的臨床信息系統(抓取底層數據)、院內“集成/開放”平臺(標準化數據),區域集成平臺(共享數據)。

        2015年1月28日,國家衛計委下發《關于印發進一步改善醫療服務行動計劃的通知》,北京協和醫學院公共衛生學院院長劉遠立團隊在2015年底作為第三方機構,對醫院、醫患雙方的工作效果進行了評估。數據標準化開始在監管層面應用。

        根據劉遠立團隊的研究,臨床質量測量中最重要的是結果指標。“影響臨床療效的因素很復雜,加上醫院與患者個體差異,如果不進行標準化,即使有大量的電子病歷,也可能是蘋果和桔子相比較。”

        篇3

        [摘 要] 大數據時代的來臨,給教育帶來了全新的變革,開啟了教育的新篇章。數據挖掘技術分析了當前教育存在的問題,針對問題提出了大數據技術在教育資源、教育管理、評比系統及因材施教等方面的應用,尤其針對Visual FoxPro數據庫設計這門課,設計了學生反饋信息獲取和教學資源共享網站,更好地實現個性化教育,從而構建可行的教學模型。

        [關鍵詞] 大數據技術;數據挖掘技術;教育資源;教育管理

        doi : 10 . 3969 / j . issn . 1673 - 0194 . 2017. 05. 133

        [中圖分類號] G434;TP311.13 [文獻標識碼] A [文章編號] 1673 - 0194(2017)05- 0244- 03

        0 引 言

        教育是國之根本,教育的發展預示著國家未來的發展。國家的強大離不開人才的培育,人才的培育需要一個良好的教育體制,教育體制的好壞決定了未來人才的輸送。教育改革需要應用現代信息技術的各種手段,為其提供高效、便捷的溝通平臺,從而實現信息的實時交流。對此,本文提出將大數據技術作為教育改革的第一手段,針對當前的教育問題制定可行性計劃,有效地將數據收集、數據分析、數據處理、數據應用完美的結合到教育的改革中,從而使教育的發展腳步向前邁進一大步。

        1 教育存在的問題

        教育,教化育人,以現有的經驗、學識推敲于人,為其解釋各種現象、問題或行為,其根本是以相對成熟或理性的思維來認知新的事物,并將其見解育之他人,實現信息傳承的過程。在這個傳承的過程中,隨著時代與科技的發展,教育的體制與核心也在不斷地變化,其中的很多問題也越來越明顯。

        (1)教育資源繁多,選擇教育方案困難。

        (2)教育制度不夠透明,阻礙教育的發展。

        (3)傳統的教育管理方法無法滿足現代教育發展的需求。

        (4)學生信息反饋不及時,無法做出最準確的解決方案。

        2 大數據與數據挖掘

        2.1 大數據

        大數據,即big data或massive data,是指規模大到無法在有限的時間內用常規軟件工具對其內容進行收集、管理和處理的數據集合。例如,一個學生考了99分,這只是一個“數字”,如果把考99背后的因素考慮進去,如家庭教育模式、自己努力程度、智商水平等,把他們和99分聯系在一起,就成了數據。大數據的特點可以簡單的概括為“4V”,即更大的容量(Volume)、更高的多樣性(Variety)、更快的生成速度(Velocity)和價值(Value)。

        (1)更大的容量。面對種類多樣、更加復雜的數據,一個新的問題――數據的存儲擺在了人們的眼前。大數據通常可以達到PB級的數據規模,因此,對于教育中每天產生的海量信息,大數據提供的數據存儲都能夠輕松的解決,這也為教育提供了最堅實的基礎保障。

        (2)更高的多樣性。數據的來源有很多的渠道,如社交媒體、網絡搜索、網絡文章等,內容包括所有的辦公格式、辦公文檔、圖片、XML、HTML、音頻、視頻等。信息來源渠道的多樣性及信息格式的多樣性,使得大數據收集的信息擁有更高的多樣性。

        (3)更快的生成速度。即數據被創建和移動的速度快、時效性要求高,這是大數據區別于傳統數據挖掘最顯著的特征。在高速網絡時代的今天,憑借著各種性能優越的硬件及高速的網絡,不斷生成各種各樣的數據,而且這種高速度也成為了必然趨勢。谷歌公司一天之內要處理幾十PB的數據,Facebook產生約10億張新的照片、300TB以上日志,淘寶交易進行數千萬次、產生20TB以上的數據等。

        (4)價值。每一條數據都有著其本身的價值。在當今高速的數據流通下,數據的價值密度也不斷降低。所以,對于如何提高數據價值這個問題,我們還需要好好思考一下。

        2.2 數據挖掘

        數據挖掘(Data Mining)就是從大量不完整的、隨機的、模糊的數據中抽出潛在的、有價值的數據的過程,是一類深層次的數據分析方式。數據挖掘的過程主要是信息收集、數據集成、數據規約、數據清理、數據變換、挖掘過程、模式評估、知識表示等,通過這一系列的過程給用戶提供所需信息。數據挖掘能夠對信息實現準確處理,幫助大數據這一個數據集合實現精準的應用,實現數據的價值,為大數據在教育中的應用,提供最有利的幫助。

        3 大數據在教育中的作用

        3.1 大數據下教育資源的選擇

        大數據不僅有著極強的數據收集、處理能力,而且可以為我們提供快捷、簡單、準確的選擇。面對海量的教育書籍、課堂筆記等,大數據能夠輕松的收錄、存儲,并且根據我們的需要,通過數據處理技術,準確高效的提供有價值的信息,能夠做到在大范圍中尋找最優的結果。通過數據收集和處理為學生的學習減少很多不必要的選擇,從而提高學習效率。例如,現在越來越火的“題庫”類用,就是大數據的一個細化分支,通過對學生的查詢信息的收集處理,可以顯示學生目前的學習狀況以及存在的知識點薄弱現象,能夠幫助學生和家長以及老師開展教育工作。相對于“題庫”類應用,以視頻為載體的應用傳播更為廣泛,這些都是基于大數據技術的細化分支。

        3.2 數據分析處理在教育評比系統中的應用

        教育信息化不斷發展,利用信息技術助力教育質量綜合評比,能夠使評比內容更加全面、數據收集范圍更加廣泛、數據形式更加趨于多樣化、評比結構更加公開透明。因此,一個優秀的評價系統能夠更好地推動教育的發展。20世紀90年代,歐美等發達國家與地區為確保教育質量積累了大量的數據經驗,并建立了完善的高等教育人才培養評比系統。我國自20世紀90年代也開始著手于教育系統的建設,例如上海大學從1998年開始不斷完善自己的教育系統,將教育系統與大數據的分析結合,經過十幾年的不斷完善,建成了一個完整的教育評比系統。

        3.3 大數據在教育管理中的應用

        教育一直都在強調要培養學生多方面能力,可是事實卻是以“分”為首,很多初高中學生幾乎沒有課余生活,活在題海里。這樣的事實是什么造成的呢?很多人說是應試教育必然的結果,其實不然。教育改革從本質上是好的,可是監管的不利、評比體系的不健全,使得更多的學生、家長、老師以及學校背離改革的初衷,更加看重考試分數。所以,一個健全的教育管理體系是多么的重要。我們可以通過采用大數據對信息收集方式多樣性這一特點,更全面收集、掌握教育的發展狀況。例如,可以通過學校監控視頻收集學生和老師的學習授課情況,利用大數據的分析能力進行實時反饋。大數據與教育管理系統的結合,雖然不能快速的解決教育中的問題,但是其所提供的信息反饋能夠更好地監督教育改革的步伐。

        3.4 全面了解學生,實現因材施教

        我們要想真正地做到因材施教,可以通過對教學信息的獲取、存儲、管理和分析,從而構建學生的學習模型,分析學生已有的學習方法和學習狀態,并對其將來的學習進行一定的規劃和引導。目前,教育中的大數據應用主要有教育數據挖掘和學習分析兩大類,兩個方向雖然同源,可是應用方向、研究對象、研究方法完全不同。教育數據挖掘是將來自教育的原始數據轉換為有用信息的過程,是大數據應用于學習分析最基本的應用手段,并且通過數據挖掘自身的信息挖掘技術能夠提高分析效率、擴大分析范圍。學習分析是利用松散耦合的數據收集工具和分析技術,研究分析學習者學習參與、學習表現和學習過程的相關數據,進而對課程、教學和評價進行實時修正。我國學者顧小清認為,學習分析是圍繞與學習者學習信息相關的數據,運用不同的分析方法和數據模型來解釋這些數據,根據解釋的結果來探究學習者的學習過程和情景,發現學習規律;或者根據數據闡釋學習者的學習表現,為其提供相應的反饋從而促進更加有效的學習。為了達到對教育的進一步變革,我們需要建立一個數據模型,該模型以大數據為基礎的數據分析與應用系統,主要存儲學生和老師的日常學習與工作計劃及其短期與長期目標,進而對學生和老師的需求進行全面的分析規劃,實施可行的教育方案,真正的實現因材施教的最高教育目標。

        筆者針對“Visual FoxPro數據庫設計”這門課,設計了學生反饋信息獲取和教學資源共享網站,通過采集學生反饋的信息,讓老師更全面地了解學生的學習狀況,更好地制定教學計劃。網站還提供了教學資源共享平臺,師生都可以文章等有關學習的各種資料,如圖1所示,實現資源的可選擇,使學生不再被動學習,可以主動選擇學習內容,并在交流平臺發表自己的一些看法等,如圖2所示。通過網站信息的獲取,進行數據分析,構建可行的教學模型,從而真正實現因材施教。

        4 結 語

        隨著大數據時代的到來,以大數據為依托進行教育的改革能夠更快速的推進教育的發展,從而為學生、教師、家長提供一個更優質的學習、教育、O督體系。大數據的應用可以使我們現在種類繁多的教育資源變得井井有條,各類資源更加清晰明了;教師制定教育規劃時能夠多一份準確的學生反饋信息分析,從而制訂更加精準的教學計劃;學生們可以脫離“題海”,轉向準確、高質量的最優題區,不再做沒頭的蒼蠅,找不到方向。在未來,大數據的應用會更加廣泛,我們的教育一定會得到充分的發展,未來的教育我們也許不再需要沉重的書包、繁重的作業,需要的也許僅僅是自己對自己優勢的發揮。

        主要參考文獻

        [1]鄭立海.大數據時代的教育管理模式變革芻議[J].中國電化教育,2015(7):32-36.

        [2]陸Z.大數據及其在教育中的應用[J].上海教育科研,2013(9):5-8. [3]高巨山,郭健.數據挖掘技術在教育信息化中的應用研究[J].中國教育信息化,2007(9S):75-76.

        [4]何蘊毅.大數據背景下教育變革的思考與實踐[J].教育信息技術,2014(12):13-15.

        篇4

        關鍵詞:統計學;教育改革;大數據

        一、引言

        最早提出大數據時代到來的機構是全球知名的麥肯錫咨詢公司,該公司在一份研究報告中指出:“數據已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素,人們對于海量數據的挖掘和運用,預示著新一波生產率增長和消費者盈余浪潮的到來”。

        大數據是隨著互聯網技術的廣泛應用帶來的數據量和數據類型激增而衍生出來的一種現象,但大數據一詞不僅指規模大、種類多的數據集,還包括對這種數據集進行采集、處理與分析以提取有價值信息和直接創造價值的技術構架和技術過程。大數據的第一個特征是數據量巨大。截止到2012年,數據量已經從TB(1024GB=1TB)級別躍升到PB(1024TB=1PB)、EB(1024PB=1EB)乃至ZB(1024EB=1ZB)級別。第二個特征是數據類型繁多、異構性突出,包括網絡日志、音頻、視頻、圖片、地理位置信息等等。第三個特征是數據價值密度較低,數據中存在大量重復性和無價值性信息或噪聲。如何通過強大的計算技術和統計分析等方法迅速完成數據的價值提純,是大數據時代亟待解決的難題。第四個特征是處理速度快、時效性要求高。這是大數據區分于傳統數據挖掘最顯著的特征。

        目前,不同的學科領域對大數據概念有著不盡相同的解釋,但各種解釋中大致可以從兩個方面去理解。首先,大數據概念體現在數據量的巨大、種類的眾多及產生速度的飛快,同時產生的數據集極有可能包含著各種半結構化和非結構化數據;其次,大數據概念還體現在對數據進行處理的手段和流程方面,由于數據量的龐大和類型復雜,利用常規的統計軟件已經無法對當今的數據進行及時有效的存儲、分析及處理。因此,所謂的大數據并不是單純指數據流量的巨大,還指其結構的復雜和種類的多樣,在數據處理和分析上需要采用高端計算平臺或高級統計軟件,以及海量數據中存在著可挖掘的潛在的大量價值信息與知識。

        近年來,隨著高速計算機的應用、信息技術的快速發展,特別是云計算技術的發展,使大數據的存儲和分析技術得到迅速發展,目前的核心技術有MapReduce、GFS、BigTable、Hadoop,以及數據可視化等。在數據搜集上,可方便地通過在線互聯網數據庫獲取二手數據或一手實時數據。在數據分析上,傳統統計學方法采取的是基于統計模型的樣本數據分析,而大數據分析技術則是通過高端計算平臺,對大數據中的信息進行挖掘。

        統計學作為對數據進行處理和分析的科學,必然受到大數據的影響。在大數據時代,統計學教育必須與時俱進,跟上時展步伐。近年來,有不少文獻討論了大數據環境下我國統計學教育的改革問題(例如[1]-[5]),本文在分析大數據時代特征的前提下,進一步討論我國統計學教育的現狀與挑戰、統計學教育改革的內容、方法、借鑒和適應時代要求的變革問題。

        二、統計學教育的現狀與挑戰

        2013年,教育部對我國統計學專業設置進行一次新的調整,將原來的既可授予理學學位,也可授予經濟學學位的統計學專業劃分為統計學、應用統計學和經濟統計學三個本科專業[6]。根據教育部高等學校統計類專業教學指導委員會2013年11月公布的數據,當時全國有194所高校開設了統計學專業,156所高校開設了應用統計學專業,164所高校開設了經濟統計學專業[6]。目前,全國開設這三個統計學專業的高校個數和在校學生人數與2013年相比都有不少的增加。

        面對大數據時代,我們目前的統計學教育無論在培養目標和教學內容上,還是在教育方式和人才培養模式上,都存在著亟待解決的挑戰性問題。例如,在專業培養目標和人才培養過程中,我們比較重視課程層面上的評價,比較輕視專業層面上的整體評價,缺乏對學生綜合能力的反饋機制。

        關于教學內容,目前三個統計學專業在統計理論和應用統計兩個方面有不同的側重。統計理論主要包括:抽樣理論、實驗設計、估汁理論、假設險驗、決策理論、貝葉斯統計、半參數和非參數統計、序貫分析、多元統計分析、時間序列分析、小樣本理論和大樣本理論等。在數據分析中,現今的統計方法基本以結構化數據為主要處理對象,而對非結構化和半結構化數據的分析和工具涉及較少。因此,現今統計學課程及內容已不能滿足從事非結構型和半結構型的大數據研究和商業應用對人才培養的需要,必須進行必要的改革。

        對于教育方式,鑒于大數據時代要求,統計分析人員需要具備較高的數學和現代統計學基礎,具有較高的軟件操作能力,掌握一定的大數據收集、整理、分析、處理和挖掘數據的技能。日本學者城田真琴認為:“數據科學家要有計算機科學專業背景,數學、統計方面的素養和使用數據挖掘軟件的技能,善于利用數據可視化的手法展現晦澀難懂的信息,而且具備相應的專業知識、眼界和視野,具有適應社會發展和創造價值的能力”。現今的統計學教育方式還不能很好適應大數據時代數據科學人才培養需要,必須進行必要及時的調整和變革。

        對人才培養模式,大數據時代不僅要求培養具有數據處理和分析所需的基本素質與技能,更重視培養從海量數據中發現和挖掘價值信息、把握市場機遇、創造利潤的潛在能力。面對大數據時代的諸多挑戰,現代統計技術、數據挖掘方法、計算機信息技術、軟件工具和理念的日新月異,培養統計人才的教育模式也需要相應變化,統計學教育只有與時俱進,主動做出全面的調整和變革才能適應新時代知識進步和激烈人才市場競爭的需要,積極迎接大數據時代的挑戰。

        大數據時代對統計學教師有更高的要求,統計學教師需要與時俱進,跟上時代步伐。隨著互聯網、物聯網、云計算等信息技術的發展,對數據的分析和處理的技術也隨之要求更高,統計學教師固有的知識體系已不能滿足培養現代統計人才的需要,必須進一步深化和更新原有的統計學理論知識,而且還需要學習掌握計算機技術、互聯網、數據庫和信息科學等有關知識和技術,同時還要熟悉處理非結構型和半結構型數據的知識和技能,以適應現代統計學教育對教師的知識結構和基本素質的要求。

        大數據時代對統計專業的學生也提出了更高的要求,他們不僅需要掌握現代統計理論、統計方法和專業統計軟件,還要學會如何分析、處理來自互聯網或各種實際問題中的海量數據,如何利用統計軟件和互聯網技術進行數據操作,如何借助軟件技術和統計準則判斷數據質量,如何進行模型選擇和評價模型方法的有效性,如何準確清晰地呈現統計分析結果和結論,等等。

        2014年11月,美國統計學會了統計學本科專業指導性教學綱要 [7],該教學綱要對統計學專業提出四個方面的要求:(1)具有扎實的數學和統計學基礎、強大的統計計算和編程能力,熟練使用統計軟件和數據庫;(2)分析來自現實問題的真實數據,真實數據是統計專業教育的重要組成部分;(3)掌握多樣化的統計模型方法;(4)具有通過語言、圖表和動畫等方式解釋數據分析結果的能力。美國是統計學教育和人才培養最先進的國家之一,該指導性教學綱要代表著美國統計學專業培養人才的基本要求和發展方向,對我國統計教育的改革具有重要的參考價值。以該指導性教學綱要為參考依據,對照我國目前的統計學本科專業教育,無論是在培養目標和課程設置方面,還是在教學內容和教學方法方面,都存在著亟待解決的挑戰性問題。

        三、統計學教育的改革

        大數據時代的統計學教育不僅是各種統計方法、數據挖掘方法和信息技術手段的延續或發展,更主要的是這些方法的集成應用和在實際數據分析中的真實體驗。過去,企業數據庫價格昂貴,在統計學教育的教學案例或實驗課教學中,很少采用真實和海量的數據庫資源,基本都是采用過時或虛擬的數據。今天,像百度大數據引擎這樣的數據庫的逐步對外開放,將有助于開展“線上大數據統計實驗”教學。為了適應大數據時代要求,有必要利用網絡資源以及各種數據處理軟件,搭建線上大數據分析實驗教學平臺,全面開展大數據統計實驗教學的改革。實際上,借助大數據分析平臺,本科階段的統計學教育就可以融人聯機分析和數據的可視化教學。其次,要時刻關注大數據分析理論的進展,及時將新理論新方法融入課堂教學內容。

        需要指出的是,在大數據時代,經典統計理論和方法并沒有過時,但需要進行改進和進一步發展。這是因為,網上采集的巨型數據集往往存在大量的重復性和無價值數據信息,使得大數據價值密度降低。在對這些數據進行分析處理之前往往需要通過去噪、分層、截斷、聚類等方法的預處理,將其變成便于進行分析處理的小數據,繼而借助于經典統計方法進行分析和處理。因而在大數據時代仍然需要采用傳統統計學的小樣本理論和方法。所以,即便是在大數據時代,經典統計方法仍然是進行統計分析的基石,其核心地位不可動搖。所以,在大數據時代仍然要強化統計學的基本理論和方法,尤其是在長期發展和實踐應用中經過驗證的、成熟有效的經典和現代統計方法,在大數據時代仍然沒有過時,但需要結合大數據分析的需要對經典統計方法進行必要的發展和改進。

        大數據科學需要統計學與數學、計算機等學科的結合。亞馬遜大數據科學家John Rauser 認為:“數據科學家是統計學家和計算機工程師的結合體”。為了滿足大數據時代的要求,統計學專業的課程設置需要進行必要的調整。應根據新時代人才培養的要求,增設與大數據前沿領域發展相關的課程,如計算機網絡和大數據相關的軟件應用,同時要加大實驗課和社會實踐課的比重,引導學生理解和掌握大數據概念、理論、技術和方法,培養其運用大數據的相關分析工具解決實際問題的能力。對于理論課程,除基本統計理論外,還應開設一些較為現代和深入的課程,如現代貝葉斯方法、神經網絡、數據挖掘、應用隨機過程論等。另外,還應開設與大數據分析相關的關聯規則、決策樹、機器學習、支持向量機等課程。

        為了培養與時代適應的統計學人才,統計學專業教師應不斷更新自身的知識結構和價值觀念,改變認識數據、收集數據和分析數據的思維,主動學習和補充互聯網、現代數據分析技術、數據庫和數據挖掘技術,使自己的知識體系不斷更新和提升,跟上時展的步伐。

        在大數據時代,要注意培養學生適應社會的能力。統計專業人才培養模式應以提高本專業學生數據分析方面的能力,開闊他們的視野,培養其適應社會的能力。應積極引導學生進入實訓場所動手操作和鍛煉,嘗試以企事業單位的財政、金融、保險、統計、咨詢和信息公司等部門為主構建專業性教育實踐基地。鼓勵學生到大數據相關的機構部門、產業園區和企業中去調查研究和實踐。此外,統計專業應積極同其他專業進行合作,聯合培養適應新時代要求的數據分析人才。鑒于大數據對數據分析人員在計算機技術、行業認知、業務知識、數據分析工具和方法的要求提高,統計學科應主動與計算機、經濟學、管理學等相關學科合作,培養學生的計算機能力、專業素質和業務修養。

        “它山之石可以攻玉”,關于統計學專業的課程設置,可以參考和借鑒美國統計學會公布的統計學本科專業指導性教學綱要。根據該教學綱要,統計專業的課程設置應該涵蓋五個模塊[7]:(1)統計方法與統計理論。建立統計模型并對模型的輸出結果進行評價,熟悉統計推斷,能夠從數據分析中得出恰當的結論。(2)數據操作和統計計算。熟練使用一款專業統計軟件進行探索性數據分析,發現和清洗數據中的錯誤記錄,具有編程能力和算法思維,可以進行各種數據操作,還應掌握統計計算技術,能夠進行模擬研究。(3)數學基礎。熟練掌握微積分、線性代數、矩陣論、概率論和數理統計的基礎知識。(4)實踐訓練和表達能力。具有良好的表達和交流能力,善于通過圖示和動畫等聽眾易于理解的方式展示分析結論,并且具有團隊合作精神和項目領導能力。(5)特定領域的知識。掌握特定應用領域的知識,并用統計學特有的思維方法來分析和解決特定領域的實際問題。

        大數據時代是以數據為中心的時代,統計學專業的教育改革必須適應這個時代的要求。統計數據分析中軟件應用能力至關重要。在眾多統計軟件中推薦使用R和SAS軟件,因為R是免費開源軟件,其統計建模、統計計算和可視化功能強大,更新迅速,是最新統計方法的主要平臺,非常有利于培養學生的編程能力和知識更新能力,而SAS軟件被很多公司用于數據管理和數據分析,在實際應用領域具有長期而深遠的影響,是數據分析不可或缺的專業統計軟件。當然,教學中也可以嘗試使用其他專業統計軟件,例如經濟統計專業學生也可使用SPSS軟件,但最好會使用SAS或R軟件。在加強軟件使用和編程能力的基礎上,應加強學生統計計算和統計模擬能力的培養。在大數據時代,強調統計計算的重要性是大勢所趨。統計模擬技術是伴隨著高速計算機和信息技術的快速發展而廣泛應用的現代技術,可用來解決傳統學科領域中無法解決的問題。例如,在計算技術飛速發展的今天,貝葉斯統計方法過去曾經面臨的計算瓶頸正在逐漸消失,基于馬爾科夫鏈蒙特卡洛(MCMC)技術的統計模擬方法在數據分析中的強大威力正在日益顯現[8]。

        參考文獻:

        [1] 劉春杰,大數據時代對當代統計學教育的挑戰,統計與決策,2015年,第8期。

        [2] 孟生旺,袁衛,大數據時代的統計教育,統計研究,2015年,第32卷4期。

        [3] 葛虹,韓偉,大數據時代統計教育變革的SWOT分析與發展策略,統計與決策,2015年,第4期。

        [4] 張海波,黃世祥,統計學專業學生大數據分析能力的培養方式選擇,統計與決策,2014年,第24期。

        [5] 李衛東,大數據對統計學科發展的影響,統計與決策,2014年,第13.期。

        [6] 教育部高等學校統計類專業教學指導委員會.統計學專業教學單位.http:///category/信息公開/教學單位,2013-11-15.

        篇5

        關鍵詞:大數據時代 大數據理解

        1大數據時代概念的提出

        當前,大數據這一詞匯在各行各業中出現的頻率越來越高,各種媒體中也經常對這大數據這一概念進行推廣,大數據時代逐漸成為了一個社會熱詞,昭示著大數據時代的來臨。

        在學界中,大數據的理論思考與實踐探索一直在如火如荼的濟寧這,并與經濟市場,政府機關形成了良好的合作與互相支持的模式。大數據時代的來臨與當前互聯網時代的建設基礎和發展迅速的信息技術具有重要聯系,早在上個世紀末就有了關于大數據時代的理論雛形,對整合所有數據并對數據進行加工,分析,處理提出設想。這一設想的提出與同一時期的“商業智能”的具有密切的聯系,所謂商業智能也是指建立數據倉庫的基礎上挖掘數據的深度含義,分析數據從而挖掘出數據之間的內部聯系性,從而獲取文化公司所需要的信息,為文化公司的發展提供決策思路和數據支持。

        直到世紀,信息技術的發展導致各種數據統計工作的便捷與高效性,人們逐漸發現了進行大規模數據分析和研究對文化公司在發展過程中所能起到的作用,互聯網的覆蓋范圍越來越廣,在各行業各的應用程度愈來愈高,智能手機的普及都為大數據時代的來臨打下了堅實的基礎,隨后大數據的概念在信息技術行業中越來越得到認可與重視,大數據的相關理論基礎研究與前景展望也越來越多,為大數據時代構建了理論結構與應用前景。

        2012年的達沃斯世界經濟論壇中將大數據作為主題之一進行討論,可以說變相確定了大數據在未來社會發展進程中的地位,探究了以信息技術為依托的大數據處理分析如何對人類社會的發展作為貢獻。國內對大數據在未來發展中將占據的地位和起到的作用也做出了充分的認可,各大企業與高校對大數據的概念與應用已經開始進行研究與實踐。

        2大數據一詞的概念與理解

        對大數據時代的理解離不開對大數據的概念的理解。什么是大數據?就當下而言,雖然大數據一詞的出現的頻率極高,許多媒體,部門,論壇都在使用這一詞語,但是對大數據一詞的核心含義的理解卻并不一定充分。當前學界內對數據一詞的定義尚且沒有一個統一的較為得到廣泛認可的定義。對大數據一詞的定義可以分為幾種,例如維基百科上說大數據就是指數量、規模龐大的數據資料,無法利用常見的軟件工具對其進行高效率收集,處理與分析。還有的的說法認為大數據就是單純指數據量足夠大,遠超常規水平的數據集合。還有的說法主要是認為大數據進行處理的方式才是大數據一詞的實質,即大數據是通過特殊處理模式能提高企業對市場形勢的掌控程度,為決策提供指導的數據分析處理方法。

        因此來看,大數據的特征應該包含著兩方面,一是大數據處理在技術層面具有先進性,二是大數據在社會性方面具有廣泛性。如上文所述,大數據一詞的出現是信息技術進步的結果。大數據最先出現其是存在與IT界的術語,大數據是一個多項技術合并在一起的概念,是一個具有系統性的體系,包括對數據依托信息技術實現大規模儲存與聯網分享的云技術,對數據進行分析處理的分布式處理技術,指紋識別,虹膜識別等對數據進行保密管理的感知技術等等,都應該包括與大數據體系之中。與此同時,大數據還具有社會性。大數據這一概念的出現離不開信息爆炸化的時代特征,大量的信息充斥于社會的每一個角落并呈現著井噴式的增長,每一個人都是數據的創造者與傳遞著,國際化進程的加快使人類社會前所未有的緊密聯系在一起,在這種時代背景下醞釀出來的大數據概念無法避免的具有人類社會發展的特征。

        在大數據時代,人們的思維模式必須向大數據化的方向靠攏,傳統的思維模式已經不適合時代的發展。信息技術的進步使我們的思維模式也可以在依托大數據提供的信息作出更準確的決策和判斷。在大數據模式下,高效率的數據收集與處理是我們可以脫離傳統的抽樣調查得出結論的辦法,不用再考慮數據模型是否具有科學性和代表性,也不用考慮抽樣結果是否具有偶然性,因為我們已經可以立足于全面性的數據來對問題進行思考與判斷,同時,對數據的判斷要提高效率,應為判斷的本身也是一個大數據的過程,提高判斷的效率再借以數據統計來提高其準確性。在大數據時代,人們面對數據不需要刨根問底的研究數據出現的原因,而是應該要考慮數據之間的關聯性,研究數據之間的聯系,思考關聯出現的原因而不是單純研究因果關系。

        大數據時代對于社會的改變在于,它變革的是人們處理數據的方式與模式,改變的是人認知世界,認知事物的方法,在數據化的信息處理中提供發現問題,解決問題,創造價值的方法。大數據作為一個新生事物能開創出一個新的時代,不得不說大數據在我們當下的社會發展進程中是極有價值的。雖然大數據的定義及體系,實踐應用方面還存在許多不足,缺少經驗方面的積累,但是筆者相信隨著時間的推移大數據體系的形成必將越來越完備。我們當下所需要做的就是把握住大數據時代的時代脈搏,必須明確大數據時代的要求:首先,大數據時代必須充分利用信息技術來提高數據的收集與儲存,利用新的數據處理模式發現數據之間的關聯新,為決策提高科學性的指導與數據支持。然后,大數據是技術屬性與社會屬性的有機統一,所以在大數據時代中兩方面工作都要雙管齊下,提高技術水平的同時還要注重社會實踐應用,達到改變市場運作模式,各組織的結構的目的。最后,大數據不是一個高高在上的概念性名詞,而是應該作為一種新的思維方式適用于社會的各個方面,包括政府行政,企業運營和人民生活等等,是新的時代智慧與時代氣息,而不是單純的一種技術或處理數據的手段。

        必須要明確大數據時代真正的思想內涵,才能是我國在新時代的發展過程中不落人后,占據著有力地位,提高國家的信息化程度與綜合實力,對本論文的命題“大數據時代”對企業人力資源管理工作的影響能做出正確的分析探究。

        參考文獻:

        主站蜘蛛池模板: 无码精品国产一区二区三区免费| 亚洲中文字幕一区精品自拍| 高清国产AV一区二区三区| 中文字幕一区在线观看视频| 精品人妻一区二区三区毛片| 亚洲国产系列一区二区三区| 无码人妻精品一区二区三区99不卡 | 亚洲Av永久无码精品一区二区| 国产一区二区三区高清在线观看| 国产综合无码一区二区色蜜蜜| 亚洲一区二区三区国产精品无码| 亚洲日韩精品一区二区三区无码 | 久久精品国产第一区二区| 成人丝袜激情一区二区| 亚洲日韩一区二区三区| 日韩免费无码一区二区三区 | 久久精品国产免费一区| 久久精品国产一区二区| av无码人妻一区二区三区牛牛 | 欧美成人aaa片一区国产精品| 午夜福利一区二区三区高清视频 | 色噜噜狠狠一区二区三区果冻| 久久久精品日本一区二区三区| 日韩毛片一区视频免费| 精品国产一区二区三区免费| 久久无码一区二区三区少妇 | 无码国产精品一区二区免费虚拟VR| 国产午夜精品免费一区二区三区| 亚洲综合色自拍一区| 另类免费视频一区二区在线观看| 午夜DV内射一区二区| 亚洲av无码片区一区二区三区| 国产精品一区二区久久精品| 亚洲色精品VR一区区三区| 四虎成人精品一区二区免费网站 | 视频在线一区二区| 国产精品被窝福利一区 | 国产福利电影一区二区三区,免费久久久久久久精| 日韩美女视频一区| 一区免费在线观看| 亚洲国产一区二区三区青草影视|