當前位置: 首頁 精選范文 云計算的概述范文

        云計算的概述精選(五篇)

        發布時間:2023-09-26 09:35:04

        序言:作為思想的載體和知識的探索者,寫作是一種獨特的藝術,我們為您準備了不同風格的5篇云計算的概述,期待它們能激發您的靈感。

        云計算的概述

        篇1

        關鍵詞:云計算;大數據;數據容災

        中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2014)32-7574-02

        1 概述

        當代云計算數據中心的存儲節點數量少則幾十萬多則上百萬,在規模如此龐大的海量存儲系統中,節點失效或磁盤損毀已然成為一種常態,此外,由于網絡設備或者傳輸線路故障等原因導致的數據丟失或短時不可用現象也常有發生。如果用戶或企業不能隨時隨地存取自己所需的數據,甚至發生數據丟失的現象,將大大影響客戶滿意度,甚至給企業帶來巨大的經濟損失,因此,必須采取有效措施及相關技術策略來保證云端數據的可靠存儲。

        2 云端數據中心拓撲結構

        云端數據中心是大數據存儲的基礎平臺,數據的可靠性及訪問效率與網絡節點的拓撲結構緊密相關。按節點功能類型的不同,可將數據中心節點的拓撲結構分成三種類型[1]:①以server(服務器)為為中央節點的星型結構;②以 switch(交換機)為中央節點的星型結構;③混合結構。三種拓撲結構的特點如下:

        以server為中央節點的結構將多臺server通過傳輸介質直接互連起來,在這種結構中,server兼任switch的角色,一方面承擔數據的加工處理工作,另一方面承擔分組的存儲轉發工作,以server為中心的結構增加了服務器之間的網絡帶寬,擺脫了對交換機的過度依賴,提高了吞吐量;但是server之間的鏈路帶寬的不均衡增加了布網的復雜度。

        以switch為中央節點的結構將各臺server通過switch進行互連,switch和server各司其職,switch負責分組的路由轉發,server負責數據的存儲加工,這種結構布網簡單,操作方便,可擴展性強,在現代企業數據中心應用較廣泛;但以交換機為中心的結構存在底層server利用率低、switch資源浪費較為嚴重、網絡帶寬容量有限、靈活性差等缺點。

        混合結構是以上兩種結構的一種擴展,其設計融合了這兩種結構的優點并有效避開了各自的缺陷。

        3 云端數據容災技術

        容災技術是云端大數據可靠存儲的一種關鍵技術,良好的容災策略不但能有效提升大數據存儲系統的可靠性,還有助于提升系統的訪問效率。容災策略一般都采用冗余備份技術來實現,以確保當出現某種突發狀況導致存儲系統中的文件、數據、片段丟失或者嚴重損壞時,系統可準確而快速地訪問冗余數據來維持系統的穩定運行[2]。一般來說,容災技術按策略的不同主要分兩種:①復制冗余策略;②糾刪編碼冗余策略。

        3.1 復制冗余策略

        復制冗余策略為系統中的每一個數據都建立一個或多個副本,并把若干個副本分散存儲在不同的網絡節點上,當遇到某個數據損毀或失效不能正常使用時,可通過訪問最近的存儲節點來獲取與原件完全一致的副本數據[3]。基于復制的冗余策略主要關注2個方面的問題:(1)副本數量設置;(2)數據放置方法。

        3.1.1副本數量設置

        副本系數設置主要采取兩種方式: ①靜態設置副本數量,目前主流的分布式文件系統Hadoop的HDFS、谷歌的GFS都采用3副本策略,這種靜態設置方法操作簡單,但靈活性差;②隨機動態設置副本數量,即系統根據數據的訪問頻率、出錯概率及網絡狀況等動態因素隨機地確定副本系數,動態地刪除或添加副本,這種動態機制能大大增加存儲空間的利用率,但動態計算過程增加了系統的開銷;

        3.1.2數據放置方法

        巧妙的數據放置方法能通過提高并行訪問量來提升云端大規模數據的訪問效率,目前,數據放置方法一般采用順序放置和隨機放置[4]。

        ①順序放置方法把數據副本按順序分布存儲在不同節點上,使得排列數目相對較少,針對系統的隨機失效有一定的防護性,順序放置方法技術簡單、易于實現和維護,但在具體應用時,因失效具有很強的相關性,局部的網絡故障或節點失效就有可能導致整個機架的數據不可訪問。

        ②隨機放置方法是在可放置節點中隨機地選擇一系列節點來存放數據副本,此方法能夠降低關聯對系統可靠性帶來的負面影響,但在實際應用中,由于節點的存儲、計算能力各不相同、數據的訪問熱度也不盡一致,往往達不到理想的均衡負載效果。

        3.2糾刪編碼冗余策略

        3.2.2 LDPC編碼

        LDPC碼是從蒙特卡洛及圖論演進而成的編譯碼技術,因其稀疏檢驗矩陣(少量元素是1,其余部分全是0)特性,被研究者廣泛用于設計復雜度低的解碼算法,LDPC碼可以有效提升系統的容災能力,但是構造不規則碼字的難度也相應成倍地增加。

        3.2.3陣列編碼

        陣列碼的編譯碼過程只涉及基礎的二進制異或運算,技術實現相對容易,而且在采用同等編譯碼的前提下,陣列碼比RS碼更能有效地提高系統的可靠性,與此同時保持其計算域不變大,陣列碼技術一直是大數據可靠存儲關鍵技術的研究熱點,被廣泛的應用于磁盤陣列及網格存儲系統中。

        3.2.4 RS編碼

        RS碼是一種高效的糾錯碼,既可以糾正突發錯誤,又可以糾正隨機錯誤,在通信領域中有極其廣泛的應用,近年來,隨著大數據存儲技術的快速、多元化發展,有研究者對RS編碼行了改造,并將其應用于數據存儲領域以提高系統的容錯性。

        4 云端系統節能減耗技術

        數據存儲是各種云計算服務賴以施展的基礎,在云計算環境下,底層數據中心節點的規模龐大,使得數據存儲成本極高,主要源于添置各種網絡硬件設施(大型服務器、交換機、路由器等)以及支付各種存儲設備的高額電能消耗等。高漲的能耗開銷不但增加了系統的運營及維護成本,更催化了大氣溫室效應,嚴重破壞了自然界的生態環境,因此,不論從服務商盈利的角度,還是從環境保護的角度出發,節能減耗技術都顯得尤為必要。

        當前,分布式存儲系統的節能減耗技術主要集中在兩個方面:①硬件節能策略,主要致力于降低存儲系統中的硬件設備能耗;②軟件節能策略,通過使用一些專業軟件來實現系統資源的有效分配及使用。

        參考文獻:

        [1] Popa L, Ratnasamy S, Iannaccone G,et al. A Cost Comparison of Data Center Network Architectures[Z]. 2010.

        [2] 吳朱華.云計算核心技術剖析[M].北京:人民郵電出版社,2011.

        [3] 郭仁東.網絡數據容災備份技術及其應用淺析[J].電腦知識與技術,2012(31).

        篇2

        1.云計算的定義

        云計算是一種基于互聯網的超級計算模式。它將計算任務分布在大量計算機構成的資源池上,使各種應用系統能夠根據需要獲取計算力、存儲空間和各種軟件服務。云計算實質上是通過互聯網訪問應用和服務,而這些應用或者服務通常不是運行在自己的服務器上,而是由第三方提供。它的目標是把一切都拿到網絡上,云就是網絡,網絡就是計算機。云計算依靠強大的計算能力,使得成千上萬的終端用戶不擔心所使用的計算技術和接入的方式等,都能夠進行有效的依靠網絡連接起來的硬件平臺的計算能力來實施多種應用。云計算的新穎之處在于它幾乎可以提供無限的廉價存儲和計算能力。

        基于云計算的原理和其固有的特點,云計算比其它新技術更容易進入高校。云計算對用戶端的設備要求很低,這一特點決定云計算將會在學校大受歡迎。

        2.云計算的特點

        (1)服務提供的多元性

        云就是龐大的計算機群,具備極高的計算、存儲能力,能夠完成單機所完不成的海量計算、存儲等工作。云將調用云中的計算機群,使用基于海量數據的數據挖掘技術來搜索網絡中的數據庫資源,并運用各種方法為用戶反饋出盡可能詳盡、準確的結果,極大的擴展了而不是傳統意義上的基于某個具體服務器為用戶提供相應服務的工作模式;同時云中的計算機可以通過相應技術保持網絡數據庫信息的及時更新,用以保證用戶服務的快速、準確。

        (2)使用的便捷性

        在云計算模式中所有應用和服務請求的數據資源均存儲在云中,用戶可以在任意場合、時間通過網絡接入云平臺,使用統一的云服務,按照自身的需求獲取所需信息,并可以實現不同終端、設備間的數據與應用共享,為工作帶來極大的便利和效率。

        (3)服務的安全性

        分布式系統具有高度容錯機制,云計算作為分布式處理技術的發展,依托據存儲中心可以實現嚴格、有效的控制、配置與管理,具有更好的可靠性、安全性和連接性能,同時高度集中化的數據管理、嚴格的權限管理策略可以讓用戶避免數據丟失、病毒入侵等麻煩。

        (4)用戶端設備成本低廉

        由于云計算模式下大量的計算及存儲工作都被放到了網絡上,作為個人的用戶端就完全可以簡化到只有一個瀏覽器了。云計算模式中用戶只需通過網絡使用服務商所提供的相關服務,并按實際使用情況付費,具體的計算機系統硬件配置、設備運行維護開支和服務器系統軟、硬件升級都由云服務提供商來完成。云計算的端設備和現在的PC機相比,云計算終端功耗低,成本低廉,終端用戶使用簡單,維護方便。

        二、云計算為高校教育信息化建設提供新的思路

        1.云計算能大大節約信息化的資金投入

        目前的高校信息化建設中成本主要來源于軟硬件的購置、日常維護及設備更新等,如果將這些建立在云計算和服務的基礎之上,將大大減少資金投入。其一,整個網絡課程建設的基礎平臺將是云服務提供商提供的跨平臺、運算能力強大、資源豐富的統一的通用信息平臺,無需購買本地服務器,僅需投入少數管理終端及云接入設備即可;其二,所有的服務提供均由云端提供,無需為保證服務器運行的可靠性、保證存儲在服務器中的數據資源的安全以及避免因網絡訪問異常導致服務器癱瘓而對網絡服務器響應及接入數量等進行限制,因此原來維護、升級等工作幾乎降至最低,管理成本也相應可以大大降低。

        2.真正實現資源整合,建立統一的資源平臺

        將高校信息化建立在云計算和服務的基礎之上,將繁重的網絡信息平臺建設、服務器的配備、課程資源的存儲與管理等工作交給云服務提供商,那么現有分散的、自成一體、本地化的網絡信息平臺將轉變成為一個與具體網絡運行環境、網絡服務器系統、網絡操作系統無關的強大的統一的通用信息平臺,在這個平臺上以成千上萬的云服務器為依托,擁有著極其強大的計算功能、海量的網絡資源,現有的網絡課程建設中存在的軟、硬件資源重復投入、虛擬化教學設備運行能力支持等問題將迎刃而解。

        3.云計算的應用能夠保證高校師生的信息安全

        校園網內的計算機病毒的防控一直是一個十分棘手的問題,尤其在多媒體教室及計算機實驗室。一臺機器中毒,很快就會傳遍所有機器。殺毒軟件授權使用費用對高校來說也是一筆不小的開支,但對病毒仍不能有效的防控。而在云計算環境下,云計算提供商擁有先進技術和專業團隊來負責這些資源的安全維護工作,師生們只需通過網絡,就能訪問自己的數據。本地不再存儲任何數據,因而不用擔心病毒入侵造成的破壞。所以,云計算在高校的應用既省去了高校在信息安全方面的開支,又確保了高校師生的信息安全。

        篇3

        關鍵詞: 改進密鑰; 云計算數據; 安全存儲; 帳篷映射; 貓映射

        中圖分類號: TN911?34; TP393 文獻標識碼: A 文章編號: 1004?373X(2016)20?0031?04

        Abstract: As the data size is large in cloud computing environment and the existing data has the dynamic change characteristics, the cloud computing data security storage strategy based on the improved secret key is proposed because the traditional secure storage method obtains the relatively small key space by low dimensional mapping, which may cause low security, is easy to crack, and makes the storage security worse. The general description of tent mapping and cat mapping is given in this paper. It converts the real number domain to the integer domain to make integer arithmetic. The tent mapping and cat mapping are imported to improve the secret key parameters, and get the primarily?iterated secret key. The complementation operation and xor operation for the obtained results are conducted to acquire even encryption cipher byte and verify whether the even encryption is completed, and judge whether the iteration should be finished. In this way, the security storage of cloud computing data is achieved. The experimental results show that the proposed strategy has not only higher safe storage performance, but also needs less time, and does not increase the burden of cloud computing system.

        Keywords: improved secret key; cloud computing data; safe storage; tent mapping; cat mapping

        0 引 言

        云存儲是在云計算(Cloud Computing)概念上延伸和發展出來的一個新的概念,是一種新興的網絡存儲技術,它主要通過集群應用、網絡技術或分布式文件系統等功能,將網絡中大量不同類型的存儲設備獲得的數據,通過應用軟件集合起來協同工作,共同對外提供數據存儲和業務訪問功能的一個系統[1?3]。隨著云計算的廣泛應用,人們對云計算數據存儲的安全性要求越來越高,因此,研究云計算安全問題具有重要意義,已經成為相關學者研究的重點課題,受到了越來越廣泛的關注[4?5]。

        目前,有關云計算數據安全存儲的研究有很多,相關研究也取得了一定的成果。文獻[6]提出基于加密機制的云計算數據可靠存儲方法,主要通過數字證書向云計算系統進行身份驗證,采用對稱密鑰對云計算數據進行加密再發送至云計算系統中保存,如果客戶需得到數據,就要把云計算環境下的密文傳輸至本地,由客戶獨立進行解密;但該方法需要很強的計算能力,并且加密密鑰需妥善保管,若丟失則不能獲取存儲的數據。文獻[7]提出基于第三方核查的云計算數據安全存儲方法,將同態認證的公鑰技術與隨機masking技術結合在一起,通過零知識證明協議與語義匹配方法實現云計算數據的安全存儲。但該方法耗費資源較多,成本相對較高;文獻[8]提出的云計算數據安全存儲策略,主要通過擴展分離密鑰對保存在云環境中的加密數據操作過程進行密鑰管理,將對稱密鑰存儲在云環境中,供用戶查找;但該方法實現過程復雜,不適用于實際應用中。文獻[9]提出基于可信平臺的云計算數據安全存儲策略,該策略依據可信平臺模塊,對對稱密鑰與非對稱密鑰分別進行管理,實現云計算數據的安全存儲;但該方法存在所需時間較長,效率低的問題。文獻[10]提出一種安全可擴展的云計算數據安全存儲策略,通過重加密的技術對數據進行安全存儲,該方法重加密密鑰與解密密鑰所涉及的數據量很大,對其的管理非常困難,有安全隱患。

        1 云計算數據安全存儲策略設計

        1.1 密鑰參數的獲取

        采用帳篷映射和貓映射共同獲取密鑰的方法,對傳統方法進行改進,則需分別求出帳篷映射的密鑰參數和貓映射的密鑰參數。

        1.1.1 基于帳篷映射的密鑰參數獲取

        式中,[w]用于描述云計算字長,因為貓映射的拉伸和折疊使[xk,yk∈0,2w-1],說明貓映射迭代值恰好處于云計算字長所能描述的整數區間中(除去[2w]斷點),因此,式(6)是在云計算字長所能描述的整數區間中的迭代運算,適用于云計算存儲。

        針對式(6)獲取的所有整數迭代解,僅在[x,y]同時為零的情況下可獲取一個穩定的零解,為了避免上述情況的發生,達到改進整型貓映射的狀態,可通過檢測下一次輸入值是否同時為零進行優化處理,若為零,則將輸入值用其他值代替。

        通過以上分析過程可以看出,式(6)中存在2個初始條件,即通過貓映射得到的密鑰,該方程比一維方程更加復雜,從而有效地保證了云計算數據存儲的安全性,則經改進的密鑰參數可描述成[xn],[yn],[Zn],[a]。

        1.2 基于改進密鑰的數據安全存儲的實現

        將改進的密鑰參數應用于云計算數據安全存儲中,復雜度適中,而且計算效率高,安全性得到了很大的保證,詳細的流程圖如圖1所示。

        基于改進密鑰的云計算數據安全存儲過程如下:

        (1) 初始化密鑰:將帳篷映射和貓映射的初始值[x0],[y0],[Z0]和可變控制參數[a]看作是初始密鑰;

        (2) 初始化迭代:針對已經選擇好的初始密鑰依次進行10次迭代處理,有效地掩蓋原始值,增加帳篷映射的雪崩效應,增強數據存儲的安全性;

        (3) 迭代結果:得到經初始迭代后的密鑰,首先進行帳篷映射處理,將[Z0]看作是初始參數代入式(3)中迭代一次獲取[Z0′],再將[Z0′a]和[y0]的乘積作為Henon映射的初始參數代入式(6)中迭代一次獲取[xn]和[yn],二者的乘積就是最終的迭代結果,用[P]進行描述,表達式為:

        (6) 終止判斷:通過式(9)得到的密文字節,可驗證云計算數據明文字節序列[M]是否均加密完成,若完成則退出,實現云計算數據的安全存儲;反之,轉入步驟(3),繼續進行安全存儲操作,直到完成云計算數據明文序列的均勻加密處理,實現對云計算數據的安全存儲操作。

        2 實驗結果分析

        為了驗證本文提出的基于改進密鑰的云計算數據安全存儲策略的有效性,需要進行相關的實驗分析。首先建立云計算環境,將n臺計算機看作是存儲節點,所有存儲節點的配置均一致,詳細操作環境如下:內存為4 GB,硬盤為250 GB,操作系統選擇Windows XP,通過Cygwin對云計算環境進行仿真,同時建立Hadoop開源平臺。實驗將Henon映射方法作為對比進行分析。

        本文將存儲耗時作為指標對本文改進方法與傳統的Henon映射存儲方法進行對比實驗。在云計算數據大小一定的情況下,分別采用本文方法和Henon映射對云計算數據進行存儲,得到的效率比較結果如表1所示。

        分析表1可知,采用本文方法對云計算數據進行存儲,雖然隨著文件的逐漸增加,所需的時間也逐漸增加,但是和Henon映射方法相比,本文方法所需的時間還是較低的,說明采用本文方法相比Henon映射方法存儲效率更高。

        數據存儲安全性是衡量本文方法有效性的關鍵指標,表2描述了本文方法和Henon映射方法為了達到同一安全水平所需的密鑰長度,表2中同一行代表同一安全水平。分析表2可以看出,1 135 b的Henon映射法,其安全水平和203 b的本文方法相當,也就是說203 b的本文方法的安全性已經遠遠高于203 b的Henon映射方法的安全性了,而且隨著密鑰長度的逐漸增加,兩種方法安全性的差異也越來越大,說明本文方法的安全性較高。

        為了更加直觀地對兩種方法的安全性進行比較,對采用的本文方法和Henon映射方法的安全程度進行比較分析,得到的結果如圖2所示。

        分析圖2可以看出,在相同的條件下,采用本文方法的安全性能為95%,Henon映射方法的安全程度為59%,與和Henon方法相比,采用本文方法對云計算數據進行存儲的安全程度高出了36%,進一步驗證了本文方法的高安全性。

        為了驗證采用本文方法和Henon映射法后對原云計算系統產生的影響,將經兩種方法處理后的云計算系統服務端性能進行比較,得到的結果如表3所示。

        分析表3可以看出,采用改進方法其服務器的占用率為3.81%(平均值),下載速度為13.05 Mb/s(平均值);傳統的Henon映射法服務器的占用率為10.55%(平均值),下載速度為4.25 Mb/s(平均值);改進方法相比傳統的Henon映射法,服務器占用率減少了9.24%(平均值),下載速度增加了6.3 Mb/s(平均值)。在加入本文方法密鑰存儲服務后,云計算系統的性能明顯更高,說明本文方法對云計算系統產生的影響不大,CPU占用率與下載速度均較優,進一步驗證了本文方法的有效性。

        3 結 論

        針對傳統方法存在的問題,提出基于改進密鑰的云計算數據安全存儲策略,給出帳篷映射和貓映射的一般描述,將其由實數域轉換成整數域進行整數運算,通過帳篷映射和貓映射獲取改進密鑰參數并進行初始化處理,得到經初始迭代后的密鑰,再進行異或運算,得到密文字節。通過驗證云計算數據明文字節是否均加密完成,判斷是否結束迭代,實現對云計算數據的安全存儲。實驗結果表明,所提策略不僅安全存儲性能較高,而且所需時間少,不增加云計算系統的負擔。

        參考文獻

        [1] 蛟平埽白楊.基于Hadoop和雙密鑰的云計算數據安全存儲策略設計[J].計算機測量與控制,2014,22(8):2629?2631.

        [2] 周明快.基于CP?ABE的云計算改進屬性加密安全訪問控制策略設計[J].計算機測量與控制,2015,23(1):297?299.

        [3] 王志中,周城,牟宇飛.基于分離密鑰的云存儲加密解決方案[J].電信科學,2013,29(1):51?56.

        [4] 晁巍.適于大數據存儲的容錯方案和安全方案設計及其在云計算系統中的應用[D].昆明:云南大學,2014.

        [5] 劉占斌,劉虹,火一莽.云計算中基于密文策略屬性基加密的數據訪問控制協議[J].信息網絡安全,2014(7):57?60.

        [6] 趙莉,王魁t.基于加密機制的云計算數據可靠存儲方案研究[J].信陽師范學院學報(自然科學版),2014(4):593?596.

        [7] 毛黎華.基于云計算用戶數據傳輸與存儲的安全策略研究[J].電子技術與軟件工程,2014(13):234.

        [8] 張少敏,李曉強,王保義.基于Hadoop的智能電網數據安全存儲設計[J].電力系統保護與控制,2013(14):136?140.

        篇4

        一、 Apriori 算法描述與問題分析

        1.算法描述

        Apriori算法是挖掘產生布爾關聯規則所需頻繁項集的基本算法,也是一個很有影響的關聯規則挖掘算法。Apriori算法就是根據有關頻繁項集性質的先驗知識而命名的。該算法使用一種稱作逐層搜索的迭代方法,利用k 項集來產生(k +1)項集。具體包含兩個主要的處理步驟,即連接和刪除。以用Lk-1來產生Lk為例,挖掘過程如下:

        (1)連接步驟:為發現Lk,通過將Lk-1與自身連接產生候選 k 項集的集合Ck 。設I1 和I2為Lk-1中的兩個項集,Ii[j]表示Ii中的第j個項。為方便起見,Apriori假定事務或項集中的項按字典次序排序。對于(k +1)項集Ii,意味將項排序,使Ii[1]< Ii[2]

        (2)刪除步驟:Ck是Lk的一個超集,其中的各項集不一定都是頻繁項集,但所有的頻繁K項集一定都在Ck中,即有Lk ∈Ck。掃描一遍數據庫就可以決定Ck中各候選項集的支持度計數,并由此獲得Lk中各個元素(頻繁k項集)。所有支持度計數不小于最小支持度計數的候選項集就是屬于Lk的頻繁項集。然而由于Ck中的候選項集很多,如此操作所涉及的計算量是非常大的。

        為提高頻繁項集逐層產生的效率。Apriori算法有一個用于縮小頻繁項集的搜索空間的性質:"頻繁項集的所有非空子集也必須是頻繁的"。也就是說,若一個候選k項集中任一個子集項集不屬于Lk-1,那么該候選k項集也不可能是頻繁的,因而也就可以將其從Ck中刪去。

        Apriori 算法的優點是結構簡單,易于理解,沒有復雜的推導。另外,算法應用 Apriori性質在許多情況下大大縮小了需要檢查的候選規模,使算法效率大幅度提高。

        2.存在問題分析

        Apriori 算法存在兩個主要的問題:

        (1)多次掃描數據庫

        Apriori 算法在每進行一次迭代的時候需要掃描一次數據庫,一般當挖掘出的最大頻繁項集的長度為N時,需要掃描 N 次數據庫。而在實際應用中,經常需要挖掘很長的模式,多次掃描數據庫將帶來巨大開銷。

        (2)可能產生大量候選頻繁項集

        Apriori 算法在迭代過程中要在內存中產生、處理和保存候選頻繁項集,這個數量有時候是非常巨大的。例如,如果有104 個頻繁 1 項集,則 Apriori 算法要產生接近57個候選 2 項集。另外,為了發現長度為 100 的頻繁模式,它必須產生多達2100≈1030個候選,導致算法在廣度和深度上的適應性很差。

        總之,Apriori 通過對數據庫的多趟掃描來發現所有的頻繁項集,而對存儲海量數據的數據庫的多趟掃描將耗費大量時間和內存空間,這將成為 Apriori 算法的瓶頸。為此,近年來有關并行數據挖掘算法的研究不斷升溫。

        二、改進方案

        1 第一種改進

        具體的改進思路是:

        (1)把事務數據庫水平均勻的分成規模相當的 n 個數據子集,把數據子集發送到 m 個節點。

        (2)每個節點掃描它的數據子集,產生一個局部的候選 k 項集的集合,記作 ,每個候選k 項集的支持度計數為1。

        (3)利用分區函數將 m 個節點產生的中間結果Cp 分成r個不同分區,然后連同它們的支持度計數發送到r 個節點。

        (4)r 個節點把相同項集的計數累加起來,產生最后的實際支持度,與最小支持度計數min_sup比較,確定局部頻繁 k 項集的集合 。

        (5)把 r 個節點的輸出合并即產生全局頻繁 k 項集的集合Lk。

        (6)改進的Apriori算法的優勢是查找Lk和Lk+1的過程是完全獨立的,他們之間沒有聯系,這是一個循環的過程。k 值從1開始遞增,直到找出所有的頻繁項集。也可以設定k 的值,只需要查找Lk,或是從L1到Lk之間的所有頻繁項集。

        將改進的Apriori算法用MapReduce實現的優勢是:第一,對事務數據庫的掃描次數減少;第二,查找頻繁項集的過程可以并行執行,當查找頻繁k項集的流程執行的中間結果都被傳送到分配了Reduce任務的工作站點時,Master就可以調度分配了Map任務的工作站點開始查找頻繁 k +1項集,加快并行處理速度,極大地提高執行效率。

        2第二種改進

        上述改進算法盡管執行效率比較高,但仍然需要對事務數據庫進行多次掃描,生成頻繁 1 項集到頻繁k 項集需要掃描k 次事務數據庫,耗費了大量時間。所以對 Apriori 算法再次改進,改進后的算法只需要掃描事務數據庫一遍,就可以產生全部的頻繁項集,依然是用在云計算平臺上。具體的改進思路如下:

        (1)把事務數據庫水平均勻的分成規模相當的n個數據子集,把數據子集發送到m個節點。

        (2)每個節點掃描它的數據子集,產生一個候選項集(候選1項集到候選k項集)的集合,記作Cp,每個候選項集的支持度計數為1。

        (3) r個節點把相同項集的計數累加起來,產生最后的實際支持度,與最小支持度計數min_sup比較,確定局部頻繁項集的集合Lp。

        (4)把r個節點的輸出合并即產生全局頻繁項集的集合L。

        改進的Apriori算法的優勢是只需要掃描一遍事務數據庫就能找到所有的頻繁項集。

        小結:Google 的 MapReduce 庫把輸入文件平均分成 N 個數據片段,然后均勻的分配給 M個節點,由于云計算環境下的集群系統是異構的,所以這種方法并不能充分地利用集群中的計算資源,本文針對云計算環境的并行計算條件和并行挖掘需求在數據集劃分和數據集分配方面做了研究。并且,本文對 Apriori 算法進行了兩種改進,使其在云計算環境下能夠并行進行海量數據的頻繁項集的挖掘。

        參考文獻:

        [1] 王鵬. 云計算的關鍵技術與應用實例[M]. 北京: 人民郵電出版社,2010.1,74-75.

        篇5

        【關鍵詞】淺議;交通運輸;企業;營改增;會計核算;變化

        2013年8月1日隨著交通運輸企業“營改增”的全面推開,作為企業經濟管理重要組成部分的會計也應相應跟進,在會計核算上做出相應變化,以便更好地為企業經營管理服務。為便于交通運輸企業在“營改增”后對經濟業務進行正確核算,在此以“營改增”后普通貨運企業為例,從原始憑證取得、賬簿設置、記賬憑證、會計報表的編制幾個方面對會計核算的變化進行探討。

        1 交通運輸企業“營改增”后的分類和適用稅率

        交通運輸企業“營改增”后,根據其營業收入規模和會計核算等方面的情況分為一般納稅人和小規模納稅人,一般納稅人適用11%的增值稅稅率,小規模納稅人適用3%的征收率,由于小規模納稅人在“營改增”前后會計核算變化不大,下面主要以一般納稅人為例對交通運輸企業“營改增”前后會計核算的變化進行探討。

        2 交通運輸企業營改增前后原始憑證、會計賬簿設置上的變化

        2.1 交通運輸企業開具貨運發票的變化

        在營改增前,企業為客戶開出的是從地稅部門領取的普通貨運發票,運費是含稅價;在營改增后,企業為客戶開出的是從國稅部門領取的貨物運輸普通增值稅專用發票,運費為不含稅價。

        2.2 交通運輸企業取得購貨或修理修配發票的變化

        交通運輸企業在營改增前,購買汽、柴油等貨物或接受修理、修配勞務,取得的發票為普通貨物銷售發票或增值稅專用發票,以發票列明的價款或列明的價稅合計計入成本,增值稅專用發票列明的稅款不允許抵扣。交通運輸企業在營改增后,購買汽、柴油等貨物或接受修車勞務,取得的發票必須為增值稅專用發票,以發票列明的價款計入成本,增值稅款計入進項稅額,其發票抵扣聯經稅務局認證后允許抵扣銷項稅額,否則,如為取得的發票為普通發票,則不允許抵扣銷項稅,企業就會遭受損失。

        2.3 交通運輸企業營改增前后會計賬簿設置上的變化

        企業在營改增前,在流轉稅賬簿設置上只在“應交稅金”科目下設置“應交營業稅”一個三欄式明細賬簿,用于核算流轉稅;營改增后企業應在“應交稅金”科目下設置設置一個三欄式“未交增值稅”明細賬,和一個以“進項稅額”、“銷項稅額”、“已交增值稅”、“轉出已交增值稅”“轉出未交增值稅”為專欄的“應交增值稅”多欄式明細賬對流轉稅進行核算。

        3 營改增前后企業賬務處理的變化

        3.1 營改增前后企業對流轉稅賬務處理的變化

        (1)營改增前企業對流轉稅的核算,營改增前企業在月度終了按本月營業收入和稅率計算應納的營業稅,并進行賬務處理,會計分錄為:“借:營業稅金及附加,貸:應交稅金-應交營業稅”。

        例如:路通運輸公司2013年8月份的營業收入為200萬元,月底計提營業稅:200萬元x3%=6萬元。會計分錄為:

        借:營業稅金及附加 60,000.00

        貸:應交稅金-應交營業稅 60,000.00

        (2)營改增后企業對流轉稅的核算,營改增后企業對增值稅的核算,企業在開具增值稅專用發票后,根據實際結算情況,“借:現金(銀行存款、應收賬款),貸:營業收入、應交稅金-應交增值稅(銷項稅額)”。月底不再提取稅金,應根據本月“應交稅金-未交增值稅”明細賬的余額確定本月應補退的增值稅稅額。

        例如:路通運輸公司2013年8月份開具增值稅專用發票注明的運費為200萬元,增值稅稅額22萬元,以銀行存款收取。

        借:銀行存款 2,220,000.00

        貸:營業收入 2,000,000.00

        應交稅金-應交增值稅(銷項稅額) 220,000.00

        企業預繳增值稅時“借:應交稅金-應交增值稅(已繳增值稅),貸:銀行存款。”,接上例,企業在8月16日預交上半月的增值稅10萬元。

        借:應交稅金-應交增值稅(已繳增值稅)100,000.00

        貸:銀行存款 100,000.00

        月底企業轉出已交增值稅,和未交增值稅。

        借:應交稅金-未交增值稅 100,000.00

        貸:應交稅金-應交增值稅(轉出已繳增值稅)100,000.00

        經計算月底企業未交增值稅為5萬元。

        借:應交稅金-應交增值稅(轉出未繳增值稅)50,000.00

        貸:應交稅金-未交增值稅 50,000.00

        “應交稅金-未交增值稅”期末余額則為企業本月應補(退)的增值稅稅額。

        3.2 企業購進固定資產在會計核算上的變化

        (1)營改增前企業購進固定資產,購入固定資產時,如取得普通發票,則以發票注明的金額計入固定資產成本;如取得增值稅專用發票,則以發票注明的價、稅合計金額計入固定資產成本。用以核算固定資產。

        例如:路通運輸公司7月份購入普通貨車1輛,取得的普通發票上注明的價款為23.4萬元;購入半掛車1輛,取得的增值稅專用發票上注明的價款為30萬元、增值稅額5.1萬元。貨款由銀行支付。其會計核算為:

        借:固定資產-普通貨車 234,000.00

        -半掛車 351,000.00

        貸:銀行存款 585,000.00

        (2)營改增后企業購進固定資產,購入固定資產時,如取得普通發票,則以發票注明的金額計入固定資產成本;如取得增值稅專用發票,則以發票記載的價款計入固定資產成本,發票記載的稅金計入“應交稅金-應交增值稅(進項稅額)”,用以核算固定資產。如上例,如企業在8月份購入上例所屬車輛,則會計核算變為:

        借:固定資產-普通貨車 200,000.00

        -半掛車 300,000.00

        應交稅金-應交增值稅(進項稅額) 85,000.00

        貸:銀行存款 585,000.00

        4 營改增前后企業會計報表反映的變化

        4.1 營改增前后資產負債表相關項目反映內容的變化

        營改增前后資產負債表反映內容的變化不大,只是應交稅費項目在營改增前反映的是營業稅等相關稅費,營改增后反映的是增值稅等相關稅費。

        4.2 營改增前后利潤表相關項目反映內容的變化

        營改增后,利潤表主營業務收入反映的是不含稅收入,營改增前反映的是含稅收入;營改增后,營業稅金及附加項目反映的稅金是除增值稅之外的相關稅費,營改增前反映的是含營業稅等相關稅費;營改增后,營業成本項目反映的是不含稅成本,營改增前反映的是含稅成本。

        4.3 營改增前后現金流量表相關項目反映內容的變化

        (1)現金流量表“銷售貨物或提供勞務收到的現金”項目,營改增前是反映的主營業務收入中收到的現金及現金等價物的金額;營改增后不僅反映主營業務收入中收到的現金及現金等價物的金額,還應反映和主營業務收入一同收到的增值稅銷項稅額。

        例如:7月份路通運輸公司通過銀行收到A公司匯來的運費50萬元,在編制現金流量表的調整分錄為:

        借:銷售貨物或提供勞務收到的現金 500,000.00

        貸:主營業務收入 500,000.00

        8月份路通運輸公司通過銀行收到A公司匯來的運費50萬元,增值稅銷項稅5.5萬元,在編制現金流量表的調整分錄為:

        借:銷售貨物或提供勞務收到的現金 555,000.00

        貸:主營業務收入 500,000.00

        應交稅金-應交增值稅(銷項稅) 55,000.00

        (2)現金流量表“購買商品或接受勞務支付的現金”項目,營改增前是反映的主營業務成本中購買商品或接受勞務支付的現金及現金等價物的金額;營改增后不僅反映主營業務成本中購買商品或接受勞務支付的現金及現金等價物的金額,還應反映和主營業務成本中購買商品或接受勞務支付的現金及現金等價物的金額一同支付的增值稅進項稅額的金額。

        例如:7月份路通運輸公司通過銀行支付B石化公司柴油款30萬元,在編制現金流量表的調整分錄為:

        借:主營業務成本 300,000.00

        貸:購買商品或接受勞務支付的現金 300,000.00

        8月份路通運輸公司通過銀行支付B石化公司發票載明柴油款30萬元,增值稅5.1萬元的柴油款項,在編制現金流量表的調整分錄為:

        借:主營業務成本 300,000.00

        應交稅金-應交增值稅(銷項稅) 51,000.00

        貸:購買商品或接受勞務支付的現金 351,000.00

        (3)支付的與經營活動有關的現金項目,營改增前是反映管理費用、營業費用等賬戶中購買商品或接受勞務支付的現金及現金等價物的金額;營改增后不僅反映管理費用、營業費用等賬戶中購買商品或接受勞務支付的現金及現金等價物的金額,還應反映和管理費用、營業費用等賬戶購買商品或接受勞務支付的現金及現金等價物的金額一同支付的增值稅進項稅額的金額。

        例如:7月份路通運輸公司用現金購買辦公用品一批,發票載明的金額1500元,在編制現金流量表的調整分錄為:

        借:管理費用 1,500.00

        貸:支付的與經營活動有關的現金 1,500.00

        8月份路通運輸公司用現金購買辦公用品一批,發票載明的貨款1000元,增值稅170元。在編制現金流量表的調整分錄為:

        借:管理費用 1,000.00

        應交稅金-應交增值稅(銷項稅) 170.00

        貸:支付的與經營活動有關的現金 1,170.00

        綜上所述,交通運輸企業“營改增”前后在會計核算上的變化,主要是原始憑證、賬簿設置、賬務處理和會計報表項目反映內容上的變化,理清這些變化,并掌握這些變化對我們在會計核算上的影響,我們就能真實、客觀的反映企業營改增后的財務狀況、經營成果和現金流量。

        【參考文獻】

        主站蜘蛛池模板: 2022年亚洲午夜一区二区福利| 亚洲国产av一区二区三区| 国产怡春院无码一区二区| 国产一区二区三区亚洲综合| 国产精品分类视频分类一区| 无码人妻一区二区三区免费看| 亚洲不卡av不卡一区二区| 精品人伦一区二区三区潘金莲| 日韩精品一区二区三区不卡 | 亚洲性日韩精品国产一区二区| 无码av免费毛片一区二区| 无码人妻精品一区二区三区不卡| 亚洲AV无一区二区三区久久 | 精品国产一区二区三区久久狼| 男人的天堂亚洲一区二区三区| 国产精品久久久久一区二区三区 | 中文字幕在线视频一区 | 国产精品日韩一区二区三区| 亚洲视频一区二区| 精品国产日韩亚洲一区91| 亚洲AV日韩AV一区二区三曲| 四虎精品亚洲一区二区三区| 国偷自产av一区二区三区| 无码日本电影一区二区网站| 中文字幕av人妻少妇一区二区| 亚洲午夜精品第一区二区8050| 久99精品视频在线观看婷亚洲片国产一区一级在线 | 精品视频一区在线观看| 国产午夜精品免费一区二区三区 | 国内精品一区二区三区在线观看| 一区二区三区无码被窝影院| 亚洲欧美日韩中文字幕一区二区三区 | 波多野结衣一区二区免费视频| 国产精品视频免费一区二区三区| 国产日韩精品一区二区在线观看| 国产精品亚洲一区二区三区在线观看| 无码国产精品一区二区高潮| 一区二区三区免费在线观看| 精品视频在线观看你懂的一区| 偷拍激情视频一区二区三区| 日本国产一区二区三区在线观看 |