發布時間:2023-10-13 15:36:50
序言:作為思想的載體和知識的探索者,寫作是一種獨特的藝術,我們為您準備了不同風格的5篇網絡行為審計,期待它們能激發您的靈感。
關鍵詞:方法;維修性評估;BP神經網絡
1 概述
維修性是現代航空武器裝備重要的設計特性,是影響其使用可用度和作戰效能的重要因素。定型試飛階段是裝備維修性評價的重要環節,其目的是驗證裝備的維修性水平是否達標,為改進裝備維修性設計提供重要參考,提高裝備的維修性水平。試飛階段的維修性評價主要是通過試飛階段產生的維修信息,驗證裝備的維修性水平。維修性評估除了有量化指標要求外,還有很多是一些非量化和無法量化的要求和指標。對這些非量化的指標和要求進行評價是非常困難的,往往不易下結論或者結論不夠準確。目前,人們一般采用層次分析法(AHP)、模糊綜合評判法或灰色評價法進行評價,但這些方法具有較強的主觀性,缺乏自學習能力,實際評判中易受判定隨機性、參評人員主觀不確定性及認識模糊性等諸多因素的制約。針對以上情況,文章在建立維修性定性評估指標體系的基礎上,采用目前比較成熟且最常用的一種神經網絡方法,即BP神經網絡,建立了評價模型,并給出了評價結果。
2 BP神經網絡方法
人工神經網絡是在現代神經生理學和心理學的研究基礎上,模仿人的大腦神經元結構特性而建立的一種非線性動力學網絡系統,它由大量簡單的非線性處理單元(類似人腦的神經元)高度并聯、互聯而成,具有對人腦某些基本特性的簡單的數學模擬能力。
2.1 BP網絡結構
BP神經網絡是一種單向傳播的多層前饋神經網絡,由一個輸入層、一個輸出層和若干中間層(隱層)構成。每層由若干神經元組成,不同層次的神經元之間形成全互連接。層內神經元相互獨立,不同層次之間的神經元以權值W單向連接。每層神經元在節點接受前一層的輸出,同時進行線性復合和映射(線性或非線性),通過復合反映不同神經元之間的耦合和映射對輸入信息作出反應。
BP神經網絡對于輸入值要先向前傳播到隱層節點,經作用函數運算后,再把隱層節點的輸出信息傳播到輸出節點,最后給出輸出值。文章采用一種具有個n2輸入節點、n1個隱層節點和單個輸出節點的三層BP神經網絡,它的數學模型是:
Y=f(WijX+?茲1) (1)
Z=f(WjY+?茲2) (2)
其中,X,Y,Z分別為輸入層、隱層和輸出層矢量(節點向量);Wij,?茲1和Wj,?茲2分別表示輸入層與隱含層以及隱含層與輸出層之間的連接權和閾值,i=1,2,…,n2;j=1,2,…,n1;f(x)為網絡激活函數或傳遞函數,通常采用S形函數,即f(x)=■,如果整個網絡的輸出要取實數域內任何值,則網絡輸出層可以采用線性函數作為傳遞函數,即f(x)=x,其結構如圖1所示。
圖2 圖1中神經元j的結構模型
圖1中Xk=(xp1,xp2,?撰,xpn2)為評價指標屬性值,k=1,2,…,s,其中s是輸入樣本量;Z為樣本模式P的輸出。B=[b1,b2,?撰,bs]T=[bp]s×1為與樣本模式P對應的評價結果,也是神經網絡的期望輸出值。實際輸出Z與期望輸出bp的誤差函數Ep定義為Ep=(bp-Z)2/2。
對于圖1中隱層的神經元j,其結構模型如圖2。
神經元j模型可以表示為:
(3)
2.2 BP網絡學習過程
BP神經網絡的學習過程由正向傳播和反向傳播兩部分組成,在正向傳播過程中,輸入模式從輸入層經過隱層神經元的處理后,傳向輸出層,每一層神經元的狀態只影響下一層神經元狀態。如果在輸出層得不到期望的輸出,則轉入反向傳播,此時誤差信號從輸出層向輸入層傳播并沿途調整各層向連接權值和閾值。以使誤差不斷減小,直到達到精度要求。該算法實際上是求誤差函數的極小值,它通過多個樣本的反復訓練,并采用最快下降法使得權值沿著誤差函數負梯度方向改變,并收斂于最小點。
3 維修性定性評價指標體系
根據GJB 368B裝備維修性通用工作要求中維修性定性評價內容可確定維修性定性評估的指標體系如圖3所示。
圖3 維修性定性評價指標體系
維修性評價的最主要目的就是得出分析對象的維修性好壞。對于二級指標,這里為了方便現場操作人員評價打分,每個指標又細化為多個評價準則。這里給出了互換性與標準化評價準則表,見表1。操作人員只需對評價準則進行回答,即可得出每個指標的評價值。文章以可達性中視覺可達為例介紹專家打分方法和評價過程。由于影響視覺可達的條件不同,因此具體項目和分值應根據實際操作進行調整。打分共有好、中、差等3項指標,“好”指標對應分值為80~100分,“中”指標對應分值為60~80分,“差”指標對應分值為60分以下,滿分100代表最好的視覺可達狀況。為了便于神經網絡訓練,對得到的百分制評價結果進行了處理,即每個分值除以100得到神經網絡輸入向量的元素,例如,如果專家對視覺可達的最終打分結果是85分,對應文章的輸入向量的元素值為0.850。
附表1 互換性與標準化評價準則表
4 維修性BP神經網絡評估模型
文章利用MATLAB實現BP神經網絡的編程。將維修性定性評估指標體系中的16個指標作為神經網絡的輸入向量,將其評估結果作為唯一輸出,建立一個如圖1的16×midnote×1的3層BP神經網絡。
其中16是輸入樣本的維數;
midnote是隱層節點數,隱層節點數目太多會導致學習時間過長、誤差不一定最佳,也會導致容錯性差、不能識別以前沒有看到的樣本,因此一定存在一個最佳的隱層節點數。以下3個公式可用于選擇最佳隱層節點數時的參考公式:
(1)■C■■>k,其中k為樣本數,n1為隱層節點數,n2為輸入節點數。如果i>n1,C■■=0;
(2)n1=■+a,其中m為輸出節點數,n2為輸入節點數,a為[1,10]之間的常數;
(3)n1=log2n2,其中,n2為輸入節點數。
1 是輸出層節點數。
網絡輸入層與隱層之間的傳遞函數f(x)為tansig,即S型的雙曲正切函數;隱層與輸出層之間的傳遞函數f(x)為purelin,即f(x)=x;網絡訓練函數為traingd,即梯度下降BP算法函數;對于BP網絡創建函數newff,其性能函數默認為“mse”,即均方誤差性能函數,其權值和閾值的BP學習算法默認為“learngdm”。下面將介紹學習步長、初始權值和目標精度的選取要求。
4.1 學習步長、初始權值、目標精度的選取
學習步長是在學習過程中對權值的修正量,與網絡的穩定性有關。步長過短,則學習效率低,步長過長,則網絡穩定性差,學習步長一般取0.05。
初始權值選取和輸出結果是否最接近實際,是否能夠收斂,學習時間的長短等關系很大,由于MATLAB仿真軟件會根據初始化函數自動生成相應的初始權值和閾值。
目標精度是確定神經網絡的精度標準,當誤差達到目標精度要求后網絡停止。目標精度的確定是根據實際情況對精度的要求而定。
4.2 實例驗證
訓練根據實際數據和專家評定,選定用于訓練和測試的10組樣本數據,其中X矩陣的前9行,即9組訓練樣本,X矩陣的第10行為1組測試樣本,B為10組樣本的目標輸出矩陣,Q為待估樣本矩陣。
(1) 學習樣本矩陣、目標輸出矩陣、待評估矩陣的數據輸入
(2)BP神經網絡模型程序代碼設計:
net=newff (min max(X(1:9,inf)'), [midnote 1], {'tansig','purelin'},'traingd')%創建網絡并初始化
net.trainparam.show=50 顯示訓練狀態間隔次數
net.trainparam.lr=0.05 學習步長
net.trainparam.epochs=500 仿真次數
net.trainparam.goal=0.001 目標精度
[net,tr]=train(net, X(1:9,inf)',B') 網絡訓練
Zsim=sim(net, X(10,inf)') 仿真計算
(3)仿真結果輸出及分析
待評估矩陣的仿真結果為:Zsim=0.762066,它表示的意義是在16個二級評估指標能力值分別為待評估矩陣所給定值時,該維修性的評估結果是0.762066。圖4為BP神經網絡訓練圖。從圖中可以看出,訓練仿真到351次時,達到設定的目標精度0.001,訓練停止。文章只對BP神經網絡解決維修性評估的方法上進行了初步的探索,隨著裝備維修性研究的不斷深入和神經網絡技術的發展,BP神經網絡方法在維修性評估中的應用將更加廣泛。
圖4神經網絡訓練誤差曲線
5 結束語
文章將BP神經網絡方法應用于對航空維修性的評價,意在建立更加接近于人類思維模式的定性與定量相結合的綜合評價模型。通過對給定樣本模式的學習,獲取評價專家的經驗、知識、主觀判斷及對目標重要性的傾向,當需對有關對象作出綜合評價時,便可再現評價專家的經驗、知識和直覺思維,從而實現了定性分析和定量分析的有效結合,也較好地保證了評價結果的客觀性,此外仿真結果精確度高,可信性強。
參考文獻
[1]黃書峰,端木京順,唐學琴,等.航空維修保障能力的神經網絡評估方法與應用[J].航空維修與工程,2008.
[2]GJB 368A-1994.裝備維修性通用大綱[S].
基金項目:國家社科基金重大項目(10ZD&054)。
作者簡介:鐘陽(1982―),女,滿族,黑龍江哈爾濱人,吉林大學經濟學院博士研究生,主要從事國際金融研究;丁一兵(1973―),男,湖北武漢人,吉林大學經濟學院教授,博士生導師,主要從事世界經濟、國際金融研究;何彬(1979一),男,云南昆明人,吉林大學國有經濟研究中心博士,主要從事應用計量經濟學、公共經濟學研究。
中圖分類號:F821.0
文獻標識碼:A
文章編號:i006―1096(2012102-0070―05
關鍵詞: 正交基神經網絡; 非線性; 衛星信道; 預失真
中圖分類號: TN927?34 文獻標識碼: A 文章編號: 1004?373X(2013)09?0040?03
0 引 言
高功率放大器是衛星通信系統中的重要組成部分,當其工作在飽和區附近時,衛星信道具有嚴重的非線性。這種非線性對信號的影響主要有兩方面[1]:一是信號星座圖發生變形,造成碼間串擾(ISI);二是頻譜再生,引起鄰近信道干擾(ICI)。
隨著現代通信技術和多媒體業務的高速發展,大容量高速率的信息傳輸十分必要,衛星通信也以不可抵擋之勢向高速率大容量的方向迅猛發展。由于通信速率和通信帶寬的迅猛增加,頻譜資源越來越緊張,現代衛星通信更趨向于采用比恒包絡調制頻譜效率更高的幅度相位聯合調制方式,如DVB?S2標準中的APSK等調制方式[2?3]。與傳統的相位調制技術相比,APSK信號由于其信號幅度的變化,對衛星信道的非線性失真更加敏感。為保證通信性能,必須對信道的非線性失真進行補償。
1 高功放的非線性特性及其對系統性能的影響
高功放的工作特性分為線性區和非線性區,當輸入信號功率較低時,輸出和輸入功率關系是線性的;當輸入功率較高時,輸出和輸入功率關系呈現出非線性,當輸出功率達到飽和,再增加輸入功率,輸出功率不會增大還可能會減小。
高功放非線性模型非常多,本文采用經典的Saleh模型,該模型中幅度和相位的輸出僅與輸入信號的幅度有關。其幅度和相位轉移特性曲線如圖1所示,當輸入信號歸一化幅度小于0.6時,幅度轉移和相位轉移呈現線性,大于0.6時,其轉移特性呈現非線性。
圖2為16APSK信號經過非線性高功放的收發信號星座圖。可以看出,接收信號星座圖已經發生嚴重畸變,外圈星座點半徑被壓縮,內圈星座點半徑擴大,內外圈星座點歐式距離被縮小;星座點相對原來位置發生逆時針旋轉;碼間串擾很大,星座點扭曲嚴重。由于高功放非線性效應的影響,在不加補償的情況下,接收機已經不能正常工作。
2 正交基神經網絡
正交基前向神經網絡模型如圖3所示。該網絡模型由輸入層、隱藏層和輸出層組成。其中輸入層、輸出層各有一個神經元,使用線性激勵函數[f(x)=x],隱藏層有[n]個神經元,采用一組階次逐漸增高的正交多項式[φ(x)]作為其激勵函數。
傳統的神經網絡存在收斂速率慢和易陷入局部極小等缺點,文獻[4]提出了一種Chebyshev正交基神經網絡,該網絡的隱藏層神經元采用Chebyshev正交多項式,即文獻[4]采用基于偽逆的方法,實現了一步權值直接確定,不需要迭代,具有更高的計算速率和工作精度,同時不存在局部極小的問題。考慮到Chebyshev正交基神經網絡的優點,將其應用到衛星非線性信道的補償技術中。
3 基于正交基神經網絡的預失真補償算法
正交神經網絡預失真系統框圖如圖4所示。[x(n)]為預失真器的輸入,[y(n)]為預失真器的輸出、高功放的輸入,[z(n)]為高功放的輸出,用[M(?)]和[N(?)]分別表示預失真器的幅度和相位轉移特性,預失真器的輸入輸出關系為[1]:
【摘要】 目的: 探討矽肺纖維化同生物活性介質之間的關系。方法: 利用Delphi語言編制了BP人工神經網絡模型計算機程序,建立并分析了矽肺膠原纖維預測的數學模型。結果: 選定網絡隱含層節點為9,初始權值閾值約為(-0.2,0.2),最大相對誤差為4%,最小相對誤差為0.2%。 結論: 應用神經網絡具有較好的預測效果,可為臨床醫學研究提供一個很好的研究思路。
【關鍵詞】 BP神經網絡; 生物活性介質; 矽肺; 膠原纖維; 預測
矽肺是塵肺中最嚴重的一種類型,是由于長期吸入超過一定濃度的含有游離二氧化硅的粉塵,肺內發生廣泛的結節性纖維化。矽肺纖維化的預測困難,診斷滯后。目前,矽肺的發病機理仍然不完全清楚,尚無有效的早期診斷(篩檢)方法,也無早期診斷的特異性指標和特異性的治療藥物和方法。一經傳統的后前位胸大片確診,肺部病變已經無法逆轉。因此,尋找早期診斷(篩檢)特異性的生物介質組合,對預防、治療乃至最終消除矽肺具有重要意義。矽肺的發病與細胞因子(Cytokine,CK)網絡調控有密切聯系,高宏生等用系統生物學的方法論證了細胞因子對矽肺纖維化的網絡調控關系[1,2],論證了細胞因子復雜非線性致炎致纖維化的網絡調控假說。王世鑫等用判別方程的方法,通過診斷肺纖維化正確率。矽肺纖維化與不同活性介質、基因表達等多種因素密切相關[3],因此預計是一個多目標決策問題。傳統的預測方法是用多元線性回歸來進行預測,統計者千方百計的想找出決策目標和各因素之間找出一個線性的公式關系,試圖想用一個嚴格的數學模型公式表達出相應的關系。實際上,具有良好的非線性的神經網絡可以預測矽肺纖維化結果。本研究圖基于神經網絡的方法預測生物活性介質網絡調控的矽肺纖維化。
1 神經網絡的基本理論
人工神經網絡是基于對人腦組織結構、活動機制的初步認識提出的一種新型信息處理體系。通過模仿腦神經系統的組織結構以及某些活動機理,人工神經網絡可呈現出人腦的許多特征,并具有人腦的一些基本功能。從本質上講,人工神經網絡是一種大規模并行的非線性動力系統。它具有許多引人注目的特點:大規模的復雜系統,有大量可供調節的參數;高度并行的處理機制,具有高速運算的能力;高度冗余的組織方式等。
在預測領域中應用最廣泛的還是BP網絡。BP網絡的學習算法是一種誤差反向傳播式網絡權值訓練方法。實質就象最小二乘法一樣,BP算法是在樣本空間中耦合這樣一個曲面,即使所有的樣本點均在這個曲面上,若這樣的曲面不存在,就找到離樣本點的距離之和最小的曲面作為近似解。
BP網絡的學習過程包括:正向傳播和反向傳播。當正向傳播時,輸入信息從輸入層經隱單元處理,后傳向輸出層,每一層神經元的狀態只影響下一層的神經元的狀態。如果在輸出層得不到希望的輸出,則轉入反向傳播,將誤差信號沿原來的神經連接通路返回。返回過程中,逐一修改各層神經元連接的權值。這種過程不斷迭代,最后使得信號誤差達到允許的誤差范圍之內。如圖1所示為3層神經網絡結構圖。
輸入層
隱含層
輸出層
圖1 神經網絡結構
設3層BP神經網絡,輸入向量為X=(x1,x2,…xn)T ;隱層輸出向量為Y=(y1,y2,…ym)T ,輸出層向量為O=(o1,o2,…ol)T ,期望輸出向量為d=(d1,d2,…dl)T 。
對于輸出層,有ok =f(net),netk=m j=0wjkyj ,k=1,2,…l
對于隱層,有yj =f(net),netj=n i=0vijxi ,k=1,2,…m
f(x)=1 1+e-x ,BP學習算法權值調整計算公式為:
Δwjk=η(dk-ok)ok(1-ok)yj
Δvij=η(l k=1δ0k wjk)yj(1-yj)xi
δ0k =(dk-ok)ok(1-ok)
η∈(0,1)
2 應用實例
2.1 矽肺預測的影響因素
大量研究表明,肺泡巨噬細胞和肺泡上皮細胞在肺組織炎癥反應及纖維化病變的啟動、發展過程中起到最為關鍵的作用,主要是通過分泌細胞因子、炎性介質等生物活性物質,發揮直接或間接的生物學作用。這些CK包括:白介素(interleukin,IL)、腫瘤壞死因子(tumor necrosis factor ,TNF)、轉化生長因子(transforming growth factor,TGF)等。根據分泌細胞因子不同將Th 細胞分為Th1 和Th2 兩種類型。Th1主要分泌白介素-2(interleukin-2,IL-2)、白介素-12(interleukin-12,IL-12)、白介素-18(interleukin-18,IL-18)、干擾素-γ(Interferon-γ,IFN-γ)等,主要介導細胞免疫應答,與炎癥有關,具有抗纖維化作用,可抑制成纖維細胞的增殖及纖維的生成。Th2主要分泌白介素-4 (interleukin-4,IL-4)、白介素-5 (interleukin-5,IL-5)、白介素-10 (interleukin-10,IL-10)、白介素-13(interleukin-13,IL-13)、單核細胞趨化蛋白-1 (monocyte chemoattractant protein-1,MCP-1)等,而Th2主要介導體液免疫反應,可促進成纖維細胞的增生,導致膠原蛋白合成增加,并抑制膠原蛋白的降解,最終導致細胞外的基質蛋白沉積和纖維生成。Th1 型和Th2 型免疫應答之間存在著交互的負反饋作用,維持著正常的免疫平衡。其負反饋調節通常就是靠產生的細胞因子起作用的,即一型CK可以下調另一型CK的功能。Th1/Th2型CK失衡可導致機體對損傷的異常反應。總之,矽肺病人存在CK網絡的平衡紊亂,其錯綜復雜的調控機制可能參與矽肺的發生和發展[6~9],如圖2所示。
圖2 細胞因子網絡調控圖
2.2 矽肺預測的BP網絡模型的設計
本研究運用神經網絡的模型方法,對矽肺預測進行設計,得出其預測模型。
2.2.1 輸入層、隱含層、輸出層的設計
矽肺纖維化輸入層的確定:根據meta分析和微分方程網絡模型確定生物活性介質為輸入層。
轉貼于
對于矽肺預測,應當依據其關鍵要素來確定輸入層各因素,在神經網絡模型中,輸入層可以選定白介素(interleukin,IL)、腫瘤壞死因子(tumor necrosis factor ,TNF)、轉化生長因子(transforming growth factor,TGF)等。根據分泌細胞因子不同將Th 細胞分為Th1 和Th2 兩種類型。Th1主要分泌白介素-2(interleukin-2,IL-2)、白介素-12(interleukin-12,IL-12)、白介素-18(interleukin-18,IL-18)、干擾素-γ(Interferon-γ,IFN-γ)作為輸入層,輸入單元數為8,隱含層節點的確定參考下面單元計算公式:
c=n+m+a
其中c 為隱層單元數,n為輸入神經元個數,m 為輸出神經元個數,a 為1~10之間的常數。本研究中,隱層單元數計算如下:
8+2+1≤c≤8+2+10
即:4.33≤c≤13.33
根據c 的計算值,由小到大改變節點數訓練并檢驗其精度,當節點數的增加誤差不進一步減小時,其臨界值即為應采用的值。最后,經過網絡的實際訓練結果比較,選定網絡隱含層節點為9,此時網絡能較快地收斂至所要求的精度。
2.2.2 初始權值的確定
在神經網絡模型中,初始權值選取對于輸出結果是否最接近實際,及是否能夠收斂、學習時間的長短等關系很大。初始權值太大,使得加權之后的輸入和N落在了網絡模型的s型激活函數的飽和期中,從而會導致φ′(·)非常小,而由于當 φ′(·)0時,則有δ0,使得Δwji 0,最終使得調節過程沒有什么效果。所以權值及閾值的初始值應選為均勻分布的小數經驗值,約為(-2.4/F,2.4/F)之間,其中F為所連單元的輸入層節點數。本模型輸入端節點數為11,所以初始值約為(-0.2,0.2),可隨機選取[4]。
2.2.3 目標值及學習步長的選取
對矽肺預測之前,應先根據影響矽肺預測的因素進行綜合預測。在實際操作時,還應結合經驗值。若Sigmoid函數選取反對稱函數——雙曲正切函數,綜合評估指標的目標值D的范圍也應在[-1,1]之間,也即是綜合指標的無量綱數值在[0,1]之間。通常輸出單元的局部梯度比輸入端的大,所以輸出單元的學習的步長應比輸入單元小一些[5]。
通過以上分析可得網絡模型結構如圖3。利用Delphi語言編制了BP人工神經網絡模型計算機程序進行訓練集樣本訓練,訓練輸入節點數為8,表1為矽肺預測輸入訓練樣本和檢測樣本,當誤差給定E=0.00005,學習步長為0.1,經200次訓練,網絡精度達到要求,如表2和圖4所示。表1 矽肺預測輸入訓練樣本和檢測樣本表2 訓練樣本訓練次數網絡誤差
樣本經200次訓練后,網絡誤差滿足精度要求,隱含單元到各輸入單元的權值和閾值及輸出單元到各隱含單元的權值和閾值調整為表3和表4所示。
由于矽肺預測神經網絡模型經訓練后,網絡精度已經達到要求,可以用檢驗樣本檢測預測效果,如表5所示。
從預測結果看,最大相對誤差為4.0%,最小相對誤差為0.2%,預測效果非常明顯,該網絡的檢驗性能穩定,可以很好的對矽肺進行預測。表3 隱含單元到各輸入單元的權值和閾值表4 輸出單元到各隱含單元的權值和閾值表5 檢驗樣本及矽肺預測結果
3 討論
本研究通過采用神經網絡的方法,探討矽肺纖維化同生物活性介質之間的關系,并建立了矽肺纖維化的影響因素和Ⅰ型膠原、Ⅲ型膠原的BP神經網絡,從預測效果看,能夠較準確的預測矽肺纖維化。但還應當看到神經網絡應用到預測還有許多不盡如意的問題,主要的弱點之一是它是一種黑盒方法,無法表達和分析被預測系統的輸入與輸出間的關系,因此,也難于對所得結果作任何解釋,對任何求得數據做統計檢驗; 二是采用神經網絡作預測時,沒有一個便于選定最合適的神經網絡結構的標準方法,只能花大量時間采用湊試法,從許多次實驗中找出“最合適”的一種。本研究在矽肺預測上運用神經網絡建模上進行了初步的探討,對網絡模型的拓展性、收斂性等問題還有待于進一步的研究 。
參考文獻
1 高宏生, 伍瑞昌, 張雙德, 等. 基于meta分析和微分方程模型的肺纖維化細胞因子調控網絡研究. 軍事醫學科學院院刊,2008,32(3):312~316.
2 高宏生,楊霞,丁朋,等. 應用meta分析肺纖維化TNF-α的時空變化. 武警醫學院學報,2008,17(8):561~562.
3 劉萍 王世鑫 陳蕾,等. 矽肺患者血清克拉拉細胞蛋白和表面活性蛋白D的改變. 中華勞動衛生職業病雜志, 2007, 25(01):18~21.
4 韓力群.人工神經網絡理論、設計及應用.化學工業出版社,2001.
5 何海龍,王青海,王精業.神經網絡在裝備保障性評估中的應用. 系統工程理論與實踐,2003,9:111~116.
6 Kohonen T.Self-Organization and Associative Memory. Berlin Heidelberg:Springer-Verlag,1984.
7 Lapedes A,Farber.Nonlinear signal processing using neural networks :prediction and system modelling[R].Technical Report LA-UR-87-2662,Los Alam os National Laboratory.Los Alamos.NM,1987.
8 Wang CH, Mo LR, Lin RC, et al. Artificial neural network model is superior to logistic regression model in predicting treatment outcomes of interferon-based combination therapy in patients with chronic hepatitis C.Intervirology,2008,51(1):14~20.
9 Kato H, Kanematsu M, Zhang X,et al. Computer-aided diagnosis of hepatic fibrosis: preliminary evaluation of MRI texture analysis using the finite difference method and an artificial neural network.AJR Am J Roentgenol, 2007,189(1):117~122.
10 Piscaglia F, Cucchetti A, Benlloch S,et al. Prediction of significant fibrosis in hepatitis C virus infected liver transplant recipients by artificial neural network analysis of clinical factors. J Gastroenterol Hepatol, 2006,18(12):1255~1261.
根據國外公司法或者國外研究人員的定義,財務危機是指企業由于經營失敗而沒有能力支付到期債務。以下事項只要滿足一項就表明企業經營失敗,即:破產,債券違約,透支銀行賬戶,無法支付優先股股利。這樣的定義是基于國外資本市場十分成熟的情況下做出的,然而,由于我國的資本市場僅僅發展二十余年,尚不成熟,并且我國上市公司的退市制度還不完善,因此,本文將發生財務危機的企業定義為中國證券監督管理委員會(證監會)設定為“特別處理”的企業,通常在資本市場中這類企業的股票代碼前冠以“ST”符號以示區分。
基于現有的各類財務指標,構建一個財務危機預警的數學模型,用于提示企業發生財務危機的可能性有很多現實意義。建立與企業實際發展狀況相符的財務危機預警模型有利于投資者做出更加理智的投資決策,有利于企業管理者更好地理解企業財務狀況以提高管理水平,有利于銀行和其他債權人更好地評估企業的債務違約風險,有利于政府監管部門更有針對性地監督上市公司,有利于審計人員更加高效地審計上市公司等等。
二、選擇樣本
失敗企業的篩選:
在第一部分,將“ST”企業定義為經營失敗的企業,數據來自于上海證券交易所和深圳證券交易所網站。由于有些失敗企業數據缺失,最終篩選出2005年的55家“ST”企業。為了將模型適用于各類企業,這55家“ST”企業來自各行各業,有制造業、建筑業、交通運輸業等。資本市場中,大部分企業使用統一的會計制度,但是金融保險業上市公司使用其專有的會計制度,因此,本文挑選的55家“ST”企業不包括金融保險業上市公司。
非失敗企業的篩選:
非失敗企業的篩選按照以下步驟進行:(1)查找“ST”公司的行業類別代碼;(2)在該類行業中,篩選出和“ST企業”資產規模最接近的企業;(3)如果篩選出的企業是非失敗企業,則采用;(4)重復以上步驟,直到篩選出與失敗企業同樣數量的非失敗企業。
表 失敗企業和非失敗企業的來源與數量 單位:家
三、選擇財務指標
目前,通過哪些財務指標來判斷企業是否遇到了財務危機沒有一個統一的標準,而且僅僅通過若干個財務指標來描述企業的經營狀況是很困難的。本文在前人研究經驗的基礎上,初步篩選出反映企業總體狀況的六個方面的15個財務指標,這六個方面分別是短期償債能力,長期償債能力,盈利能力,資產管理能力,主營業務盈利能力和增長能力。篩選的15個財務指標來自2005年12月31日的資產負債表,主要有流動比率,速動比率,現金比率,產權比率,已獲利息倍數,現金收入比率,總資產收益率,凈資產收益率,存貨周轉率,應收賬款周轉率,總資產周轉率,主營業務利潤率,資本保值增值率,凈利潤增長率,總資產增長率。
在建立預測模型之前,首先要在15個財務指標中找出與企業被“ST”最相關的指標。在Rapidminer 6.1中,使用相關矩陣測算財務指標與“ST”之間的關系。通過計算,除去流動比率(相關系數為0.03
圖1
使用Rapidminer 6.1的相關矩陣函數計算找出與企業被“ST”最相關的財務指標,軟件中使用的模塊和連接如圖中所示。
圖2
展示了13個財務指標分別與企業被“ST”之間的相關系數,運行結果顯示,財務指標X1(流動比率)和財務指標X3(現金比率)與“ST”的相關系數小于0.05,表明他們之間的相關性小,因此剔除這兩個財務指標。
四、實驗過程
神經網絡的建模過程如圖3、圖4所示,圖5表示的是預測的準確率。
圖3 主要處理過程
將待處理數據和SPLIT函數模塊拖入主界面,將兩個模塊連接,SPLIT函數模塊的作用是將待處理數據隨機分割成兩部分,設定分隔系數是0.7,即70%的財務數據用作訓練數據,30%的財務數據用作檢驗數據。
圖4
將導入主界面的全部數據中的70%,即導入77家上市公司的財務數據,使用神經網絡模型進行訓練,訓練完成的神經網絡模型用于對剩余30%的數據即33家上市公司的財務數據進行預測,預測這33家上市公司中失敗企業(即“ST”上市公司)的數量和非失敗企業(即正常上市公司)的數量。
圖5
訓練后的神經網絡的預測結果:93.33%的原“ST”企業被預測成功,88.89%的原正常企業被預測成功,總體預測精度達到90.91%。