利用神經網路挖礦
1. 利用RBF神經網路做預測
在命令欄敲nntool,按提示操作,將樣本提交進去。
還有比較簡單的是用廣義RBF網路,直接用grnn函數就能實現,基本形式是y=grnn(P,T,spread),你可以用help grnn看具體用法。GRNN的預測精度是不錯的。
廣義RBF網路:從輸入層到隱藏層相當於是把低維空間的數據映射到高維空間,輸入層細胞個數為樣本的維度,所以隱藏層細胞個數一定要比輸入層細胞個數多。從隱藏層到輸出層是對高維空間的數據進行線性分類的過程,可以採用單層感知器常用的那些學習規則,參見神經網路基礎和感知器。
注意廣義RBF網路只要求隱藏層神經元個數大於輸入層神經元個數,並沒有要求等於輸入樣本個數,實際上它比樣本數目要少得多。因為在標准RBF網路中,當樣本數目很大時,就需要很多基函數,權值矩陣就會很大,計算復雜且容易產生病態問題。另外廣RBF網與傳統RBF網相比,還有以下不同:
1.徑向基函數的中心不再限制在輸入數據點上,而由訓練演算法確定。
2.各徑向基函數的擴展常數不再統一,而由訓練演算法確定。
3.輸出函數的線性變換中包含閾值參數,用於補償基函數在樣本集上的平均值與目標值之間的差別。
因此廣義RBF網路的設計包括:
1.結構設計--隱藏層含有幾個節點合適
2.參數設計--各基函數的數據中心及擴展常數、輸出節點的權值。
2. 如何讓利用神經網路進行預測,怎麼在進行訓練之後,怎麼看出訓練模型的好壞如何進行評判
可以用MATLAB神經網路工具箱,先提取樣本,用mapminmax函數歸一化,再newff函數建立網路,設置好訓練參數後,使用train函數訓練,最後用sim函數看預測結果。
在訓練過程中,有一個performance可以觀察,它的訓練目標就是你設置的goal。在訓練過程中,它會自動分出一部分樣本作為validation驗證,可以保證不過擬合。具體要評價效果還是應該看最後預測的精度。
附件是一個BP預測的實例。
3. 如何利用人工神經網路解決實際問題
經過幾十年的發展,神經網路理論在模式識別、自動控制、信號處理、輔助決策、人工智慧等眾多研究領域取得了廣泛的成功。
將人工神經網路應用至實際問題時,需先分析問題有哪些參量,如何抽象建立模型,最後選擇一種適當的神經網路模型,經過訓練即可映射該問題。
人工神經網路由於其獨特的模型結構和固有的非線性模擬能力,以及高度的自適應和容錯特性等突出特徵,在控制系統中獲得了廣泛的應用。其在各類控制器框架結構的基礎上,加入了非線性自適應學習機制,從而使控制器具有更好的性能。基本的控制結構有監督控制、直接逆模控制、模型參考控制、內模控制、預測控制、最優決策控制等。
4. 如何用BP神經網路實現預測
BP神經網路具有任意復雜的模式分類能力和優良的多維函數映射能力,解決了簡單感知器不能解決的異或(Exclusive OR,XOR)和一些其他問題。從結構上講,BP網路具有輸入層、隱藏層和輸出層;從本質上講,BP演算法就是以網路誤差平方為目標函數、採用梯度下降法來計算目標函數的最小值。
5. 求解!基於matlab利用BP神經網路預測未來多年(10年)的能源消耗量。
這么大的課題,已經可以算上碩士論文的級別了。建議與國內實力較強的高校聯手來做這個課題吧。
6. 鄰域法人工神經網路礦產儲量計算
李裕偉
(中國地質礦產信息研究院,北京100812)
李林松
(北京計算機一廠,北京100083)
摘要人工神經網路(ANN)技術是一種可用於模式識別的新技術。本文介紹用ANN技術進行礦產儲量計算的方法,這種方法基於鄰域而不是整個研究區的信息,因而能保證迭代過程的成功。這一ANN方法在一個品位變化很大且樣品分布極不規則的金礦床應用後,取得了令人滿意的結果。本文還對ANN方法與克里格法的應用效果進行了對比。
關鍵詞儲量估計人工神經網路地質統計學鄰域
1引言
到目前為止,主要有兩種用於儲量計算的空間插值方法:距離倒數法和克立格法。前者簡便易行,但忽略地質因素的變化;後者不僅考慮到樣品的空間構形,而且還考慮到礦床的地質條件變化。在應用克立格法時地質學家往往遇到一些難題,如建立不起合適的變差函數、存在非平穩性等。吳希平和周迎新(1993)曾使用人工神經網路技術估計礦產儲量。這顯然是一個很好的開端,因為ANN技術同時具備距離倒數法和克立格法的優點:既簡便易行,又考慮了地質條件變化。此外,在用ANN方法估計儲量時,無需考慮諸如變差函數、平穩性之類的問題。吳希平和周迎新使用ANN方法的范圍是整個研究區,全部樣品只有48件。如果樣品數增加,如超過100件,或者數據構形比較復雜,則將很難達到一個ANN的儲量估計解。為了解決上述問題,筆者設計了一個新的估計儲量的ANN方案,這種方案基於鄰域信息而不是全區信息。
2領域定義
在使用ANN方法估計礦床儲量時,之所以使用鄰域信息而不是全區信息有兩點考慮。其一是對塊段的估值只受其鄰域樣品的影響,因而不需要利用全區樣品;其二是只有在一個小的樣品集的條件下,ANN迭代作業才有可能取得成功。當使用的樣品太多時,ANN的迭代過程可能難以收斂;而當樣品數較少時,收斂的可能性加大。據筆者的經驗,當樣品數少於50時,ANN作業可以順利地進行。簡言之,我們之所以需要一個鄰域,是為了從全部樣品集中抽取一個有效的數據子集,以便用ANN方法成功地進行塊段儲量的估計。
在用ANN方法進行儲量估計時,鄰域的定義與克立格法相似。首先,設計一個由規則塊段組成的網路系統。這樣問題就化為據某塊段鄰域內若干樣品的觀測值來估計該塊段的值。為簡化起見,可將鄰域定義為一個矩形(圖1)。該矩形鄰域中的樣品被用於進行被估塊段的儲量估計。為了更精確地進行塊段估值,可在被估塊段中設置若干個估值點。ANN程序對該塊段的每個估值點返回一個值。這些估值點的平均值即為該塊段的估值(圖2)。
圖1鄰域定義
圖2樣品及估值
對鄰域的大小可以調整,直到其包含50件樣品為止。影響塊段估值精度的因素有三個。其一是鄰域中樣品的數據構形。如果樣品分布比較均勻,則可能得到一個令人滿意的ANN估值。其二是樣品的密度。當鄰域內有較多樣品時,ANN程序將返回一個具有較小誤差的估值。其三是輸入變數的空間變化。一個空間高度波動起伏的變數將導致較大的估值誤差。
3ANN模型
人工神經網路方法是近年來迅速發展的人工智慧技術之一,它已被成功地用於模式識別。這一技術的吸引力在於:應用ANN的地質學家需要做的事僅僅是對輸入層和輸出層進行分析。換句話說,人們無需去研究在輸入層和輸出層之間所發生的事情,因為那些隱蔽層可以被視為一個「黑箱」。這樣一來,需要人們做的僅僅是理解輸入與輸出的事件,這對地質學家來說恰恰是比較熟悉、比較容易的事;而在輸入與輸出之間存在的那些極復雜的非線性關系及巨量的計算任務,則交給計算機去處理,這些工作恰恰是人所難以承擔的。從這一觀點出發,使用ANN技術進行儲量估計的地質學家就可以避免遇到許多使用克立格法時所難以解決的問題。
塊段估值是一個空間模式識別過程。考慮到上述的ANN技術的優點和前人的啟發性工作,本文嘗試使用這一新的模式識別技術進行二維儲量估計。
所設計的ANN結構包含一個輸入層、兩個隱蔽層和一個輸出層。輸入層包含三個變數:x坐標、y坐標和鄰域的品位平均值。所謂鄰域的品位平均值指的是用最近的四個樣品據距離倒數法計算的平均值。在兩個隱蔽層中,每層均含有5個神經元。輸出層只包含一個變數,即所估計點的礦石品位。圖3表示了這一ANN結構。
圖3ANN結構
令xi為下一層第i個神經元的輸入值,xj為上一層第j個神經元的初始輸出值,wij為下一層第i個神經元和上一層第j個神經元的聯結權,則可建立起m個輸入神經元和第j個輸出神經元之間的關系。
數學地質和地質信息
然後使用以下特性函數
數學地質和地質信息
將初始輸出值xj轉換為適配輸出值xj。
所使用的學習演算法為簡單的反向傳播法(BP),其權系數調整方程為
數學地質和地質信息
此方程被用來修改權系數,使其從當前值被修改成下一步的值。式中k為當前所處的迭代次數,η為學習率,δj為第j個輸出神經元的當前值同其目標值之差,xj為第j個神經元在第k次迭代中獲得的適配輸出值。
雖然還可採用一些改進的BP演算法或其他更復雜的學習演算法,但由於簡單的BP演算法已能很好地解決本文的問題,因此就不打算再討論和使用其他的學習演算法。
4實例研究
上述的ANN方法被用於研究河南的J礦床。這是一個石英脈型金礦床,以坑探為主,輔之少量鑽孔控制。共取得250件樣品(圖4)。樣品分布極不均勻,金品位變化很大。因此,這是一個難以用一般插值方法進行空間描述的礦床。為便於對比,用克立格法和人工神經網路方法對礦床的品位按同一塊段系統進行了估計。塊段系統由25×9個克立格塊段組成,每個克立格塊段的大小為50m×50m。被估塊段加上由50個樣品構成鄰近塊段組成鄰域。每個被估塊段有3×3個估值點。根據這些鄰域參數與樣品數據,我們可以用前面定義的ANN模型來逐個塊段地估計金品位。達到指定精度的迭代次數變化范圍很大,取決於鄰域中樣品的數目、構形和變數的空間變化。所設置的臨界迭代誤差為0.001。當實際的迭代誤差小於該臨界誤差時,迭代過程結束。大多數迭代過程在迭代10000~30000次時終止,但最大迭代次數可達100000次。ANN程序對每個塊段的3×3個離散估值點各返回一個金品位估值,再由它們生成塊段的平均值。離散點估值及塊段平均值都是ANN品位估值的重要結果。
圖4樣品點點陣圖
圖2顯示了該金礦床的一個塊段。為了便於清晰地了解樣品與估值點的關系,只顯示了其鄰域的一部分。這個部分鄰域包含了11個樣品,但它們對該塊段的估值無疑是最重要的。圖中9個小矩形代表估值點。可以看出,ANN程序對每個估值點都返回了一個合理的值。每個估值點的值均同其最近的樣品值吻合得很好。由圖2還可以看出,用ANN方法所求得的點上的估值僅由最鄰近的幾個樣品所確定,遠離該估值點的樣品對估值的影響可忽略不計。這就是為什麼在使用ANN方法對一個點或塊段進行估值時只需鄰域而無需整個研究區的理由。對圖2所示塊段鄰域的ANN學習信息列於表1。在通過學習得到權值後,將每個估值點的x坐標、y坐標及鄰域平均值代入公式(1)計算初始輸出值;然後再將初始輸出值代入公式(2)求得適配輸出值。對該塊段的點估值列於表2。
表1圖2所示塊段的學習信息
圖5和圖6分別顯示了對整個礦床的點估值與塊段估值。可以看出,圖6的點估值更好地刻畫了該礦床的金品位分布細節。這一點同克立格法的估值結果有很大的區別。一般說來,克立格法的點估值同塊段估值區別不大,這是因為克立格法無論是對點估值還是塊段估值都會產生很強的圓滑效應,但ANN塊段估值卻不會產生這么強的圓滑效應。將ANN塊段估值(圖5)同克立格塊段估值(圖7)進行對比,雖然全礦床的平均品位非常接近,據ANN法為2.59375,據克立格法為2.49658,但可明顯看到克立格法的估值圖像被大大地圓滑了。我們知道,地質統計學提供了兩種研究空間數據的模型:其一是克立格法模型,它被用來估計一個區域化變數的局域平均值,但不忠實於其空間的變化細節;其二是條件模擬模型,它被用來仔細地刻畫一個區域化變數的空間變化,但不能保證得到一個最優的、無偏的局域平均值。ANN方法看來綜合了這兩種模型的優點,對點估計而言尤其如此。一個ANN制圖過程所產生的點估值的空間變化同實際樣品的空間變化十分相近。當然,樣品點愈密集,點估值的特徵與實際特徵就愈接近。
表2圖2所示塊段的點估值
圖5ANN法金品位塊段估值品位單位:g/t
圖6ANN法金品位點估值品位單位:g/t
圖7克立格法金品位塊段估值品位單位:g/t
為了說明ANN估計的優點,可將圖6的ANN點估值同圖4的實際樣品點點陣圖進行對比。在仔細地研究圖上的ANN點估值及其鄰域的樣品值之間的關系後可以看出,它們之間是非常吻合的。這就表明,ANN可以作為估計礦產儲量的一個非常有效的工具。
5結論
人工神經網路技術是一種新的、有效地估計礦產儲量的方法。在整個研究區內定義一個估計局域品位的ANN作業可能遭到失敗;但如果定義在一個較小的鄰域內則可以取得成功。同地質統計學相比,ANN產生的品點陣圖由於圓滑效應很小,更接近於品位空間分布的實際情況。此外,地質學家不再需要為諸如非平穩性、非正態性、非線性、各向異性、不良變差函數等問題而煩惱。應用ANN技術估計礦產儲量的主要問題是無法通過ANN方法本身提供估值誤差。
參考文獻
[1]J.Hertz,A.Krogh,R.G.Palmer.Introction to the Theory of Neural Computation.Addison-Wesley Publ.co.,Redwood City,California,1991.
[2]Xiping Wu and Yingxin Zhou.Reserve Estimation Using Neural Network Techniques.Computers & Geosciences,1993,19(4).
7. 神經網路到底能幹什麼
神經網路(Artificial Neural Networks,簡寫為ANNs)也簡稱為神經網路(NNs)或稱作連接模型(Connection Model),它是一種模仿動物神經網路行為特徵,進行分布式並行信息處理的演算法數學模型。這種網路依靠系統的復雜程度,通過調整內部大量節點之間相互連接的關系,從而達到處理信息的目的。
神經網路可以用於模式識別、信號處理、知識工程、專家系統、優化組合、機器人控制等。隨著神經網路理論本身以及相關理論、相關技術的不斷發展,神經網路的應用定將更加深入。
神經網路的研究可以分為理論研究和應用研究兩大方面。
理論研究可分為以下兩類:
1、利用神經生理與認知科學研究人類思維以及智能機理。
2、利用神經基礎理論的研究成果,用數理方法探索功能更加完善、性能更加優越的神經網路模型,深入研究網路演算法和性能,如:穩定性、收斂性、容錯性、魯棒性等;開發新的網路數理理論,如:神經網路動力學、非線性神經場等。
應用研究可分為以下兩類:
1、神經網路的軟體模擬和硬體實現的研究。
2、神經網路在各個領域中應用的研究。
8. 在利用神經網路之前,一般是不是先利用主成分分析對數據進行處理,然後再進行訓練
不是必須的 在樣本維數過高的時候才需要壓縮
9. 利用人工神經網路求解權重,訓練樣本哪裡來
我不知道你具體做的課題,但是訓練樣本都是根據實際自己選擇的,而且訓練樣本對訓練結果影響非常大。
給你舉個例子,假如需要利用神經網路判別衛星相片上的地塊是不是荒漠,那這個訓練樣本就是從遙感相片上選擇若干點,然後人工判讀或者實地去調查,從而得到訓練樣本。