<ruby id="26blz"></ruby>
    1. <pre id="26blz"></pre>
    2. 久久夜色精品国产网站,丁香五月网久久综合,国产特色一区二区三区视频,无码一区二区三区视频,国产成人精品无缓存在线播放,视频区 国产 图片区 小说区,精品一区二区三区日韩版,国模雨珍浓密毛大尺度150p
      首頁 > 文章中心 > 如何學習神經網絡

      如何學習神經網絡

      前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇如何學習神經網絡范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。

      如何學習神經網絡

      如何學習神經網絡范文第1篇

      關鍵詞:強化學習;神經網絡;馬爾科夫決策過程;算法;應用

      中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2012)28-6782-05

      在機器學習領域,大致可以將學習分為監督學習、非監督學習和強化學習三大類。強化學習以其在線學習能力和具有無導師制的自適應能力,因此被認為設計智能Agent的核心技術之一。從20世紀80年代末開始,隨著數學基礎日益發展的支持,應用范圍不斷擴大,強化學習也就成為目前機器學習的研究熱點之一。在研究過程中,隨著各種方法、技術和算法大量應用于強化學習中,其缺陷和問題也就日漸顯現出來,尋找一種更好的方式和算法來促進強化學習的發展和廣泛應用,是研究人員探討和研究的重點。因此,神經網絡及其算法以其獨特的泛化能力和存儲能力成為眾多研究人員重視的研究對象。

      在此之前,已有大量研究者通過神經網絡的特性來加強強化學習的效果及應用。張濤[2]等人利用將Q學習算法和神經網絡中的BP網絡、S激活函數相結合,加上神經網絡的泛化能力,不僅解決了倒立擺系統的一系列問題,而且還進一步提高了強化學習理論在實際控制系統的應用。林聯明在神經網絡的基礎研究Sarsa強化算法,提出用BP網絡隊列保存SAPs,解決由于過大而帶來的Q值表示問題[3]。強化學習理論在機器控制研究中也應用廣泛。段勇在基于行為的移動機器人控制方法基礎上,將模糊神經網絡與強化學習理論相結合,構成模糊強化系統,解決了連續狀態空間和動作空間的強化學習問題和復雜環境中的機器人導航問題[4]。由此可見,將神經網絡與強化學習相結合,已經是現今強化學習研究的重點方向,也已經取得了頗豐的成果。但是,如何將神經網絡和強化學習理論更好的融合,選擇何種算法及模型,如何減少計算量和加快學習算法收斂速度,以此來推動強化學習理論研究更向前發展,解決更多的實際應用問題,這些依然還是待解決的研究課題之一。下面,根據本人對強化學習的研究,朋友給予的指導以及參照前人的研究成果,對基于神經網絡的強化學習作個基本概述。

      1 強化學習

      強化學習(reinforcement),又稱再勵學習或評價學習,它是重要的機器學習方法之一,在機器人控制、制造過程控制、任務調配及游戲中有著廣泛的應用。

      1.1 定義

      所謂強化學習就是智能Agent從環境狀態到行為映射的學習,并通過不斷試錯的方法選擇最優行為策略,以使動作從環境中獲得的累積獎賞值最大。

      強化學習狀態值函數有三個基本表達式,如下:

      這三個狀態的值函數或狀態—動作對函數的值函數是用來表達目標函數,該目標函數是從長期的觀點確定什么是最優的動作。其中[γ]為折扣因子,[rt]是agent從環境狀態[st]到[st+1]轉移后所接受到的獎賞值,其值可以為正,負或零。其中式(1)為無限折扣模型,即agent需要考慮未來h([h∞])步的獎賞,且在值函數以某種形式進行累積;式(2)為有限模型,也就是說agent只考慮未來h步的獎賞和。式(3)為平均獎賞模型,agent考慮其長期平均的獎賞值。最優策略可以由(4)式確定

      1.2 基本原理與一般結構

      強化學習就是能夠和環境進行交互的智能Agent,通過怎樣的學習選擇能夠達到其目標的最優動作。通俗的說,在Agent與環境進行交互的過程中,每個行為動作都會獲得特定的獎賞值。如果Agent的某個行為策略導致環境正的獎賞值(強化信號),那么Agent以后產生這個行為策略的趨勢就會加強。Agent的目標就是對每個離散的狀態發現最優策略以期望的折扣獎賞和最大。

      在上述定義中描述了強化學習的三個狀態值或函數動作對函數來表達目標函數,可以求得最優策略(根據(4)式)。但是由于環境具有不確定性[5],因此在策略[π]的作用下,狀態[st]的值也可以寫為

      強化學習把學習看作試探評價過程,可用圖1描述。強化學習選擇一個動作作用于環境,環境受到作用后其狀態會發生變化,從一個狀態轉換到另一個狀態,同時產生一個強化信號反饋給Agent,即獎懲值。Agent接受到獎懲值和環境狀態變化,進行學習更新,并根據獎懲值和環境當前狀態選擇下一個動作,選擇的原則是使受到正強化(獎)的概率增大。選擇的動作不僅影響立即強化值,而且影響環境下一時刻的狀態及最終的強化值。

      2 神經網絡

      2.1 神經網絡概述

      神經網絡是指模擬人類大腦的神經系統的結構與功能,運用大量的處理部件,采用人工方式構造的一種網絡系統。神經網絡是一種非線性動力學系統,并且具有以分布式存儲和并行協同處理的特點,其理論突破了傳統的、串行處理的數字計算機的局限。盡管單個神經元的結構和功能比較簡單,但是千千萬萬個神經元構成的神經網絡系統所能表現的行為卻是豐富多彩的。

      單個神經元的模型如圖2所示。

      人工神經元模型由一組連接,一個加法器,一個激活函數組成。連接強度可由各連接上的值表示,權值為正表示激活,權值為負表示抑制;加法器用于求輸入信號對神經元的相應突觸加權之和。激活函數用于限制神經元輸出振幅。

      神經元還可以用如下公式表示

      激活函數主要有閾值函數、分段線性函數、非線性轉移函數三種主要形式。

      一般來說,神經網絡在系統中的工作方式是:接受外界環境的完全或者不完全的狀態輸入,并通過神經網絡進行計算,輸出強化系統所需的Q值或V值。人工神經網絡是對人腦若干基本特性通過教學方法進行的抽象和模擬,是一種模仿人腦結構及功能的非線性信息處理系統。

      2.2 強化學習與神經網絡的融合

      經過研究發現,神經網絡的眾多優點,可以滿足強化學習研究的需要。首先,由于神經網絡模仿人的大腦,采用自適應算法,使得Agent智能系統更能適應環境的變化。此外,神經網絡具有較強的容錯能力,這樣可以根據對象的主要特征來進行較為精確的模式識別。最后,神經網絡又有自學習,自組織能力和歸納能力的特點,不僅增強了Agent對不確定環境的處理能力,而且保證了強化學習算法的收斂性。神經網絡也有無導師學習機制,正好適用于強化學習。

      強化學習和神經網絡的融合重點在于如何運用神經網絡多重特性,能夠快速高效地促進Agent智能系統經歷強化學習后,選擇一條最優行為策略來滿足目標需求。強化學習的環境是不確定的,無法通過正例、反例告知采取何種行為。Agent必須通過不斷試錯才能找到最優行為策略。但是在此過程中,會遇到許多問題,比如輸出連續的動作空間問題,但可利用神經網絡的泛化特征,實現了輸出在一定范圍內的連續動作空間值[2]。所以,簡單的講,將神經網絡和強化學習相融合,主要是利用神經網絡強大的存儲能力和函數估計能力。目前,在函數估計強化學習研究上,神經網絡是研究熱點之一。

      3 馬爾科夫決策過程

      本文主要論述馬爾科夫型環境下的強化學習,可以通過馬爾科夫決策過程進行建模。下面給出其形式定義:

      基本的POMDP由四個元組成:。S是指一個環境狀態集,可以是有限的,可列的或者任意非空集;A為Agent行為集合,用A(s)表示在狀態s處可用的決策集;獎賞函數R(s,a):[A×S]->Real;T:[A×S]->PD(S);T(s,a,s')為Agent在狀態s采用a動作使環境狀態轉移到s'的概率。

      一個有限的馬爾科夫決策過程有5元組成:;前四個元與上述是一致的,V為準則函數或者目標函數[3],常用準則函數有期望折扣總報酬、期望總報酬和平均報酬等并且可以是狀態值函數或狀態-動作對值函數。

      馬爾科夫決策過程的本質是:當前的狀態轉變為另一個狀態的概率和獎賞值只取決于當前的狀態和選擇的動作,與過去的動作和狀態無關。所以,在馬爾科夫環境下,已知狀態轉移概率函數T和獎賞函數R,可以借助于動態規劃技術求解最優行為策略。

      4 改進的強化學習算法

      到目前為止,強化學習領域提出的強化學習算法層出不窮,如Sutton提出的TD算法[6],Watkins提出的Q-Learning算法[7],Rummery和Niranjan于1994提出的Sarsa算法[8],以及Dyna-Q學習算法[9]等。致力于這方面研究的研究人員,都在極力尋找一種既能保證收斂性,又能提高收斂速度的新型學習算法。本文主要在基于神經網絡的特性,研究并提出改進的強化學習算法。

      4.1 基于模糊神經網絡的Q([λ])學習算法

      Q學習算法是強化學習領域重要的學習算法之一[7,10],它利用函數Q(x,a)來表達與狀態相對應的各個動作的評估。Q學習算法的基本內容為:

      (1)任意初始化一個Q(x,a)

      (2)初始化 s

      (3)從決策集中隨即選擇一個動作a

      (4)采取動作策略a,觀察[r,][s]'的值

      (5)計算 [Qs,aQs,a+αr+γmaxa'Qs',a'-Qs,a], (11)

      (7)重復(2)-(6)步,直到s終結。

      式(11)使用下一狀態的估計來更新Q函數,稱為一步Q學習。將TD([λ])的思想引入Q學習過程,形成一種增量式多步Q學習,簡稱Q([λ])學習[11]。步驟與Q算法類似,其計算公式如下:

      如果 [s=st,a=at],則[Qst,at=Qst,at+αtγt+γtetst+at]; (12)

      4.2 基于BP神經網絡的Sarsa算法

      描述如下:(1)H是用于保存最近訪問的Q值,當滿的時候送至神經網絡訓練。

      如果表H已滿,則利用H中的樣本對網絡進行訓練,版本號自動增加1

      若網絡隊列q也已滿,則隊尾元素出隊,把新訓練的神經網絡入隊q;

      清空訓練集;

      該算法的主要貢獻是引入神經網絡隊列保存大量的Q值表,從來降低了保存大量Q值所要花費大量的內存空間,更重要的是解決了單個神經網絡“增量式”學習所帶來的“遺忘”問題。

      5 強化學習應用

      由于強化學習在算法和理論方面的研究越來越深入,在大空間、復雜非線性控制,機器人控制、組合優化和調度等領域呈現出良好的學習性能,使得強化學習在人工智能,控制系統,游戲以及優化調度等領域取得了若干的成功應用,而本文主要介紹基于神經網絡的強化學習算法在某些領域的應用。

      在非線性控制系統方面,張濤等人[2]將BP網絡運用于 Q-Learning算法中,成功解決了連續狀態空間的倒立擺平衡控制問題和連續狀態空間輸入、連續動作空間輸出的問題,從而提高了強化學習算法的實際應用價值;在機器人控制方面,應用更為廣泛,Nelson[13]等人考慮了基于模糊邏輯和強化學習的智能機器人導航問題,并且段勇等人[4]基于該理論,成功地將模糊神經網絡和強化學習結合起來,采用殘差算法保證函數逼近的快速性和收斂性,有效地解決了復雜環境下機器人導航的問題。在游戲方面,Tesauro采用三層BP神經網絡把棋盤上的棋子位置和棋手的獲勝概率聯系起來,通過訓練取得了40盤比賽中只輸一盤的好戰績[14]。在優化調度方面,主要包括車間作業調度,電梯調度以及網絡路由選擇等,Robert Crites等[15]將強化學習和前饋神經網絡融合利用,以最終實驗結果表明為依據,證明了該算法是目前高層建筑電梯調度算法中最優算法之一。

      6 結束語

      本文將強化學習和神經網絡相融合,介紹利用神經網絡強大的存儲能力、泛化能力及函數估計能力,可以解決強化學習領域遇到的連續狀態和動作輸入、輸出的問題,學習狀態空間過大的問題以及不確定環境處理的問題等。基于此,主要論述了三種神經網絡和強化學習的改進算法,它們都綜合了神經網絡的特性。最后,簡單介紹了目前基于神經網絡的強化學習應用的成功實例。目前,利用神經網絡進行強化學習依然是研究熱點課題之一。

      參考文獻:

      [1] 高陽,陳世福,陸鑫. 強化學習研究綜述[J].自動化學報,2004,30(1):86-100.

      [2] 張濤,吳漢生.基于神經網絡的強化學習算法實現倒立擺控制[J].計算機仿真,2006,23(4):298-300.

      [3] 林聯明,王浩,王一雄.基于神經網絡的Sarsa強化學習算法[J].計算機技術與發展,2006,16(1):30-32.

      [4] 段勇,徐心如.基于模糊神經網絡的強化學習及其在機器人導航中的應用[J].控制與決策,2007,22(5):525-529.

      [5] 劉忠,李海紅,劉全.強化學習算法研究[J].計算機工程與設計,2008,29(22):5805-5809.

      [6] Sutton R S.Learning to predict by the methods of temporal differences.Machine Learning,1988,3:9-44.

      [7] Watkins P.Dayan.Q-Learning.Machine Learning,1992,8(3):279-292.

      [8] Rummery G,Niranjan M. On-line Q-Learning using connectionist systems. Technical Report CUED/F-INFENG/TR 166,Cambridge University Engineering Department,1994.

      [9] Sutton R S,Barto A G, Williams R. Reinforcement Learning is direct adaptive optional control.IEEE Control Systems Manazine,1991,12(2):19-22.

      [10] Sutton R S, Barto A G. Reinforcement Learning: An introduction[M].Cambridge:MIT Press ,1998.

      [11] Peng J , Dayan P. Q-learning [J]. Machine Learning,1992,8(3):279-292.

      [12] Kelley H J , Cliff E M, Lutze F H. Pursuit/evasion in orbit[J]. J of the Astronautical Sciences, 1981, 29(3):277-288.

      [13] NELSON H C, YUNG. An intelligent mobile vehicle navigator based on fuzzy logic and reinforcement learning [J].IEEE Trans on Systems, Man and Cybernetics, Part B: Cybernetics,1999,29(2):314-321.

      如何學習神經網絡范文第2篇

      人工神經網絡是近年來迅猛發展的前沿課題,它對突破現有科學技術的瓶頸起到重大的作用。本文剖析了人工神經網絡的特征、模型結構以及未來的發展趨勢。

      【關鍵詞】人工神經網絡 神經元 矩陣

      1 人工神經網絡概述

      人工神經網絡(ANN)是一種用計算機網絡系統模擬生物神經網絡的智能神經系統,它是在現代神經生物學研究成果的基礎上發展起來的,模擬人腦信息處理機制的一種網絡系統,它不但具有處理數值數據的計算能力,而且還具有處理知識的學習、聯想和記憶能力。

      人工神經網絡模擬了大腦神經元的組織方式,反映了人腦的一些基本功能,為研究人工智能開辟了新的途徑。它具有以下基本特征:

      1.1 并行分布性

      因為人工神經網絡中的神經元排列并不是雜亂無章的,往往是以一種有規律的序列排列,這種結構非常適合并行計算。同時如果將每一個神經元看作是一個基本的處理單元,則整個系統可以是一個分布式處理系統,使得計算快速。

      1.2 可學習性和自適應性

      一個相對很小的人工神經網絡可存儲大量的專家知識,并能根據學習算法,或利用指導系統模擬現實環境(稱為有教師學習),或對輸入進行自適應學習(稱為無教師學習),可以處理不確定或不知道的事情,不斷主動學習,不斷完善知識的存儲。

      (3)魯棒性和容錯性

      由于采用大量的神經元及其相互連接,具有聯想映射與聯想記憶能力,容錯性保證網絡將不完整的、畸變的輸入樣本恢復成完整的原型,魯棒性使得網絡中的神經元或突觸遭到破壞時網絡仍然具有學習和記憶能力,不會對整體系統帶來嚴重的影響。

      1.3 泛化能力

      人工神經網絡是大規模的非線性系統,提供了系統協同和自組織的潛力,它能充分逼近任意復雜的非線性關系。如果輸入發生較小變化,則輸出能夠保持相當小的差距。

      1.4 信息綜合能力

      任何知識規則都可以通過對范例的學習存儲于同一個神經網絡的各連接權值中,能同時處理定量和定性的信息,適用于處理復雜非線性和不確定對象。

      2 人工神經網絡模型

      神經網絡是在對人腦思維方式研究的基礎上,將其抽象模擬反映人腦基本功能的一種并行處理連接網絡。神經元是神經網絡的基本處理單元。

      在神經網絡的發展過程中,從不同角度對神經網絡進行了不同層次的描述和模擬,提出了各種各樣的神經網絡模型,其中最具有代表性的神經網絡模型有:感知器、線性神經網絡、BP網絡、自組織網絡、徑向基函數網絡、反饋神經網絡等等。

      3 神經元矩陣

      神經元矩陣是神經網絡模型的一種新構想,是專門為神經網絡打造的一個矩陣,它符合神經元的一切特征。

      神經元矩陣采用矩陣形式,它可為n維向量組成。引入向量觸頭和信使粒的概念,向量觸頭可生長,即長度可變,方向可變,信使粒可“游蕩”在矩陣中,建立各種聯系。如圖1即是神經元矩陣模型

      (1)容器可產生一種無形的約束力,使系統得以形成,容器不是全封閉的,從而保證系統與外界的溝通和交互;各向量間可用相互作用的力來聯系,而各個信使粒則受控于容器、中空向量以及其它的信使粒。各神經元之間自主交互,神經元矩陣是一種多層次的管理,即一層管理一層。系統具有明顯的層級制和分塊制,每層每塊均獨立且協同工作,即每層每塊均含組織和自組織因素。

      (2)向量觸頭是中空的,信使粒可以通過向量或存儲于向量中,所以又稱為中空向量。向量存儲了信使粒后,可以吸引更多的信使粒在附近,或使鄰近向量轉向、伸長,進而形成相對穩定的信息通路。

      (3)當兩條或更多的信息通路匯集時,可能伴隨著通路的增強、合并,以及信使粒的聚集、交換,這是神經元矩陣運算的一種主要形式。通路的形成過程,也就是是神經元矩陣分塊、分層、形成聯接的過程,也為矩陣系統宏觀管理、層級控制的實現奠定了基礎。

      神經元矩陣亦是一種具有生物網絡特征的數學模型,綜合了數學上矩陣和向量等重要概念,是一種立體的矩陣結構。尤其是將矩陣的分塊特性和向量的指向特征結合起來,更好的體現了神經網絡的整體性和單元獨立性,系統的組織和自組織特征也更為凸顯。信使粒以“點”的數學概念,增強了系統的信息特征,尤其是增強了矩陣的存儲和運算功能。

      4 人工神經網絡的發展趨勢

      人工神經網絡是邊緣叉科學,它涉及計算機、人工智能、自動化、生理學等多個學科領域,研究它的發展具有非常重要意義。針對神經網絡的社會需求以及存在的問題,今后神經網絡的研究趨勢主要側重以下幾個方面。

      4.1 增強對智能和機器關系問題的認識

      人腦是一個結構異常復雜的信息系統,我們所知道的唯一智能系統,隨著信息論、控制論、計算機科學、生命科學的發展,人們越來越驚異于大腦的奇妙。對人腦智能化實現的研究,是神經網絡研究今后的需要增強的地發展方向。

      4.2 發展神經計算和進化計算的理論及應用

      利用神經科學理論的研究成果,用數理方法探索智能水平更高的人工神經網絡模型,深入研究網絡的算法和性能,使離散符號計算、神經計算和進化計算相互促進,開發新的網絡數理理論。

      4.3 擴大神經元芯片和神經網絡結構的作用

      神經網絡結構體現了結構和算法的統一,是硬件和軟件的混合體,神經元矩陣即是如此。人工神經網絡既可以用傳統計算機來模擬,也可以用集成電路芯片組成神經計算機,甚至還可以生物芯片方式實現,因此研制電子神經網絡計算機潛力巨大。如何讓傳統的計算機、人工智能技術和神經網絡計算機相融合也是前沿課題,具有十分誘人的前景。

      4.4 促進信息科學和生命科學的相互融合

      信息科學與生命科學的相互交叉、相互促進、相互滲透是現代科學的一個顯著特點。神經網絡與各種智能處理方法有機結合具有很大的發展前景,如與專家系統、模糊邏輯、遺傳算法、小波分析等相結合,取長補短,可以獲得更好的應用效果。

      參考文獻

      [1]鐘珞.饒文碧.鄒承明著.人工神經網絡及其融合應用技術.科學出版社.

      如何學習神經網絡范文第3篇

      傳統軋制力模型研究

      影響軋制力的因素數量多且關系復雜,如:軋件的化學成分、軋制溫度、速度、軋輥直徑等。這些因素與軋制力之間多數為復雜的非線性關系;其中主要由是變形區長度與軋件厚度的比值決定的。

      國內某廠熱軋機組采用的是經典的軋制力數學模型,其基本形式為[3]

      RBF(Radial Basis Function)網絡,即徑向基函數神經網絡,是由J.Moody和C.Darken于20世紀80年代提出的一種神經網絡,它是具有單隱層的三層前饋網絡,其結構如圖4所示。

      在MATLAB中,徑向基函數(RBF)網絡的設計采用的是神經網絡工具箱中的newrb()函數。仿真是同BP網絡仿真所用的函數一樣,用函數sim()實現的。

      在MATLAB仿真過程中,采用與BP網絡模型同樣的輸入項、輸出項,最小誤差為0.005,擴散速度為0.8,最大神經元數為12。

      本文依據傳統軋制力公式對國內某連軋廠的熱連軋機組軋制力進行了理論計算,并且通過數據的采集、處理確立了輸入樣本。接著相繼建立了基于BP神經網絡的軋制力模型和基于RBF神經網絡軋制力模型,并在此基礎上利用MATLAB軟件進行了仿真。通過對仿真結果進行比較分析,可以得出以下結論:

      由圖3.4、圖3.2和圖2.1的對比,可以看出基于神經網絡(BP網絡和RBF網絡)的軋制力模型的預報精度大大高于傳統理論模型的預報精度,可以較好地滿足軋制力預報要求。但是,建立神經網絡軋制力模型需要解決如何合理選擇各參數和如何提高預報精度的問題,并存在如何選擇軋制力影響因素作為輸入量以提高模型精度的問題。

      由圖3.4和圖3.2對比,可以看出RBF神經網絡預報模型的預報精度總體來說高于BP神經網絡預報模型的預報精度。

      由仿真結果對比可知,RBF神經網絡預報模型偏差的平均值要比BP網絡模型小20%,而BP神經網絡預報模型的均方差比RBF網絡模型小2%,絕對最大偏差小12%;換句話說,RBF網絡預報模型的預報精度要高些,而BP網絡預報模型的“平滑度”要比RBF好些。

      由于BP網絡在訓練過程中極易陷入局部極小,所以在達到最大訓練次數時,7個機架BP網絡預報模型的訓練時間為107.86秒,而同樣情況下,RBF網絡預報模型的訓練時間僅為4.016秒。所以使用RBF神經網絡可以大大縮短模型的訓練時間。

      [1]P.G.J.1isboa編著,邢春潁等澤.現代神經網絡應用,北京:電子工業出版社,1996 Siemens AG.Intelligent answer to HSM control problems.Steel Times International.1996

      [2]Kumpati S Narendra,Kannan Parthasarathy,Identification and Control of Dynamical Systems Using Neural Networks,IEEE Trans.on Neural Networks.1990

      如何學習神經網絡范文第4篇

      80年代初,在美國、日本、接著在我國國內都掀起了一股研究神經網絡理論和神經計算機的熱潮,并將神經網絡原理應用于圖象處理、模式識別、語音綜合及機器人控制等領域。近年來,美國等先進國家又相繼投入巨額資金,制定出強化研究計劃,開展對腦功能和新型智能計算機的研究。

      人腦是自生命誕生以來,生物經過數十億年漫長歲月進化的結果,是具有高度智能的復雜系統,它不必采用繁復的數字計算和邏輯運算,卻能靈活處理各種復雜的,不精確的和模糊的信息,善于理解語言、圖象并具有直覺感知等功能。

      人腦的信息處理機制極其復雜,從結構上看它是包含有140億神經細胞的大規模網絡。單個神經細胞的工作速度并不高(毫秒級),但它通過超并行處理使得整個系統實現處理的高速性和信息表現的多樣性。

      因此,從信息處理的角度對人腦進行研究,并由此研制出一種象人腦一樣能夠“思維”的智能計算機和智能信息處理方法,一直是人工智能追求的目標。

      神經網絡就是通過對人腦的基本單元---神經元的建模和聯結,來探索模擬人腦神經系統功能的模型,并研制一種具有學習、聯想、記憶和模式識別等智能信息處理功能的人工系統。本文介紹神經網絡的特點以及近年來有關神經網絡與混沌理論、模糊計算和遺傳算法等相結合的混合神經網絡研究的動態。

      一.神經網絡和聯結主義

      回顧認知科學的發展,有所謂符號主義和聯結主義兩大流派。符號主義從宏觀層次上,撇開人腦的內部結構和機制,僅從人腦外在表現出來的智能現象出發進行研究。例如,將記憶、判斷、推理、學習等心理活動總結成規律、甚至編制成規則,然后用計算機進行模擬,使計算機表現出各種智能。

      符號主義認為,認識的基本元素是符號,認知過程是對符號表示的運算。人類的語言,文字的思維均可用符號來描述,而且思維過程只不過是這些符號的存儲、變換和輸入、輸出而已。以這種方法實現的系統具有串行、線性、準確、簡潔、易于表達的特點,體現了邏輯思維的基本特性。七十年代的專家系統和八十年代日本的第五代計算機研究計劃就是其主要代表。

      聯接主義則與其不同,其特點是從微觀出發。聯接主義認為符號是不存在的,認知的基本元素就是神經細胞(神經元),認知過程是大量神經元的聯接,以及這種聯接所引起的神經元的不同興奮狀態和系統所表現出的總體行為。八十年代再度興起的神經網絡和神經計算機就是這種聯接主義的代表。

      神經網絡的主要特征是:大規模的并行處理和分布式的信息存儲,良好的自適應、自組織性,以及很強的學習功能、聯想功能和容錯功能。與當今的馮.諾依曼式計算機相比,更加接近人腦的信息處理模式。主要表現如下:

      神經網絡能夠處理連續的模擬信號。例如連續灰度變化的圖象信號。

      能夠處理混沌的、不完全的、模糊的信息。

      傳統的計算機能給出精確的解答,神經網絡給出的是次最優的逼近解答。

      神經網絡并行分布工作,各組成部分同時參與運算,單個神經元的動作速度不高,但總體的處理速度極快。

      神經網絡信息存儲分布于全網絡各個權重變換之中,某些單元障礙并不影響信息的完整,具有魯棒性。

      傳統計算機要求有準確的輸入條件,才能給出精確解。神經網絡只要求部分條件,甚至對于包含有部分錯誤的輸入,也能得出較好的解答,具有容錯性。

      神經網絡在處理自然語言理解、圖象模式識別、景物理解、不完整信息的處理、智能機器人控制等方面有優勢。

      符號主義和聯接主義兩者各有特色,學術界目前有一種看法:認為基于符號主義得傳統人工智能和基于聯接主義得神經網絡是分別描述人腦左、右半腦的功能,反映了人類智能的兩重性:精確處理和非精確處理,分別面向認識的理性和感性兩個方面,兩者的關系應該是互補而非互相代替。理想的智能系統及其表現的智能行為應是兩者相互結合的結果。

      接下去的問題是,符號AI和聯接AI具體如何結合,兩者在智能系統中相互關系如何?分別扮演什么角色?目前這方面發表的文獻很多,大致有如下幾種類型:

      1.松耦合模型:符號機制的專家系統與聯接機制的神經網絡通過一個中間媒介(例如數據文件)進行通訊。

      2.緊耦合模型:與松耦合模型相比較,其通訊不是通過外部數據進行,而是直接通過內部數據完成,具有較高的效率。其主要類型有嵌入式系統和黑板結構等。

      3.轉換模型:將專家系統的知識轉換成神經網絡,或把神經網絡轉換成專家系統的知識,轉換前的系統稱為源系統,轉換后的系統稱為目標系統,由一種機制轉成另一種機制。如果源系統是專家系統,目標系統是神經網絡,則可獲得學習能力及自適應性;反之,可獲得單步推理能力、解釋能力及知識的顯式表示。當然,轉換需要在兩種的機制之間,確定結構上的一致性,目前主要問題是還沒有一種完備而精確的轉換方法實現兩者的轉換。有待進一步研究。

      4.綜合模型:綜合模型共享數據結構和知識表示,這時聯接機制和符號機制不再分開,兩者相互結合成為一個整體,既具有符號機制的邏輯功能,又有聯接機制的自適應和容錯性的優點和特點。例如聯接主義的專家系統等。

      近年來神經網絡研究的另一個趨勢,是將它與模糊邏輯、混沌理論、遺傳進化算法等相結合,即所謂“混合神經網絡”方法。由于這些理論和算法都是屬于仿效生物體信息處理的方法,人們希望通過她們之間的相互結合,能夠獲得具有有柔性信息處理功能的系統。下面分別介紹。

      二.混沌理論與智能信息處理

      混沌理論是對貌似無序而實際有序,表面上看來是雜亂無章的現象中,找出其規律,并予以處理的一門學科。早在七十年代,美國和歐洲的一些物理學家、生物學家、數學家就致力于尋求在許許多多不同種類的不規則性之間的聯系。生物學家發現在人類的心臟中有混沌現象存在,血管在顯微鏡下交叉纏繞,其中也有驚人的有序性。在生物腦神經系統中從微觀的神經膜電位到宏觀的腦電波,都可以觀察到混沌的性態,證明混沌也是神經系統的正常特性。

      九十年代開始,則更進一步將混沌和神經網絡結合起來,提出多種混沌神經網絡模型,并探索應用混沌理論的各種信息處理方法。例如,在神經元模型中,引入神經膜的不應性,研究神經元模型的混沌響應,研究在神經網絡的方程中,不應性項的定標參數,不定性時間衰減常數等參數的性質,以及這些參數于神經網絡混沌響應的關系,并確定混沌---神經網絡模型具有混沌解的參數空間。經過試驗,由這種混沌神經網絡模型所繪出的輸出圖形和腦電圖極為相似。

      現代腦科學把人腦的工作過程看成為復雜的多層次的混沌動力學系統。腦功能的物理基礎是混沌性質的過程,腦的工作包含有混沌的性質。通過混沌動力學,研究、分析腦模型的信息處理能力,可進一步探索動態聯想記憶、動態學習并應用到模式識別等工程領域。例如:

      對混沌的隨機不規則現象,可利用混沌理論進行非線性預測和決策。

      對被噪聲所掩蓋的微弱信號,如果噪聲是一種混沌現象,則可通過非線性辨識,有效進行濾波。

      利用混沌現象對初始值的敏銳依賴性,構成模式識別系統。

      研究基于混沌---神經網絡自適應存儲檢索算法。該算法主要包括三個步驟,即:特征提取、自適應學習和檢索。

      模式特征提取采用從簡單的吸引子到混沌的層次分支結構來描述,這種分支結構有可能通過少數幾個系統參數的變化來加以控制,使復雜問題簡單化。自適應學習采用神經網絡的誤差反傳學習法。檢索過程是通過一個具有穩定吸引子的動力學系統來完成,即利用輸入的初始條件與某個吸引子(輸出)之間的存在直接對應關系的方法進行檢索。利用這種方法可應用于模式識別。例如黑白圖象的人臉識別。

      三.模糊集理論與模糊工程

      八十年代以來在模糊集理論和應用方面,也有很大進展。1983年美國西海岸AI研究所發表了稱為REVEAL的模糊輔助決策系統并投入市場,1986年美國將模糊邏輯導入OPS---5,并研究成功模糊專家系統外殼FLOPS,1987年英國發表采用模糊PROLOG的智能系統FRIL等。除此通用工具的研制以外,各國還開發一系列用于專用目的的智能信息處理系統并實際應用于智能控制、模式識別、醫療診斷、故障檢測等方面。

      模糊集理論和神經網絡雖然都屬于仿效生物體信息處理機制以獲得柔性信息處理功能的理論,但兩者所用的研究方法卻大不相同,神經網絡著眼于腦的微觀網絡結構,通過學習、自組織化和非線性動力學理論形成的并行分析方法,可處理無法語言化的模式信息。而模糊集理論則著眼于可用語言和概念作為代表的腦的宏觀功能,按照人為引入的隸屬度函數,邏輯的處理包含有模糊性的語言信息。

      神經網絡和模糊集理論目標相近而方法各異。因此如果兩者相互結合,必能達到取長補短的作用。將模糊和神經網絡相結合的研究,約在15年前便已在神經網絡領域開始,為了描述神經細胞模型,開始采用模糊語言,把模糊集合及其運算用于神經元模型和描述神經網絡系統。目前,有關模糊---神經網絡模型的研究大體上可分為兩類:一類是以神經網絡為主,結合模糊集理論。例如,將神經網絡參數模糊化,采用模糊集合進行模糊運算。另一類以模糊集、模糊邏輯為主,結合神經網絡方法,利用神經網絡的自組織特性,達到柔性信息處理的目的。

      與神經網絡相比,模糊集理論和模糊計算是更接近實用化的理論,特別近年來美國和日本的各大公司都紛紛推出各種模糊芯片,研制了型號繁多的模糊推理板,并實際應用于智能控制等各個應用領域,建立“模糊工程”這樣一個新領域。日本更首先在模糊家電方面打開市場,帶有模糊控制,甚至標以神經---模糊智能控制的洗衣機、電冰箱、空調器、攝象機等已成為新一代家電的時髦產品。我國目前市場上也有許多洗衣機,例如榮事達洗衣機就是采用模糊神經網絡智能控制方式的洗衣機。

      四.遺傳算法

      遺傳算法(GeneticAlgorithm:GA)是模擬生物的進化現象(自然、淘汰、交叉、突然變異)的一種概率搜索和最優化方法。是模擬自然淘汰和遺傳現象的工程模型。

      GA的歷史可追溯到1960年,明確提出遺傳算法的是1975年美國Michigan大學的Holland博士,他根據生物進化過程的適應現象,提出如下的GA模型方案:

      1.將多個生物的染色體(Chromosmoe)組成的符號集合,按文字進行編碼,稱為個體。

      2.定義評價函數,表示個體對外部環境的適應性。其數值大的個體表示對外部環境的適應性高,它的生存(子孫的延續)的概率也高。

      3.每個個體由多個“部分”組合而成,每個部分隨機進行交叉及突然變異等變化,并由此產生子孫(遺傳現象)。

      4.個體的集合通過遺傳,由選擇淘汰產生下一代。

      遺傳算法提出之后,很快得到人工智能、計算機、生物學等領域科學家的高度重視,并在各方面廣泛應用。1989年美國Goldberg博士發表一本專著:“GeneticAlgorithmsinSearch,OptimizationandMachineLearning”。出版后產生較大影響,該書對GA的數學基礎理論,GA的基本定理、數理分析以及在搜索法、最優化、機器學習等GA應用方面進行了深入淺出的介紹,并附有Pascal模擬程序。

      1985年7月在美國召開第一屆“遺傳算法國際會議”(ICGA)。以后每隔兩年召開一次。近年來,遺傳算法發展很快,并廣泛應用于信息技術的各個領域,例如:

      智能控制:機器人控制。機器人路徑規劃。

      工程設計:微電子芯片的布局、布線;通信網絡設計、濾波器設計、噴氣發動機設計。

      圖象處理:圖象恢復、圖象識別、特征抽取。

      調度規劃:生產規劃、調度問題、并行機任務分配。

      優化理論:TSP問題、背包問題、圖劃分問題。

      人工生命:生命的遺傳進化以及自增殖、自適應;免疫系統、生態系統等方面的研究。

      神經網絡、模糊集理論和以遺傳算法為代表的進化算法都是仿效生物信息處理模式以獲得智能信息處理功能的理論。三者目標相近而方法各異;將它們相互結合,必能達到取長補短、各顯優勢的效果。例如,遺傳算法與神經網絡和模糊計算相結合方面就有:

      神經網絡連續權的進化。

      傳統神經網絡如BP網絡是通過學習,并按一定規則來改變數值分布。這種方法有訓練時間過長和容易陷入局部優化的問題。采用遺傳算法優化神經網絡可以克服這個缺點。

      神經網絡結構的進化。

      目前神經網絡結構的設計全靠設計者的經驗,由人事先確定,還沒有一種系統的方法來確定網絡結構,采用遺傳算法可用來優化神經網絡結構。

      神經網絡學習規則的進化。

      如何學習神經網絡范文第5篇

      關鍵詞:矢量量化;自組織特征映射神經網絡;圖像壓縮;主元分析

      中圖分類號:TP183文獻標識碼:A文章編號:1009-3044(2008)36-2731-02

      The Vector Quantization Based on PCA/SOFM Hybrid Neural Network

      HUNG Cui-cui, ZHANG Jian

      (Liaoning University of Technology Electronic and Information Engineering College, Jinzhou 121001, China)

      Abstract: In order to improve the two main shortcomings of the Kohonen's self-organizing feature map(SOFM) that are high computation complexity and poor codebook quality, the author proposes a vector quantization algorithm based on PCA/SOFM hybrid neural network in this paper. Descend the dimension of imported vectors by using the principal component analysis (PCA) linear neural network. And then, use SOFM neural network to vector quantization. By modifying the learning-rate parameter, topology field weight and initial codebook of the SOFM neural network to optimize network. Simulation results demonstrate that the image compression algorithm can shorten the time and improve the performance of codebook.

      Key words: Vector quantization(VQ); Self-organizing feature map neural network (SOFM); image compression; Principle component analysis(PCA)

      1 引言

      矢量量化[1,2]技術是一種利用圖像數據空間相關性的高效有損壓縮方法,它具有壓縮比大,編碼速度快等優點,目前己廣泛用于信號識別、語音編碼、圖像壓縮等領域中。矢量量化優越性的體現離不開性能良好的碼書,因而,矢量量化的關鍵是如何設計一個最佳碼書,使得用該碼書中的碼字表征輸入矢量空間分布時所引起的量化平均失真最小。近年幾來,許多學者將SOFM神經網絡應用于碼書的設計[3]。但SOFM算法存在收斂速度慢、計算量大等缺點。陸哲明和孫圣和針對SOFM基本算法的計算量大采用了快速搜索算法,為了提高碼書性能對SOFM基本算法的權值調整方法作了一些改進[4]。目前越來越多的研究人員把目光投向將矢量量化與其他的編碼方法相結合[5]。例如,矢量量化與小波變換結合的算法[6],分形變換與矢量量化相結合的算法[7]。PCA是一種有效的圖像變換編碼算法,它能夠提取圖像數據的主特征分量,因此能夠降低圖像輸入數據維數。SOFM算法用于圖像矢量量化則具有不易受初始碼書的影響,同時能夠保持圖像數據的拓撲結構等優點。為此本文將兩者結合,提出了PCA/SOFM混合神經網絡圖像混合編碼算法。先用PCA對圖像進行降維處理,再用SOFM神經網絡進行碼書設計。本文還對碼書的初始化的選擇問題和神經網絡的學習參數進行研究。實驗表明,該算法不但大大降低了計算量,而且提高了碼書的性能。

      2 PCA/SOFM混合神經網絡的算法

      盡管SOFM神經網絡比起LBG算法有很大優勢,但SOFM算法仍然存在收斂速度慢。計算量大等缺點。因此本文將PCA與SOFM神經網絡相結合,提出了PCA/SOFM混合神經網絡。PCA/SOFM混合神經網絡結構如圖1所示,先用PCA線性神經網絡對輸入矢量降維處理,從而使得壓縮圖像達到最小失真。然后用SOFM神經網絡進行碼書設計, PCA線性神經網絡采用Sanger提出的廣義Hebb算法[8]。

      2.1 基本PCA/SOFM混合神經網絡算法

      1) PCA網絡權值Wpi,j和SOFM網絡權值初始化;

      2) PCA網絡輸出矢量Yp(t):

      (1)

      N為PCA神經網絡輸入矢量Xp的維數。

      3) Wpi,j網絡權值調整:

      (2)

      4) 重復步驟(2)至(3),直至算法收斂。輸出矢量Ypi(t),并將此作為SOFM的輸入Xi(t);

      5) 計算矢量Xi(t)與權值矢量Wi,j(t)的距離:

      (3)

      6) 選擇具有最小距離的輸出節點,j*作為獲勝節點,即:

      (4)

      7) Wij(t) 網絡權值調整:

      (5)

      8) 重復步驟(5)至(7),直至算法收斂。

      9) 取輸入訓練矢量集的下一個輸入矢量,回到步驟(2)反復進行,直到足夠的學習次數或滿足規定的終止條件為止。

      10) 保存所有權值Wij的值,即設計碼書。

      2.2 PCA/SOFM混合神經網絡的初始化和改進

      在PCA/SOFM混合神經網絡算法中網絡的初始化、鄰域函數和學習率函數非常重要,它直接影響到網絡的收斂速度和碼書的性能。本文要對這幾個參數進行優化以提高壓縮速度和壓縮性能。本文采用一種改進的隨機選取法,使空間分配均勻,不會出現碼字空間分的過細或過粗的現象。首先,按k維矢量所有元素中最重要的單個元素(即k維歐氏空間中最敏感的方向)大小排序;然后按順序每隔n個矢量取一個矢量作為初始碼書的一個碼字,完成碼書的初始化(n=訓練序列中矢量的總數/碼書的大小)。

      由SOFM基本算法可知,權矢量Wi(t+1)的更新實質上是權矢量Wit和訓練矢量Xi(t)的加權和。其中學習率因子和鄰域函數非常重要,它們決定算法的收斂速度。下面推導最優的學習率因子α(t)。由式(5)得:

      (6)

      可以總結得:

      (7)

      令多項式的各項相等可得到最優學習率因子:

      (8)

      其鄰域函數取為:

      (9)

      式中,hcc典型地取為0.8。T為最大迭代次數,初始值σ0和最終值σT典型地取為0.8和0.1。

      3 實驗結果

      為了驗證算法的有效性,本文把基本SOFM編碼算法、基本PCA/SOFM混合神經網絡編碼算法和改進PCA/SOFM算法分別用于圖像的壓縮編碼。本文采用的是512×512像素,256級灰度的Lena圖像用于訓練圖像進行碼書設計。首先將圖像分為4×4子塊,然后將每一小塊的16個像素灰度值作一個訓練矢量,送入PCA線性神經網絡。PCA線性神經網絡輸出節點為8維PCA變換系數矢量,同時將它作為SOFM神經網絡的輸入矢量,用于進行碼本設計。進過多次實驗,取其平均值作為實驗結果,圖3給出了各種算法在相同壓縮比的情況下恢復圖像的對比。表1給出了各算法編碼后的尖峰信噪比PSNR和碼書設計時間的比較。

      從測試的結果可以看出改進PCA/SOFM算法優于基本SOFM算法和基本PCA/SOFM算法,該算法縮短了碼書設計的時間,圖像的恢復質量有所提高,取得了令人滿意的結果。從而證明本文提出的算法是一種行之有效的方法。

      4 結束語

      主站蜘蛛池模板: 2021亚洲国产精品无码| 亚洲欧美国产日韩天堂区| 激,情四虎欧美视频图片| 欧美丝袜高跟鞋一区二区| 日韩少妇内射免费播放| 丰满少妇被猛烈进出69影院| 欧洲精品一区二区三区久久| 99精品久久毛片a片| 亚洲av产在线精品亚洲第一站 | 肉大捧一进一出免费视频| 国产初高中生在线视频| 国产精品毛片一区视频播| 国产亚洲色视频在线| 永久免费在线观看蜜桃视频| 国产精品久久久天天影视香蕉| 麻豆文化传媒精品一区观看| 国产迷姦播放在线观看| 综合在线 亚洲 成人 欧美| 国产av不卡一区二区| 无码伊人66久久大杳蕉网站谷歌 | 92国产精品午夜福利免费| 国产精品中文一区二区| 久久夜色精品国产亚洲av| 国产精品福利一区二区久久| 中文字幕精品久久久久人妻红杏1| 人妻内射视频麻豆| 国产超碰人人做人人爰| 亚洲成人av综合一区| 久久国产成人精品av| 无码专区 人妻系列 在线| 日韩亚洲国产激情一区二区| 综合激情亚洲丁香社区| 三门峡市| 爱色精品视频一区二区| 无码专区 人妻系列 在线| 99精品久久久中文字幕| 午夜射精日本三级| 亚洲乱码一二三四区| 无码一级视频在线| 天天躁久久躁日日躁| 色哟哟www网站入口成人学校|