?控制論旨在通過壹些控制手段使得事物朝著目標的方向發展。控制的手段有很多,作者簡單介紹了最常見的幾種。
隨機控制
當人們對於某壹個事物的了解處於最開始的懵懂無知狀態時,隨機控制往往是最先用到的手段。壹個典型的例子就是神農嘗百草。原始人類對於各種植物的治療功效壹無所知,所以只能通過隨機嘗試的手段加以檢驗。我還想到壹個案例。電影裏經常見到的壹個場景是炸彈即將爆照,主人公還沒有找到拆除的辦法,然後就隨機地剪斷某壹個導線。隨機控制的壞處是不可控,當可能性空間非常大時,工作量就會變得非常巨大,尤其是如果需要人工執行的話。不過,現代社會隨機高速計算機的出現,隨機控制又展現出了巨大的應用價值。比如,現在非常火的機器學習算法,就是通過極大量的隨機抽樣數據,訓練機器識別目標信息。數據量越大,隨機性越高,訓練效果也隨之越好。還有20世紀末首次完成的人類全基因組測序時所使用的鳥槍法,也屬此類。
有記憶的控制
這是指當選擇壹種情況之後,就不再重復選擇相同的情況。我想到了中學數學課上做的關於排列組合的題目:從壹堆球中不放回地抽出2個黑球和2個白球的概率。人類的記憶也屬於此類。還是拿做數學題舉例,在解幾何體時,經常需要畫輔助線進行求解。當嘗試過壹種方法無效時,我們就會換壹種新的方法,而不會又繞回之前的不正確的解法。這讓我聯想到了孔子講的“不二過”,顏回能夠做到絕不重復之前犯過的錯誤,對於壹個人成長而言,只怕沒有比這更快更有效的途徑了吧?
***軛控制
作者用曹沖稱象的故事來作解釋。因為沒有辦法直接稱量大象的體重,所以曹沖想到通過將大象的體重轉換成具有相同重量的石塊,然後通過稱量石塊的重量進而推知大象的體重。在這個過程當中,首先需要將大象的重量轉換成同等重量的石塊,該過程記為L,然後稱量石塊重量,該步驟記為A,最後將石塊的重量轉換成大象的體重,該步驟極為L-1。整個步驟可以記為L-1AL。通常將L-1AL稱作與A***軛的控制方法。此法的好處是將原來不可控的對象變成可控的A過程。這讓我想到了跨人際的調控。A向讓C做某事,但A和C沒有直接關系,故而找到和C直接聯系的B,通過B實現間接控制C。公司裏跨部門的人員調用屬於此類。
負反饋控制
壹個典型的例子是空中的雄鷹追捕快速奔跑的兔子。雄鷹向下俯沖之時,眼睛緊緊地盯著兔子的跑動,隨時調整自己飛行的方向,角度,姿勢,逐步縮減和目標之間的差距,直至最終與目標重復。“目標差”的減少是負反饋控制的核心。負反饋控制包含3個基本組分:感受器,控制系統,效應器。感受器實時采集關於目標的所有信息,傳入控制系統,控制系統及時調整效應器,以實現逐步減小目標差。大腦就是壹個高效的負反饋控制系統。眼睛看著碗裏的菜,該視覺信息輸入大腦,大腦再發出指令控制手中的筷子以精準的夾住想吃的菜。許多生態系統的動態平衡也包含負反饋控制。應用於個人,應該說,壹切高效的學習過程都離不開負反饋控制(在學習的早期,從錯誤當中學習扮演著更為重要的角色,即學習的目標是減少錯誤)。反饋越及時,越準確,學習的方向越清晰,越有針對性,犯錯就會越少,進步的速度也就越快。這是學習中每壹章節練習題的價值所在,也是學習遊泳時有教練在旁邊提供實時反饋的價值所在。很多時候,學習進度停滯不前,往往都是因為缺乏及時準確的反饋信息。善於學習之人,應當在大腦中努力搜集所有有用的反饋信息,持續做出有針對性地改進。另外,數學建模中減少估計誤差的做法也屬於負反饋控制。
正反饋控制
良性競爭屬於此類。兩個朋友在學習上妳爭我趕,互相砥礪;兩個相互競爭的企業,相互較勁,有可能刺激整個行業不斷創新,不斷進步。比如可口可樂和百事可樂。機器學習中的加強學習(reinforcement learning)算法,心理學中學習理論的正向增強子(positive reinforcer)效用,日常生活中通過鼓勵來促進他人的做法,都屬於此類。在《掌控習慣》或《福格行為模型》這兩本書裏介紹的通過及時提供正反饋以養成習慣的做法也屬於正反饋控制。此法既可以用於調控自己的行為,還可以用於(在商業中)操縱他人行為。