演化博弈論和區塊鏈技術

博弈論作爲一種經典研究範式和研究方法,其中重要性已經得到了充分地認可,並被廣泛地應用於政治學、社會學、經濟學、信息安全等多個學科領域。但傳統博弈理論以行爲主體的“完全理性”爲出發點,使得其對於經濟和社會現象的解釋不強,其研究成果的現實意義受到限制。演化博弈基於有限理性的假設,在研究過程中更加註重羣體的動態調整,並通過尋求演化穩定均衡策略以替代傳統的納什均衡策略,其研究範式和研究思想彌補了傳統博弈論的諸多不足,因此也受到了學術界的高度關注。

提出較爲完整的演化博弈思想的研究成果最早可以追溯到約翰·納什,其在在闡述均衡策略存在的過程中,除採用理性主義的解釋方式之外,還採用了“大規模行動”的解釋方法,在後一種解釋方法中,納什指出均衡的實現並不一定要假設參與者對博弈結構擁有完美的信息結構和複雜的推理能力,只要假設參與者在決策時都能夠從具有相對優勢的各種策略中積累相關經驗信息,也可以實現均衡,此後在博弈論學者的推動下,演化博弈的理論體系日益完善。演化博弈論中涉及到關鍵概念主要包括:

1. 有限理性

有限理性是演化博弈論的基本假設。Schlag.H.K指出有限理性認可參與博弈的行爲主體是眼光短淺且只對初次接觸的個體的行爲策略感興趣,也沒有利用先驗概率選擇收益最大化的能力,其在行爲選擇的過程中關注於通過不斷改進行爲反覆試驗的方式獲取更多的收益。謝識予則認爲有限理性的假設意味着,參與博弈的行爲個體並沒有找到最優策略進而實現納什均衡的能力,而是通過反覆博弈中不斷學習、模仿、試錯,逐漸優化策略,因此有限理性的博弈均衡亦並非是一次性選擇的結果,而是在不斷調整和改進中達到均衡,其所實現的均衡也有可能再次偏離。

2.演化穩定策略

穩定演化策略最早由MaynardSmith和Price提出,隨後給出了嚴格的數學定義。穩定演化策略的文字化闡釋可以概括爲:假設從一個大總體中重複隨機選擇某些人來進行兩人對稱博弈,並且假設開始的時候這個博弈中所有的人都天生地或者“被規定好了”要實施某個固定的純策略或者混合策略。現在讓一部分個體也同樣被規定好了去實施另外某個固定的純策略或者混合策略。

3.複製者動態方程

一般地,演化過程是兩個基本要素的結合:一個是產生多樣性的變異機制,另一個是偏向一些種類的選擇機制。複製動態則是對羣體的選擇機制的刻畫,反映了連續時間的總體動態,在研究過程中複製者動態往往被模型化爲關於時間的常微分方程組,這些反映複製者動態的常微分方程便被稱爲複製者動態方程。複製者動態方程是尋找羣體演化穩定策略的重要路徑,在研究的基礎上,發展了出多羣體的對稱和非對稱情形下的複製者動態方程,並給出了運用雅克比矩陣判定演化穩定均衡策略的方法。

伴隨着演化博弈論的不斷髮展和完善,其應用範圍日益推廣。國內在支付以及金融領域已經出現了一些相關研究。王樂樂基於演化博弈論分析了微信運行商與銀行協同營銷的問題,研究結果表明,微信運營商與銀行營銷關係演化結果趨向於兩種模式,但只有營銷策略才能使雙方利益達到最大化。趙建雷基於演化博弈論分析了銀行與房地產企業合作共贏信貸策略,並以青島市城陽區爲例進行了闡釋。結果表明,銀企雙方均對高收益策略有模仿傾向。但房企在與銀行的長期合作中會對少數企業的違約行爲具有抵禦性;監管部門的外部力量和兩類羣體的內生力量相結合,對實現銀企信貸穩定具有重要作用。

區塊鏈技術

從信息技術視角分析,區塊鏈技術並非是一種獨立的、全新的技術,而是通過將已有的技術重新組合而建立的一種具有分佈式共識、信息公開透明、信息防篡改和時序性可追溯特性的全新的技術體系。區塊鏈技術主要涉及的信息技術包括:密碼學、共識機制、智能合約等技希函數加密、非對稱加密。

哈希函數也稱爲散列函數、HASH函數和雜湊函數等,是一種典型的單向密碼體制,只有加密過程,而不能解密。典型的哈希算法主要包括MD系列和SHA系列。MD系列主要包括MD算法、MD2算法、MD3算法、MD4算法和MD5算法,其基本特徵是通過加密計算最終都將產生一個128位的信息摘要。SHA系列算法在MD4和MD5算法上進行改進,使其具有更高的安全性性,現階段主要的SHA算法包括SHA-1、SHA-224、SHA-256、SHA-384和SHA-512。主流的區塊鏈項目所採用的哈希算法爲SHA-256和SHA-512。哈希函數在區塊鏈技術體系中主要被應用於區塊之間的聯結和數據防篡改。哈希函數可以將任何有限長度信息的轉化爲具有固定長度的信息摘要,利用該特性可以實現區塊鏈中前後區塊之間的聯結。哈希函數具有抗弱碰撞性,因此任何有限長度信息所生成的信息摘要都具有唯一性,利用該特性可以有效防止數據被篡改。

非對稱加密技術是爲解決傳統對稱加密技術在密鑰分配、密鑰管理和難以實現不可否認等方面存在的問題,而提出的一種新的加密技術。該技術的基本原理爲:首先,信息發送者在信息發送前獲取接受者發佈的加密密鑰,該密鑰爲公開密鑰;其次,信息發送者利用公鑰對信息進行加密,並將加密後的密文發送給接收方;再次,接收方利用解密密鑰對密文解密,進而獲取明文消息,其中密文解密密鑰爲接收方所有,並不公開,因此也被稱爲私鑰。非對稱加密密鑰在區塊鏈技術體系中主要被應用於信息傳輸和用戶登錄、認證。現階段主流的區塊鏈項目中,主要有RSA、Elganal、Rabin、D-H、ECC等。在區塊鏈技術體系中,非對稱加密密鑰對中的公鑰一般生成訪問接受信息方的訪問地址,私鑰用於登入和認證。

2.共識機制

由於區塊鏈中並沒有中心節點,因此如何實現各個節點之間數據一致性,成爲了區塊鏈技術體系需要解決的重要問題。現階段,主要的區塊鏈項目中採用的分佈式共識機制主要包括:工作量證明機制,權益證明機制、授權股權證明機制、實用拜占庭容錯算法。POW機制最初被用於解決垃圾郵件問題,2008年,中本聰將其引入到比特幣中,用於解決分佈式系統的共識問題。在POW共識機制中,每個節點基於自身算力競爭記賬權,最先求解得到複雜但易於驗證的SHA256計算難題的節點便獲得記賬權,並獲取相應的經濟獎勵,因此計算SHA256的解,也被稱爲“挖礦”。

POW機制將共識機制和經濟激勵相結合,激勵更多節點參與挖礦,有助於增強系統的安全性,但同時,也犧牲了系統的整體性能,因此目前基於POW共識機制的區塊鏈項目的性能都比較低,如比特幣的吐出量只有7TPS,而以太坊在前期採用POW機制時只用20-30TPS。POW機制以求解毫無意義的隨機數爲作爲標準,導致了大量的計算資源和電力資源的浪費。在POW機制下,掌握算力多的節點,在“挖礦”時具有優勢,因此也易造成區塊鏈去中心化之後的“再中心化”。

DPOS是POS機制的變種共識機制,在該機制中,每一個股東可以將其投票權授予一名代表,獲得票數最多的前100名代表按既定的時間表輪流產生區塊。區塊鏈中的PBFT算法可容忍1/3的惡意節點,當正常節點超過2/3時,就可以確保區塊鏈節點的數據一致性和安全性。其基本的流程如下:首先,全網選舉一個節點作爲主節點,主節點負責建立區塊;其次,主節點收集全網中交易信息,並進行排序,並將生成的排序列表廣播到全網;再次,每個節點收到主節點的排序列表之後對交易結果進行模擬執行交易,所有交易執行完成後,基於交易結果計算新的區塊哈希值,並將交易結果向全網廣播;第四,如果節點收到全網2/3節點的信息與自己執行結果,則向全網廣播一條確認信息,第五,主節點收集全網的確認信息,待收到的確認信息超過全網2/3之後則開始構建區塊,並向全網廣播區塊鏈的最新動態。由於PBFT需要較高的可信執行環境,因此PBFT共識算法一般應用於聯盟鏈中。