納什均衡是壹種策略組合,使得每個參與人的策略是對其他參與人策略的最優反應。
假設有n個局中人參與博弈,如果某情況下無壹參與者可以獨自行動而增加收益(即為了自身利益的最大化,沒有任何單獨的壹方願意改變其策略的[1] ),則此策略組合被稱為納什均衡。所有局中人策略構成壹個策略組合(Strategy Profile)。納什均衡,從實質上說,是壹種非合作博弈狀態。
納什均衡達成時,並不意味著博弈雙方都處於不動的狀態,在順序博弈中這個均衡是在博弈者連續的動作與反應中達成的。納什均衡也不意味著博弈雙方達到了壹個整體的最優狀態,需要註意的是,只有最優策略才可以達成納什均衡,嚴格劣勢策略不可能成為最佳對策,而弱優勢和弱劣勢策略是有可能達成納什均衡的。在壹個博弈中可能有壹個以上的納什均衡,而囚徒困境中有且只有壹個納什均衡。