版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

[科普中國(guó)]-策略空間

科學(xué)百科
原創(chuàng)
科學(xué)百科為用戶提供權(quán)威科普內(nèi)容,打造知識(shí)科普陣地
收藏

定義定義一

在某一問(wèn)題中,可以采取的策略的總體稱為策略空間,每一個(gè)策略都是策略空間的一個(gè)點(diǎn)。

策略空間是決策理論中的一個(gè)概念。舉例來(lái)說(shuō),一個(gè)工廠生產(chǎn)一批數(shù)目很大的產(chǎn)品,我們采取抽樣的辦法從其中抽取n樣,以此來(lái)做出接收或拒絕這批產(chǎn)品的決策。針對(duì)這一問(wèn)題,可以采取多種決策方案。每一個(gè)決策方案就稱為一個(gè)策略。符號(hào)r為抽取的n樣產(chǎn)品中次品的件數(shù),并且把接收記作“1”,把拒絕記作“0”,可以把策略規(guī)定為:次品件數(shù)過(guò)半就拒絕,否則就接收。還可規(guī)定為:次品件數(shù)大于2就拒絕,否則就接收。在數(shù)學(xué)上,這兩個(gè)策略是兩個(gè)函數(shù),記作。于是

當(dāng)然,還可以制定出更多的策略。這些可以采取的策略的總體就是一個(gè)策略的空間。

系統(tǒng)最優(yōu)化工程的研究目的,就是要考察如何從策略空間中選取一個(gè)最優(yōu)策略,使該系統(tǒng)達(dá)到某種意義上的最優(yōu)化。3

定義二策略空間(Strategy Space)是指博弈各方可供選擇的策略或行為的集合。比如,一個(gè)參與人的所有可選擇的策略集合就是這個(gè)參與人的策略空間。

策略集合指參與者可能采取的所有行動(dòng)方案的集合。策略集合必須有兩個(gè)以上元素,否則,無(wú)所謂對(duì)策,只是獨(dú)自決策。

若參與者有有限個(gè)具體的策略可供選擇,則稱其有一個(gè)有限策略集合。例如,在單一次“剪刀、石頭、布”里,每一個(gè)玩家都有一個(gè)有限策略集合{剪刀,石頭,布}。若有無(wú)限個(gè)具體的策略可供選擇,則稱其有一個(gè)無(wú)限策略集合。例如,有規(guī)范出價(jià)增額的拍賣會(huì)有一個(gè)無(wú)限策略集合{$10,$20,$30,……}。另外,在分蛋糕問(wèn)題里則有一個(gè)連續(xù)的策略集合{在蛋糕的百分之零至百分之百間的任一處切分}。

Strategy直譯應(yīng)為戰(zhàn)略。不過(guò)戰(zhàn)略一詞對(duì)大多數(shù)博弈來(lái)講顯然過(guò)于抽象和寬泛了。每一個(gè)策略都對(duì)應(yīng)一個(gè)相應(yīng)的結(jié)果。因此每個(gè)博弈方可選的策略數(shù)量越多,博弈就越復(fù)雜。4

案例分析案例1 在水產(chǎn)養(yǎng)殖質(zhì)量安全政府規(guī)制與養(yǎng)殖戶的博弈模型中,參與人有政府和養(yǎng)殖戶。借鑒公共選擇理論,假設(shè)政府是追逐自身利益的經(jīng)濟(jì)人,其目標(biāo)是政治收益最大化,而政治收益由聲譽(yù)和經(jīng)濟(jì)績(jī)效組成,政府規(guī)制會(huì)獲得政治聲譽(yù)但是同時(shí)要支付規(guī)制成本,這種成本反過(guò)來(lái)會(huì)影響政府其他方面的經(jīng)濟(jì)績(jī)效。這樣,水產(chǎn)養(yǎng)殖產(chǎn)品市場(chǎng)中政府規(guī)制取決于其成本和收益的比較。如果規(guī)制收益大于規(guī)制成本,那么政府將進(jìn)行規(guī)制;規(guī)制成本大于規(guī)制收益時(shí),政府就有不進(jìn)行規(guī)制的動(dòng)機(jī)。同時(shí),假設(shè)養(yǎng)殖戶的目標(biāo)為收益最大化或成本最小化,養(yǎng)殖戶生產(chǎn)高質(zhì)量還是低質(zhì)量的水產(chǎn)養(yǎng)殖產(chǎn)品,取決于其從事水產(chǎn)養(yǎng)殖的經(jīng)濟(jì)收益情況。

政府在水產(chǎn)養(yǎng)殖產(chǎn)品市場(chǎng)的策略空間為“規(guī)制、不規(guī)制”。養(yǎng)殖戶控制水產(chǎn)養(yǎng)殖生產(chǎn)過(guò)程的策略空間為“高質(zhì)量、低質(zhì)量”生產(chǎn)方式,不論選擇何種策略,其目的都是自己收益的最大化.由于消費(fèi)者沒(méi)有辦法識(shí)別水產(chǎn)養(yǎng)殖產(chǎn)品的高、低質(zhì)量,那么高、低質(zhì)量的水產(chǎn)養(yǎng)殖產(chǎn)品價(jià)格都為P,即表明低質(zhì)量產(chǎn)品能以次充好混同于高質(zhì)量產(chǎn)品,水產(chǎn)養(yǎng)殖產(chǎn)品的產(chǎn)量為Q,而高質(zhì)量的水產(chǎn)養(yǎng)殖產(chǎn)品的生產(chǎn)成本為Ch,低質(zhì)量水產(chǎn)養(yǎng)殖產(chǎn)品的生產(chǎn)成本為Cl;政府保證了水產(chǎn)養(yǎng)殖產(chǎn)品市場(chǎng)的安全就獲得的聲譽(yù)收益為R,政府對(duì)養(yǎng)殖戶的規(guī)制成本為Ca;處罰為F;另,這保證了養(yǎng)殖戶生產(chǎn)低質(zhì)量水產(chǎn)養(yǎng)殖產(chǎn)品可以比生產(chǎn)高質(zhì)量水產(chǎn)養(yǎng)殖產(chǎn)品獲得超額利潤(rùn),也就是說(shuō)如果政府不進(jìn)行規(guī)制,養(yǎng)殖戶有生產(chǎn)低質(zhì)量水產(chǎn)養(yǎng)殖產(chǎn)品的激勵(lì)。這些信息為政府和養(yǎng)殖戶的共同知識(shí),因此,政府和養(yǎng)殖戶之間的博弈是完全信息靜態(tài)博弈。(更多分析請(qǐng)參考相應(yīng)參考書籍)。5