تبليغاتX
پیرامون نظریه بازی ها ( GAME THEORY )

پیرامون نظریه بازی ها ( GAME THEORY )

بازي فعاليتي منطقي است در پاسخ به تعاملهاي رقابتي

 

استعفاء ، انصراف و حتي مرگ مي تواند پاياني براي يك بازي باشد. پاياني كه مي تواند گره هاي نا گشوده آن را بگشاید و يا بن بستی بر بیراهه هاي هزار توي بازيها باشد. مانور اين اختتام، يك استراتژي کاملا منطقي است. يك تصميم است كه نمي توان آن را ناديده گرفت و در بيشتر موقعيتهاي تصميم سازي نقطه تعادل NASH را دگرگون مي سازد. ساختار مطلوبيتها را تغيير داده و احتمالات گزينش استراتژي هاي ديگر را متحول مي نمايد. اما بايستي زمان اين مانور مصادف با مرحله استيصال در انتخاب استراتژي نباشد. در زنجيره پياپي تصميم ها ، مرحله اي فرا مي رسد كه انصراف به منزله باخت تلقي مي گردد. بنابراين براي اينكه استراتژي انصراف در يک فرآيند منطقي (CKR) شكل گرفته باشد شرايط زير الزامي است:

1-  قطعا هدف از انصراف بايستي اعلام گردد. اين هدف بايستي در چارچوب معيار هاي بازي و مطلوبيتهاي بازيكنان باشد. مثلا استعفاء از يك سمت مديريتي به بهانه خستگي يا مشكلات خانوادگي نه تنها استراتژي منطقي نبوده و هيچگاه در چارچوب عقلايي از وي انتظار نمي رود. در واقع تغيير در معيار نشان از ناتواني استراتژيست در جلب منافع و مطلوبيت وي دارد.

2-  همواره بايد استراتژي انصراف در سايه يك احتمال ظاهر شود و به عنوان گزينه اي در جدول تصميم ها يادآوري گردد. اعلام انصراف به صورت قطعي ، به عنوان يك استراتژي منطقي در مرزبنديهاي بازي قابل تحليل نيست و بهترين تقابل در برابر اين قطعيت ، اعلام شرايط براي انصراف و مصادره امتيازهاي حريف است. ( همچنان با ذهنيت استعفاء يك مدير موضوع را بررسي مي كنيم.)

3-  چشمداشت ما و حريف از انصراف بايستي مشخص و روشن باشد. اين چشمداشت مي تواند انتظار تغيير در پيامدهاي بازي به شكل تغيير در مطلوبيت هر دو طرف ، يا حذف و اضافه شدن استراتژيها باشد. تغيير در ملاك تصميم سازي ( مينيماكس به ماكسيمين و بالعكس ) و يا در بازيهاي اختلاطي ( با چند نقطه تعادل NASH ) تعيين كننده احتمال انتخابهاي حريف نيز چشمداشت ديگري از استراتژي انصراف است.

بازي زير را در نظر بگيريد ( از كتاب " تصميم گيري گروهي و نظريه بازيها " )

 

B

 

B2

B1

استراتژي

A

1+ , 5*

10+, 4

A1

0 , 3

9 , 9*

A2

(بازي بدون انصراف)

بدون استراتژي انصراف ، بازيكنان با تحليلهاي منطقي ( CKR ) به بهترين جواب كه (A1,B2) دست مي يابند، در صورتيكه براي استراتژيست A انتخاب A1 به منزله چشم پوشي از دو موقعيت بهتر (A1,B1) و (A2,B۱) محتمل است و اين در حالي است كه مطلوبيت نقطه تعادل NASH از موقعيت پست تر فقط به اندازه 1 واحد برتري دارد. اين وضعيت براي B به شكل ديگري است و تامين مطلوبيت وي به ميانگين پيامدهاي ممكن(25. 5) نزديك تر است. بنابراين بايستي براي A به هر ترتيبي شرايط تغيير كند.  . فرض كنيم A مي تواند انصراف دهد و استراتژي A3 به منزله انصراف A از بازي باشد مجددا تركيب جدول را مطابق خواسته هاي مختلفA از انصراف مرتب مي كنيم.

الف) انصراف به دليل سود بالاي B (بازي مجموع صفر نيست) :

 

B

 

B2

B1

استراتژي

A

1 , 5*

10+, 4

A1

0 , 3

9 , 9*

A2

,-3 +5

, -4 9

A3

(بهانه انصراف سود B )

مطلوبيت A درانتخاب استراتژي انصراف مبتني بر حداكثر نتيجه از دست داده B به ازاء هر انتخابش وبراي B ضرر حداقل فرصت از دست رفته خودش خواهد بود. توجه كنيد كه B به ازاء انتخاب احتمالي B1 و انصراف A ، حداقل هزينه فرصت از دست رفته اي معادل (-4) و به ازاء انتخاب B2 معادل (-3) خواهد داشت. تدارك استراتژي B3 يا تغيير در مطلوبيتهاي خويش و يا تعديل در مطلوبيتهاي A شگردهايي است كه B دنبال خواهد كرد تا از انصراف A جلوگيري كند. در اين حالت ديگر نقطه تعادلي وجود نخواهد داشت و در ازاء استراتژي B2 بهترين تصميم انصراف است.

ب) انصراف به دليل زيان بالاي A :

 

B

 

B2

B1

استراتژي

A

1 , 5*

10+, 4

A1

0 , 3

9 , 9*

A2

,-5 9+

,-9 -9

A3

(بهانه انصراف زيان A )

مطلوبيت  Aدر انتخاب استراتژي انصراف ، براي (A3,B1) مبنتي بر بيشترين سودي است كه A در نتيجه انتخاب نشدن B2 از دست داده است ( -9 = 1-10 ) و براي B از دست دادن بيشتر سود ممكن به ازاء انتخاب A3 استنتاج مي گردد و همچنين براي (A3,B2). مجددا نقطه تعادل NASH با استراتژي انصراف از بين رفت. اما مگر مي شود كه A با انصراف از بازي نتيجه مثبتي گرفته باشد؟ آري! بايستي توجه داشت كه ماهيت هر مطلوبيتي ، ذهني است و پرداختها بر اساس الزام يا تعهداتي كه وجود دارد، انجام مي گيرد و هيچ ربطي به ماهيت مطلوبيتها ندارد. لذا جلوگيري از تباه شدن فرصت مي تواند سود تلقي گردد. با اين نگرش نيز باز هم بهترين استراتژي برايA در برابر استراتژي B2 انصراف است. استراتژیستهای انصراف  به آینده چشمداشت دارند و اصلا نا امید نیستند.

+ نوشته شده در  پنجشنبه 26 مرداد1385ساعت 23:54  توسط شوآن  | 

تصمیم گیری گروهی و نظریه بازیها ( با نگرش در تحقیق در عملیات )  نوشته : دکتر محمد جواد اصغر پور از انتشارات دانشگاه تهران . چاپ اول بهار ۱۳۸۲
+ نوشته شده در  شنبه 14 مرداد1385ساعت 23:27  توسط شوآن  | 

شایسته تر دیدم که یک ترجمه را از سال گذشته تکرار کنم. که مبحث مقدماتی که به بهترین وجهی می تواند همه را با مباحث این نظریه آشنا کند.

اساسا نظريه بازيها , رياضيات استراتژي است . مقدماتي ترين تئوري در اين زمينه  قضيه مينيماکس است که بيان مي دارد که اگر همه بازيکنان يک بازي  به بهترين شکل بازي کنند ( بهترين استراتژي بهينه) نتيجه پيامدهاي بازي قابل پيش بيني خواهد بود .

هر نوع بازيي از بازي تيک تاک توي تا بازي در بازار سهام مي تواند توسط نظريه بازيها پيش بيني گردد. مسلما تفاوتهايي اساسي در پيش بيني نتايج بازي تيک تاک توي و پيامدهاي بازار سهام وجود دارد . هنگاميکه تيک تاک توي توسط دو بازيکن زيرکانه بازي شود همواره به تساوي مي انجامد. در عين حال همه ما مي توانيم به روشي که حرکتهاي احتمالي خوانده مي شود و  با فرض اينکه مردم با سرمايه به شکل منطقيي بازي مي کنند در بازار سرمايه فعاليت نماييم . البته گرايش به امور صرفا موقتي که باعث اقدامات غير منطقي و غير قابل پيش گويي مي گردد و عليرغم اهتمام فراواني كه در بکارگیری فرمولهاي رياضي با هدف پيش بيني پيامدها صورت مي گيرد ،.مي تواند باعث از دست رفتن سرمايه گردد, بطور مثال حمله تروريستي به مراکز مالي دنيا , تمامي مدلها را تخريب نموده و بازي سرمايه را تا حد سقوط کامل پيش مي برد .  

نظريه بازيها با حرکتهاي منطقي در انواع مختلف بازيها سروکار دارد . تئوريهاي بازار سرمايه براي يک مدرس مبتدي بسيار پيچيده هستند بنابراين ما مقدمتا  بحث را به روي بازيهاي ميزي (شطرنج و تخته نرد و ... ) و بازيهاي خانوادگي( دبرنا و معماهاي خانوادگي و ...)  متمرکز مي کنيم که بيشتر افراد با آنها آشنا هستند . مشخصه هاي مهم بازيها عبارتند از : 

1-    تصادفي و غير تصادفي بودن بازيها ( Non – random vs. random ) : بازيها رندومي شامل تعدادي عناصر تصادفي هستند: تاس, صفحه هاي گردان , توزيع ورق در پاسور, توپهاي پينگ پونگ در ماشين لوتو( قرعه کشي) . بازهاي غير رندومي استراتژي خالص و ناب هستند : چکرز شطرنج - تيک تاک توي , غيره.

2-    آگاهي کامل- بدون آگاهي کامل ( perfect knowledge vs. Non perfect knowledge ) بازيهاي با آگاهي کامل,آنهايي هستند که تمام ترکيب بازي براي همه بازيکنان قابل رويت است : شطرنج, چکرز, مونوپولي, غيره. دربازيهايي بدون آگاهي کامل ظاهر و ترکيب بازي براي همه بازيکنان پوشيده است. همچون بازيهاي ورق , باتل شيپ و استراتژو( بازيهاي استراتژيک) .

3-    يک بازيکن. دو بازيکن.  N بازيکن : بازيهاي تک نفره ( مارپيچ , پازل و غيره) که شامل بازيهاي اشتراکي ( cooperative ) نيزمي باشد بازيهايي هستند که در آنهاهر کسي سعي مي کند پيامد بازي را بدون رقابت ( و مسابقه) به نفع خود به پايان ببرد. بازي A.I ( يا مسابقات تلويزيوني يا شراکت در يک بنگاه اقتصادي در تامين اهداف کلان سازمان ) که مي تواند بيش ازچند هزار بازيکن ( شرکت کننده ) داشته باشد , در حقيقت يک بازي تک بازيکن است زيرا همه اين بازيکنان در يک  تيم بازي مي کنند.  بازيهاي دو بازيکن آنهايي هستند که فقط دو بازيکن (همچون شطرنج, باتل شيپ. غيره )  يا دو تيم (براي مثال مسابقات ورزشي)  و نه بيشتر درگير بازي مي باشند. دربازيهاي N بازيکن دو يا چند نفر درگير هستند همچون مونوپولي, پوکر, لاتاري, يا بازار سرمايه. بايستي توجه داشت که در بازيهاي  N بازيکن , امکان بازي بيش از دو بازيکن نيز وجود دارد حتي اگر اين بازيها با دو نفر انجام گيرد . ( مثل بازي  زو و کليه فعاليتهاي اقتصادي در بازار )

4-    مجموع صفرو مجموع غير صفر( Zero sum vs. Non zero sum ) : در بازيهاي مجموع صفر تمامي ارزش بازي يا همانطور باقي مانده و يا تنزل مي کند. در يک بازي پوکر معمولي بازيکنان بازي را با همان مقدار پولي که ورقها ( يا ژتونها) را مي خرند, شروع مي کنند ,. اگر 6 بازيکن هر کدام با قيمت 50 دلارژتون شروع کنند, در هرمرحله از بازي مجموع موجودي بازيکنان و گلدان برابر 300 دلار خواهد بود. بازيهای انتخاباتی از جمله بازيهای مجموع صفر هستند.

شطرنج , بازي مجموع صفر ديگري است زيرا تعداد مهره هاي شطرنج هرگز نمي تواند افزايش يابد. بازيهاي مجموع غير صفر آنهايي هستند که ارزشهاي بازي مي تواند کاهش يابد و کاهش يافتني هم هستند. درمونوپولي هر زمان هر کسي از خانه شروع (  GO ) گذر کند 200 دلار از پول مونوپولي به بازي اضافه مي شود. اتلو از ديگر بازيهاي خانگي , بازي مجموع غيرصفر ديگري است که در مراحل مختلف بازي مهره هايي به بازي اضافه مي گردد.

بين اقتصاددانها و غير اقتصاددانها بحثهاي زياد در رابطه با ماهيت فعاليتهاي اقتصادي مطرح است از جمله اينکه گروهي اقتصاد را يک بازي مجموع صفر مي دانند. بر اين اساس کل علم اقتصاد از ديدگاه ايشان , توزيع پايدارو مداوم توده ثروت است. بنابراين هماهنگ با هم ، ثروتمند ثروتمند تر شده و فقير فقيرتر مي گردد. حال آنکه بيشترافراد بر اين باورند که اقتصاد يک بازي مجموع غير صفر است . پس هرگاه ثروتي ايجاد گردد, ثروتمند متمول تر شده و فقير هم متمول مي شود. اين موضوع اختلاف اساسي بين تئوري هاي سوسياليستي و تئوريهاي کاپيتاليستي است.

قاعده عمومي بازي عبارت است از :

{ درهر بازي " دو بازيکن" , " مجموع صفر" , " غير تصادفي" , " باآگاهي کامل " يک استراتژي کاملي وجود دارد که حداقل نتیجه مساوی را در يک بازي تضمين مي نمايد .}به طور مثال در هر مذاکره ای هرگاه استراتژی کاملی را از پيش در نظر گرفته باشيد هيچگاه بازنده مطلق نبوده و حداقل نتيجه تساوی را اخذ خواهيد نمود.

اما اين بازيهاي دوبازيکن ,مجموع صفر, غير تصادفي , آگاهي کامل چه بازيهايي هستند؟  چکرز, شطرنج, تيک- تاک- توي , نيم , نقطه ( خط و نقطه) و غيره. ما برخي از اين استراتژيهاي مطلوب ( ايده آل) را مي شناسيم که چه هستند.اما يکي از آنهايي که نمي دانيم شطرنج است . استراتژي آن بسيار پيچيده است بحدي که کوششهاي بسياري در کامپيوتري نمودن اين استراتژيها و خلق يک بازيکن تمام عيار صورت گرفته است همچون  " Deep blue " .( شطرنج باز رايانه اي ساخت اي.بي.ام و حريف کاسپاروف در سالهاي 1996 و 1997) .

يکي ديگراز بازيهايي که با آن آشنايي داريم تيک- تاک توي ( سه به سه قطار- رج) است. ) مثلا...)

X

X

O

O

O

X

X

O

X

هنگاميکه O آغاز مي کند , 9 حرکت ممکن براي او وجود دارد و X نيزمتقابلا 8 حرکت مي تواند انجام دهد که در مجموع  72 گشایش امکان پذير است . ما مي توانيم 880,362 (!9) پيامد ممکن را که براي بازي وجود دارد محاسبه نماييم. البته بااين روش بسيار گزافه گفته ايم زيرا بيشتر بازيها قبل ازاينکه بازيکنان 9 حرکت را کامل کنند به اتمام مي رسند.

هنگاميکه ما درحال حذف بازيها هستيم , درواقع شروع به گزينش حرکتهاي زيرکانه مي کنيم. اگر O شروع کند, قطعا به درستي در مرکز مربع يا يکي از نقاط گوشه , بازي را گشايش خواهد کرد.  بنابراين تنها 5 حرکت قابل پيش بيني جهت شروع بازي وجود خواهد داشت و اگر X نيز زيرکانه بازي کند, آنگاه اگر O يکی ازگوشه ها را برگزيده باشد، با خانه ميانه ( مربع ) مقابله خواهد کرد و در صورتيکه O  ميانه ( مربع ) را انتخاب کرده باشد, با يک گوشه جواب خواهد داد. بنابراين يک بازيکن درنقطه مياني وديگري در يکي از نقاط گوشه بازي را آغاز خواهند کرد و بدين ترتيب حرکتهاي دور گشايش به 8 پيامد ممکن زيرکانه ختم مي شود.

(متاسفانه یک دیاگرام از پیامد های ممکن این بازی را نتوانستم در این جا بگذارم)

هر بازي امکان پذير در واقع انعکاسي از اين 6 پيامد پيش بيني شده است. 6  پيامد غير گزافه وجود دارد , که يا بر حسب تمايل  يا در واکنش به بازي حريف برگزيده شده است, و درمجموع 48 پيامد منطقيي که در بازي تيک تاک توي وجود دارند , شانسهاي امکان پذيري براي هر دو حريف هستند. 

 استراتژي بهينه:

روش تحليل رياضي بازي عبارت است از تهيه جدولي از پيامدهاي ليست شده براي هر استراتژي. جدول يک استراتژي دو بازيکن غير رندوم  ممکن است همچون اين باشد:

 

Player A

Strategy 1

Strategy 2

Strategy 3

etc

Player B

 

Strategy 1

Tie

A wins

B wins

...

Strategy 2

B wins

Tie

A wins

...

Strategy 3

A wins

B wins

Tie

...

etc

...

...

...

...

استراتژي انتخابي بازيکنان مي تواند منجر به نتايجي از بازي , مطابق با جدول فوق گردد. دو استراتژي در جدول مي توان يافت:

مينيماکس: حداقل نتيجه مطلوب( good )  از همه پيامدهاي مثبت.

ماکسيمين: حداقل نتيجه نا مطلوب ( bad ) از همه پيامدهاي مثبت.

قضیه مينيماکس: هرگاه استراتژي مينيماکس يک بازيکن مشابه با يک استراتژي ماکسيمين بازيکن ديگرباشد, آنگاه آن استراتژي, بهترين نتيجه اي است که هر دوبازيکن مي توانند انتظار داشته باشند. ( در مذاکره هاي استخدامي غالبا بازي به يک استراتژي بهينه براي هر دو طرف مي انجامد)  پس اگر احتمال يک نتيجه مساوي وجود داشته باشد, اين نتيجه بهترين پيامد مورد انتظار خواهد بود . اين نتيجه را نقطه زيني مي نامند.

توجه کنيد به مثال دو بچه اي که استدلال مي نمايند که چه کسي آخرين برش کيک را تصاحب نمايد. تصميم گرفته مي شود که يکي از بچه ها کيک را ببرد و ديگري قطعه کيک را براي خوردن انتخاب نمايد. جدول استراتژي مطابق زير مي باشد:  

 

Chooser chooses biggest piece

Chooser chooses smallest piece

Cutter cuts even

Chooser gets a crumb more

Cutter gets a crumb more

Cutter cuts uneven

Chooser gets a big piece

Cutter gets a smal piece

راه حل مينيماکس براي انتخاب کننده تصاحب نيمي از کيک به علاوه يک خرده بيشتر است که اين راه حل ماکسيمين براي برش دهنده نيز مي باشد. تقريبا اين نتيجه مسلمي بود که مي توانست پيش بيني گردد.

برخي از بازيها پيامد با نقطه زيني ندارند , درواقع اين مسئله براي بيشتر بازيها مصداق دارد. يک مثال ساده سنگ - کاغذ - قيچي است .

 

A chooses ROCK

A chooses SCISSORS

A chooses PAPER

B chooses        ROCK

tie

B wins

A wins

B chooses SCISSORS

A wins

Tie

B wins

B chooses       PAPER

B wins

A wins

tie

با وجود نداشتن پيامدي با نقطه زيني قابل پيش بيني , استراتژي اختلاطيي وجود دارد که به بهترين شکلي نتيجه بخش است. استراتژيي که بر مبناي انتخابي کاملا تصادفي و درعين حال امکان پذيرخلق مي گردد, گزينش يکي از سه حالت سنگ , کاغذ و قيچي بدون در نظر داشتن الگوي خاصي است. اگر شما به گزينه خاصي توجه داشته باشيد و يا اگر گزينش شما از يک الگوخاصي تبعيت مي کند, بدانيد که اين امکان براي حريف شما فراهم شده است تا بر اساس الگو مورد نظرشما برنده بازي شود. البته استراتژي هاي بدتري هم وجود دارند.( تمامي تمهيدات مديريتي در تسلط و تاثير بر برنامه هاي کلان زندگي شخصي پرسنل محبوب سازمان با آگاهي از استراتژي ايشان و ميزان پايبندی به اصول اخلاقی و قوانين و مقررات مدنی و درون سازمانی ايشان صورت گرفته و بر اساس قدرت مانور در انتخابهاي مختلف است که سرنوشت کاري هر يک از  اعضای سازمان را رقم مي زند ) .

ليزا: نگا کن! فقط يک راه براي تعيين نتيجه سنگ کاغذ قيچي وجود داره .

ذهن ليزا: بيچاره "بارت"  که قابل پيش بيني يه. هميشه سنگ را انتخاب مي کنه.

ذهن بارت: سنگ خوبه . هيچ چيزي نمي تونه به اون غلبه کنه!

(بارت سنگ را نشان ميدهد , ليزا کاغذ را )  .

بارت: اوه

سيمپسونها ( قطعه " the front " )

 يک استراتژي اختلاطي: عبارت است از انتخاب احتمالي بين استراتژي هاي مختلفي که مبنتي بروزن احتمالات محاسبه شده اند. در مورد سنگ , کاغذ, قيچي , بهترين استراتژيها آنهايي هستند که بار( احتمالي)  مساوي دارند. يعني تا بازيکنان و تمايلات يا اهداف ايشان مشخص نباشد تا براساس آن بتوان براي هر گزينه احتمالي را برآورد نمود, امکان پيش بيني پيامد ها و انتخاب استراتژي مناسب وجود نخواهد داشت.

استراتژيهاي اختلاطي و بازيهاي تصادفي

بيشتر بازيها با عناصري تصادفي سرو کار دارند, پرتاب يک طاس , توزيع ورقها وغيره . درحاليکه قضيه مينيماکس نميتواند استراتژي برد را در اين بازيها تضمين نمايد , استراتژي اختلاطيي وجود دارد که  مي تواند بهترين گزينه برد را در اختيار شما قرار مي دهد .

به مثال زيرشامل نمودار بين پرتابگر و توپ زن ( دربازي بيسبال) توجه نماييد. ميانگين تعداد دفعات زدن توپ مبتني است برنحوه پرتاب پرتابگر و آنچه توپ زن انتظار دارد .

 

Batter expects        a Curveball

Batter expects        a Fastball

Batter expects     a Screwball

Pitcher throws  a Curveball

.400

.300

.000

Pitcher throws  a Fastball

.200

.400

.300

Pitcher throws  a Screwball

.000

.200

.400

بر مبناي اين احتمالات , اين پرتابگراست که  تصميم ميگيرد چگونه توپ را پرتاب نمايد و متقابلا  توپ زن بايستي برمبناي گمان خويش از نوع پرتاب , نحوه زدن توپ را انتخاب نمايد. بهترين استراتژي اختلاطي براي پرتابگر عبارت است از پرتاب screwball ها با 60 % درهر نوبت و curveball ها با 40% در هر نوبت . درپاسخ توپ زن انتظار 80 % fastball ها و 20 % screwball ها را دارد. اگر هر دوآنها اين استراتژيها را بکار گيرند, توپ زن به طورمتوسط 240 ضربه خواهد زد. ما از چگونگي محاسبه اين استراتژي اختلاطي حين بازي و درآن شرايط سر در نمي آوريم. چيزي که مهم است اين که در هر بازي مجموع صفر , دو بازيکن وضعيتي وجود دارد که يک استراتژي اختلاطي ايده آل را در آن مي توان يافت.

بازيهاي مجموع غير صفر

دربازيهاي مجموع غير صفر , يک مجموع ارزش تثبيت شده وجود دارد . هرمرحله پيروزي براي يک بازيکن به معني باخت بازيکن ديگر است . بازيهاي مجموع غير صفر به معني اين است که هر دو بازيکن بالقوه  توان بدست آوردن يا از دست دادن را دارند که وابستگی بسياری به استراتژي ايشان دارد. به بازي ( chicken ) توجه نماييد , دو نوجوان در اتومبيلهايشان به سرعت به طرف يکديگر مي رانند. اگر يکي بترسد و منحرف شود ديگري مي برد . اگر هردو منحرف شوند هيچکس نمي برد اما هر دو باقي مي مانند. اگر هيچ کدام منحرف نشوند هر دو ماشين هايشان و احتمالا زندگيشان را مي بازند . استراتژي برد ( ايده آل ) ؟ انحراف

بازي مشهور مجموع غير صفر ديگر معماي زنداني است: دونفر که مظنون به شرکت در يک سرقت مسلحانه هستند در جريان يک درگيري شديد دستگير مي شوند. هر دو جداگانه مورد بازجويي قرار مي گيرند و وعده يک معامله با شرايط يکسان ( به هر دو ) داده مي شود:

" اگر تو دوستت را لو بدهي مي تواني آزاد شوي ولي دوستت 5 سال حبس خواهد شد . اگرشما هر دو يکديگر را  لو بدهيد , هر دوی شما به سه سال حبس محکوم خواهيد شد و اگر هيچکدام يکديگر را لو ندهيد , هر دو يک سال در مرکزبازپروري خدمت خواهيد کرد ."

 اگر شما يکي از زنداني ها بوديد چه مي کرديد؟

اين مورد مثالي از بازي مجموع غير صفر بدون نقطه زيني مينيماکس مي باشد. شرط خدمت براي هر دو زنداني بهترين شرط است هر گاه هر دو دهانهايشان را بسته نگه دارند . اما در شرايط فردي ( بدون احتساب منافع طرفين ) بهتر آن است که دوستتان را لو بدهيد .

دراينجا موردي را مي خواهم مطرح نمايم که جنبه مثبت تري دارد و در کلاسهاي درس بحثهاي زيادي ايجاد مي نمايد:

يک آدم خير عجيب 3000 دلار به هر عضو کلاس که آن را از او بخواهد اعطا مي کند مشروط بر اينکه همه شما در صورت خواستن هديه فوق کلمه " بلي" را نوشته باشيد. اکنون همان آدم خيرعجيب بنا به اعتقادي که به تلافي تواضع و حس مشارکت دارد درقبال اينکه هر کسي بنويسد " نه " يعني نميخواهم , به هر عضوي 10000 دلار مي دهد و  اگرفقط يک نفر بنويسد " بلي" يعني مي خواهم مثل قبل فقط 3000 دلار به همه خواهد داد و اگرهمه بنويسند " نه " نمي خواهم , هيچ چيزي دريافت نخواهند کرد. اگر شمابوديد چه مي کرديد؟

آيا شما 3000 دلار را تضمين ميکرديد يا به بقيه کلاس جهت دريافت 10000 دلار اعتماد مي کرديد ؟

 اغلب اين بازيها, بازيهاي آفت اشتراک (منافع)  ناميده مي شوند, و اين بازيها در ارتباط با موقعيتهاي اخلاقي بسيار قابل توجه هستند. آيا شما راي مي دهيد ؟ همکاري در يک امر خيرچطور؟ انجام اين چيزها مستلزم صرف وقت و پول شماست ولي تلاش فردي شما تاثير زيادي نخواهد داشت. اگر افراد بيشتري همياري داشته باشند, آن وقت نتيجه متفاوت خواهد بود.

 جنگ ، يك بازي تصادفی است , با  N  بازيکن , مجموع غير صفر و بدون آگاهي کامل از وضعيت بازي که به هوشياري و زيرکي فوق العاده ,همچنين تفکري برمبناي استراتژي نياز دارد, جنگ نياز به ريسک هم خواهد داشت . نقطه زيني ممکن است رسيدن به اين نتيجه باشد :

" ما جنگ را پيروز خواهيم شد , اما قريب به يقين چندين چالش و نبرد را از دست خواهيم داد . " 

اميدواريم هر استراتژي که در مذاکرات سياسي و يا نظامي اتخاذ مي نماييم به نتيجه مطلوبي بيانجامد ( يعني تعداد شکستها و باج ها در چالش ها و مذاکرات بينابين کاهش يافته و با حداقل باختها به برد دست يازيم ).

 مطلب فوق ترجمه  :

Is there an ideal strategy for winning the war on terrorism?

 

+ نوشته شده در  جمعه 13 مرداد1385ساعت 9:50  توسط شوآن  | 

 

در اينجا مي خواهم طرحي از يك شبكه بازيها ارائه دهم. ايده اي براي يك مدل ذهني (از جمله سيستمهاي سريع براي تحليل ذهني) كه بتواند به پرسشهايم از پيچيدگي هاي بازار و تعاملهاي آن پاسخ گويد و زنجيره تامين را كه حلقه هاي در هم تنيده اش همچون كلافهاي DNA با ويژگيهاي منحصر به فرد خود ، قانون وراثت بازار صنعتي را شكل مي دهند، پيش بيني و تعريف نمايد. رفتارهاي زيركانه و متعامل تامين كنندگان و مشتريان و مصرف كنندگان را در نوسانات ريسكهاي اقتصادي بازار سر و سامان دهد. باز هم مي گويم اين برداشتي آزاد بر مبناي يك تخيل براي توجيه هاي لذت بخشي است كه خود مي تواند الگويي براي طرحي نو و ديدگاهي براي آفريدن و خلاقيت باشد و تنها جنبه هاي بازيگرانه آن با استفاده از سيستمهاي سريع و طراحي آن براي شبيه سازي مد نظر بوده است و هيچ ارتباط يك به يكي براي اين تحليها متصور نبوده ام.

در اين شبكه ، همه شطرنج بازي مي كنند اما علاوه بر قراردادهاي رايج دريك بازي شطرنج بر اساس قوانين اين شبكه ، قراردادهاي ديگري نيز بر جريان بازي موثرند و رفتارها و مطلوبيتها را پيچيده تر مي نمايند:

1-   در هر بازي مهره هايي از دو طرف قرباني مي شوند تا استراتژيها شكل گرفته و برد و باختهارقم بخورند. هر بازيكن در بازي بعدي تنها مي تواند با مهره هاي باقي مانده خود از بازي قبلي به علاوه مهره هاي به دست آمده از حريف ، تركيب جديد مهره هايش در بازي جديد راايجاد كند. در شبكه ما ، هنوز بازيكن اجازه استفاده از مهره هاي اضافي را نداشته و بيشتر از مهره هاي قراردادي بازي نمي تواند در چيدمان خود استفاده نمايد. ليكن براي اينكه ارزش مهره ها همچنان حفظ شود ، وي مي تواند با رعايت ارزش قراردادي تعريف شده براي آنها (8 پياده معادل يك وزير و ...) ، قبل از آغاز بازي از سرمايه انباشته خود در بازي قبلي براي تغيير نقش مهره ها و تكميل چيدمان خود بهره برداري نمايد. اين قانون،  محدوديتي است كه استراتژيهاي بهينه را تغيير داده و به غير از مطلوبيت مات نمودن حريف در بازي ، مطلوبيتي را در تركيب استراتژيك بازي شكل مي دهد كه اين بردها با كمترين مهره از دست داده (هزينه بازي) و بيشترين مهره به دست آمده (درآمد بازي) ، تامين گردد.

2-   هر بازيكني در گزينش بازيكن حريف و موقعيت خود در شبكه  آزاد بوده و تنها توافق دو جانبه مجوز آغاز يك بازي است انتخاب بازار). همچنين مي توان با توجه به اميد رياضي برد بر گرفته از ارزش مهره هاي انباشته ، با حريفان جديد بازيهاي جديدي را سرو سامان داد (توسعه ) .

ويژگي هاي شبكه و مطلوبيتهاي تغيير يافته بازيكنان امكان برآورد رفتار شبكه را فراهم مي آورند:

1-     شبكه همواره پويا بوده و اميد رياضي ناشي از برد ها و باختها به علاوه مهره هاي تبادل شده ، انرژي شبكه را تامين مي نمايد.

2-   خود سازماندهي اصل اول مديريت آن است. دخالتهاي خارج از شبكه و تنظيم قوانين و قراردادهاي خاص بر پويايي آن موثر بوده و مي تواند مسير برد و باختها و جريان مهره ها ي تبادل شده را تغيير دهد. مثلا در صورتيكه مهره هاي انباشته مشمول مالياتهاي انباشتگي شود ، مطلوبيت حضور در شبكه افزايش مي يابد و بر عكس در صورتيكه كارمزد مهره هاي انباشته ، سودی را تضمين نمايد كه توان مقابله با نوسانات بازيهاي شبكه و ريسكهاي آن را داشته باشد ، تمايل به خروج از شبكه مطلوبيت منطقي و عاقلانه اي خواهد بود.

3-   در شبكه امكان سرمايه گذاري به روي بازيهاي ديگران با بكار گيري سهمي از مهره ها وجود داشته و هيچ مانعي براي شراكت هاي چندگانه وجود ندارد. توجه داشته باشيد اين تمايل به سرمايه گذاري هيچ تناقضی با قرارداد هاي بازي در شبكه ندارد زيرا نهايتا يك زمينه توافقي و 16 مهره سرنوشت برد ها و باختها را تعيين مي نمايند. مطلوبيتي كه در برد و باختها نهفته است ، باعث ايجاد تمايل به سرمايه گذاري سايرين و توسعه بازيهاي بازيكنان "بيشتر برنده" است. عاملي كه مي تواند مطلوبيت تبادل مهره ها در بازي و مطلوبيت برد بازي را به تعادل برساند و آنتروپي طبيعي بازي را توجيه نمايد.

4-   مطلوبيت پنهاني كه به عنوان يك هدف تبهگن مي توان از آن نام برد . تمايل شبكه به گسترش و حفظ بازيكنان در بازي است. در صورتي كه بازيهاي شبكه منجر به باختهاي پياپي سرمايه داران ضعيف و تقويت سرمايه داران كلان گردد، شبكه كوچكتر شده و موضع انفعالي بازيكنان حذف شده و حجم سرمايه گذاريهاي اين بازيكنان به روي بازيهاي برنده در شبكه منجر به ايجاد قطبهاي بزرگي از برنده ها گشته و سطح رقابتها به مرحله اي مي رسند كه يا بر عليه قرارداد هاي جاري شبكه قد بر مي افرازند و آن را دچار سنتز مي كنند يا انباشتگي مهره ها را افزايش داده و گردش و پويايي شبكه را دستخوش تغييرات منهدم كننده اي مي نمايند.

5-    ويژگي ديگري كه مي توان براي اين گونه شبكه ها متصور بود ، باز بودن آنهاست. يعني شبكه هايي با ديدگاه هاي غير حمايتي ، زمينه هاي بكري را مي جويند كه امكان پوشش حوزه هاي ديگر فعاليت را داشته و با ايجاد پيوند بين شبكه ها ، توسعه جهاني آن را رقم بزند.

6-   شبكه هاي خورنده و سرمايه مدار ( كه امكان برد و انباشتگي مهره ها را دارند) تمايل به گسترش بازيها و افزايش ارزش وروديها دارند. بدون وروديها ، مطلوبيت برد و باختها ارجح تر از مطلوبيت تبادل مهره ها گشته و نزاع و قانون شكني پيامد غير منطقيي در سرنوشت اينگونه بازيها در شبكه ها خواهد گرديد. توسعه منابع به عنوان بهترين راهكار ، تزريق سرمايه براي حضور بازيكنان جديد يا ادامه بازي براي خسارت ديدگان و توسعه بازي برندگان از شگردهاي حفظ پويايي شبكه است. بايستي اميد رياضي را در مطلوبيت تبادل مهره ها افزايش داد.

7-   براي اتصال شبكه ها به يكديگر و امكان ريسك بازيكنان در مرزهاي اين شبكه ها ، نيازي به اعمال محدوديت در استراتژي ها و بلوكه نمودن راهبردهاي حفظ و افزايش سرمايه و حمايتهاي غير منطقي از بازيكنان وجود ندارد، تنها همسان سازي قراردادهاي بازي در بخش بسيار گسترده اي مي تواند عدم قطعيت راههاي ارتباطي شبكه ها و پيوستن زنجيره بازيها به يكديگر را كاهش دهد. براي اين منظور مي بايستي قوانين بازي تغيير نكنند ، ارزش مهره ها همسان بمانند و امكان تقلب براي حريفان فراهم نگردد، در مقابل ، استراتژيهاي حضور در بازي و تركيب بهينه براي برد ، خود به خود سازمان دهي شده تا امكان ادغام و يك پارچه سازي شبكه ها در يكديگر فراهم گردد و بر اساس ويژگي خود سازمان دهي در پيكره آن ، امكان تفكيك و قطبی شدن منافع منتفی شود.

8-   شبكه تعلق مليتي ندارد. واقعيت اين است كه نه مليت ، نه مرز ، نه جغرافياي اعضاي شبكه ، توانايي تمايز در نحوه بازي و جريان منافع را نخواهند داشت. تحميل هنجارهايي كه يكپارچگي شبكه را متاثر نمايند ، تنها بقاي بخشهاي تفكيك شده از شبكه را تهديد مي كنند. زيرا پايستگي شبكه منوط به تمايل بازيكنان به انتخاب حريفان و گزينش موقعيتهاي بازي است. انزوا در شبكه منجر به مرگ مي گردد.

 

 

 

+ نوشته شده در  دوشنبه 9 مرداد1385ساعت 18:26  توسط شوآن  | 

 

   اميدوار به رياضي 

   انسانها با اميد رياضي زنده اند و به زندگي ادامه مي دهند. اميد رياضي((E(x) حاصلضرب دو پارامتر است كه عبارتند از ارزش هر استراتژي (x)  در احتمال متناظر با پيش آمدن آن (Fx) مي باشد. در شکارگاه ، بزرگي و فربهي شكار ، ارزش بازي و احتمال به دام انداختن آن ، احتمال متناظر آن است كه اميد رياضي شكار را شکل مي دهند. افزايش هر يك از دو عامل در افزايش اميد رياضي موثر بوده و انگيزه هاي حضور در بازي را بيشتر مي نمايد. اما اين دو پارامتر گاه طبق فرمولهاي خاصي به هم وابستگي دارند.( مثلا بزرگي سنگ و احتمال پرتاب آن )

 زمانيكه اولين گزينه ، پذيرفتن ورود هوشمندانه به يك بازي باشد ( مثل شركت در يك قمار يا شرط بندي) بايستي يك حداقل اميد رياضي وجود داشته باشد( آستانه پذيرش بازي) مي توان اين حداقل اميد رياضي را آستانه تحريك (يا پذيرش) نامید. در اهداف تبهگن كه سهامداران پنهان حضور مستقيمي در بازي نداشته و با يك سازوكار بسيار پيچيده از منافع آن سود مي برند ، نيز آستانه تحريكي براي نقش آفريني وجود دارد. آيا اين سهامداران نيز بر اساس اميد رياضي كه به حضور ساير نقش آفرينان در بازي دارند براي زندگي و جلب مطلوبيت هاي خود تصميم سازي مي كنند؟ آيا قانون چرخه طبيعت است كه انگل ها را به وجود ميزبانان امیدوار كرده است يا اميد رياضي آنها به تعادلي است كه در نظام توليد کننده و مصرف کننده در طبيعت وجود دارد؟

شناخت ارزشهاي واقعي هر استراتژي از يك سو و برآورد صحيح احتمالهاي متناظر با آنها از سوي ديگر از مقدماتي ترين مراحل تصميم سازي است. در هر فرآيند تصميم سازي علاوه بر جنبه هاي شخصي ، وجه رقابتي آن ايجاب مي نمايد كه نيم نگاهي به حريف ( يا حريفان ) با ارزشهايي كه مطلوبيت آنها را رقم مي زند و فاكتور موثر بر احتمالات و برآورد ايشان داشته باشيد. اين نگرش در   گام نخست در طراحي بازيها و در گام بعدي درگزينش استراتژي بهينه موثر است. توجه داشته باشيد حتي در تعاملهاي فنآورانه (مثلا سير تكاملي مواد يا خدمات در زنجيره تامين كه مرحله به مرحله با ارزش افزوده همراه است)  مي توان بازي مجموع غير صفري را ساماندهي نمود كه زنجيره اي از سهامداران را همكارانه كنار هم به تعامل وادارد اما از سوي ديگر تقسيم ارزش به دست آمده و تعيين سهم هر يك از ذينفعان ، بازي مجموع صفري است كه كاهش سود يكي برابر است با افزايش منافع ديگري و بالعكس.  توجه داشته باشيد كه هر يك از سهامداران به مقدار اميد رياضي خويش از سود محتمل حاصل از فروش محصول نهايي ، چشمداشت دارند و فاعلانه برنامه ريزي نموده و بازي مي كنند . در رابطه با بخشي از ارزش كه فراتر از مقدار مورد انتظارشان است خواهان قواعد جديدي از بازي جهت افزايش ميزان سهم يا احتمال دستيابي به آن در بازه هاي معين زماني خواهند بود و بسيار منفعلانه ظاهر مي شوند. در قبال مقادير كمتر از انتظار به دنبال بيمه هاي تضمين كننده اي هستند كه استراتژي را برگشت پذير ساخته و يا توانايي جبران هزينه هاي برآورد نشده را داشته باشد. در اين حالت درجه انفعال به حدي بالاست كه استراتژيستها دست به دامان قضا و قدر مي شوند.

به نظر من ،  چالشي كه در آن اميد رياضي حريفان در حوزه هاي تحت كنترل مديريت مي شوند ، يكي از پيچيده ترين و دير فهم ترين بخشها در بازيها است. وابستگي متغيرهاي محتمل به يكديگر و كشف احتمالات شرطي و طراحي چگاليهاي احتمالي توام ،  با هدف ايجاد ارتباط بين حوزه هاي خارج از كنترل و حيطه هاي كنترل پذير امكان تصرف درتوابع توزيع احتمالات متناظر با استراتژي حريف و تغيير اميد رياضي وي را فراهم مي آورد.

توجه داشته باشيد كه اميد رياضي از جنبه احتمالي آن (پارامترهاي عدم قطعيت) داراي دو بستر كاملا نا همگون است . يكي بازه زماني كه تعريف تابع توزيع احتمال را توجیه پذير مي سازد و در اين بازه ديناميك تغييرات الگوي احتمالي پيشامدها قابليت فرموله شدن داشته يا ويژگي پيش بينانه خود را حفظ مي كند. اين بازه وابسته به سرعت وقوع پيشامدها و تبادل پيامد هاست و موثر بر فراواني ستانده هاي مختلفي است كه از حضورهر پيشامد كسب مي شود. ديگري جمعيت آماريي است كه ستانده هاي يك پيشامد استراتژيك را در قالب يك توزيع احتمالي هم زمان و ایستا نمايش مي دهد. به بياني ساده تر يكبار بايستي منتظر بمانيم كه با گذشت زمان و وقوع پيشامدهاي مختلف براي يك نمونه از جامعه آماري ، پديده مطلوب ايجاد شود و بار ديگر ، جامعه آماريي در اختيار داريم كه امكان پوشش تمامي پيشامدهاي محتمل را داشته و امكان بروز پديده مطلوب در بخشي از پيكره اين جامعه وجود خواهد داشت. مثلا اگر احتمال واگير يك بيماري 0.5 % براي هر شهروند در يك بازه زماني مشخص باشد مي توان انتظار داشت كه به طور ايستا در کسر مشخصي از آن بازه  از يك جمعيت 1000 نفري در معرض ابتلا ، 5 نفر بيمار شده باشند.

با يك مثال ،كمي مطلب را باز مي كنيم:

مدير يك واحد توليدي ناگهان اعلام مي كند كه قصد دارد سطح دستمزدها را به مقدار مشخصي كاهش دهد. اين استراتژي به زيان كاركنان و به نفع واحد توليدي است. هر يك از كاركنان آزاد است كه بر اساس شرايط جديد به كار ادامه داده يا واحد توليدي را ترك نمايد. براي مدير واحد توليدي از يك سو پذيرفتن شرايط جديد از سوي كاركنان ، سود بيشتري را براي واحد به همراه دارد و از سوي ديگر نپذيرفتن شرايط توسط ايشان منجر به ترك كار و عقيم ماندن فعاليتهاي بنگاه اقتصادي مي گردد. حال از منظر اميد رياضي اين استراتژي را تحليل كنيم:

1-    اميد رياضي كاركنان:

کارکنان به دو بخش تقسيم مي شوند . گروهي كه با ترك كار فرصتهاي شغلي خوبي در اختيار دارند و گروهي كه تهديد هاي محيط بيرون بيشتر از فرصتهاي آن است. اميد رياضي كسب درآمد در ازاء كار  با حقوق پايين در آن واحد توليدي + اميد رياضي زيان ناشي از ترك كار ، اميد رياضي كل اين استراتژي براي كاركنان را تشكيل مي دهد. پس در تحليل استراتژيك كاركنان بايستي به اين دوگانگي توجه داشته و قابليت انعطاف در استراتژي كاهش دستمزد را كليشه اي و يك سويه ننگريست.

2-  اميد رياضي مدير واحد توليدي شامل سود مورد انتظار به دست آمده از كاهش سطح دستمزد + هزينه هاي خسارت از دست دادن نيروي انساني +  هزينه هاي جبران كاركنان ترك كار كرده + فرصت سود به كارگيري مبالغ صرفه جويي شده است. بايستي توجه داشت كه ادامه منطقي بازي منوط به شرايط زير براي مدير واحد است :

الف) تعداد كاركناني كه واحد را ترك مي كنند به قدري زياد نباشد كه سازمان قدرت ترميم خود را از دست بدهد.

ب) سود مورد انتظار از كاهش دستمزد در مقايسه با هزينه هاي مورد انتظار ناشي از جايگزيني كاركنان جديد توانايي پاسخ به انتظارات اين ريسك را داشته باشد.

ج) تمامي فاكتورهاي احتمال در اختيار كاركنان بوده و پذيرفتن يا نپذيرفتن شرايط جديد است كه اميد رياضي كاركنان و مدير واحد را شكل مي دهد. در واقع دستيابي به ارزشهاي مورد انتظار مدير واحد منوط به سطح هوشمندي و مخاطره پذيري كاركنان در پاسخ محتملشان است و بخشي از ارزش استراتژي توسط مدير واحد تعيين مي شود.

فرض كنيد مقدار کاهش يافته دستمزد به قدري است كه با نسبت 80 به 20 كاركنان با شرايط جديد به كار ادامه دهند. سياستهاي مدير واحد جهت عقيم نماندن اين استراتژي بعد از اين آغاز مي شود . مسلما با توجه به جمعيت آماريي كه اين احتمال را پوشش مي دهند، عملا 20 % كاركنان ترك كار مي كنند. بنابراين سازمان بايستي قابليت ترميم 20 % پيكره نيروي انساني را داشته و همزمان شرايط قبلي توليد را حفظ نمايد ( حفظ اين شرايط به اين معنا نيست كه هيچ نوساني در برنامه هاي سازمان مشاهده نشود) همچنين بايستي سازمان آماده موجهاي مخالف بعدي باشد. زمانيكه هر بازيكن با اتمام بازه زماني "قبول شرايط با نسبت 80% " به دوره بحراني " طغيان با نسبت 20% " رسيده و عملا مخالفت درتمامي سازمان تا پايان دوره   فراگيرمي گردد. تاخير در واكنش ساير كاركنان فرصت سودي است كه واحد از ان بهره برداري مي نمايد ( و شايد استراتژي را برگشت ناپذير سازد) . با رسيدن به زمان بحران مي توان با تغيير در مقدار ارزش استراتژي فوق (به شكل افزايش جزئي دستمزد و اعطاي ساير امتيازها) براي كاركنان مجددا چالش دوباره اي را جهت تغيير اميد رياضي ايشان و بازه جديدي از زمان ساماندهي كرد. تغيير شرايط محيط و برآورد اين تغييرات (فرصتهاي شغلي و تورم و نوسانهاي بازار و شرايط فصلي كار ، ... ) در تحليل تغييرات شكل توزيع احتمال در بازه زماني مورد نظر موثر خواهد بود.

اميد رياضي ، نگرشي كاملا شخصي به آينده است. نگرشي با جهت ارزش مدارانه كه مي خواهد با بومي سازي آينده در حيطه هاي هوشمندي نسبي انسانها ، به پيشامدها سرعت داده و يا آنها را كند نمايد. اميد رياضي عجين شده با عدم قطعيت است و سرچشمهِ‌ ترسها و اضطرابها و دلشورگي هاست. انسان بدون اميد رياضي نيازي به هدف نيز  ندارد.

براي پديده هايي كه ارزش فوق العاده بالايي دارند ، گاه مكانيزم تصميم سازي از فاكتورهاي احتمالي اميد رياضي چشم پوشيده و بر اساس سازوكار ديگري كه از جنس هوش خوداگاه نيست، استراتژي بهينه را تحميل مي كند. براي زنده ماندن نيازي به برآورد احتمال و اميدواري نيست ، تنها بايستي زنده بود و زنده ماند.

 

+ نوشته شده در  دوشنبه 9 مرداد1385ساعت 18:11  توسط شوآن  |