مباحث الگوریتمی

کامنت خصوصی نگذارید چون من با ایمیل جواب سوال نمی‌دهم. اگر سوالی دارید کامنت بگذارید من همانجا جواب می‌دهم.

۴۰ مطلب با موضوع «نظریه الگوریتمی بازی‌ها» ثبت شده است

۰ نظر موافقین ۰ مخالفین ۰ ۰۳ آذر ۹۳ ، ۰۹:۱۲
سپیده آقاملائی

مستمع آزاد راه نمیدن! :))

این خودش ملاک کیفیت کلاسه. هیچ وقت درسی که ترم اولیه که ارائه میشه برندارید.

۰ نظر موافقین ۰ مخالفین ۰ ۲۹ شهریور ۹۳ ، ۱۱:۱۶
سپیده آقاملائی

http://math.mit.edu/~goemans/18433S13/shannon-game.pdf

۰ نظر موافقین ۰ مخالفین ۰ ۲۲ مرداد ۹۳ ، ۱۳:۳۶
سپیده آقاملائی

داشتم به این فکر می‌کردم که برای نمره دادن استادها یک مکانیزم طراحی کنیم که یکی پیدا کردم:

http://web.mit.edu/primes/materials/2013/conf/7-1-Kaashoek-Wu.pdf

۰ نظر موافقین ۰ مخالفین ۰ ۱۵ تیر ۹۳ ، ۱۸:۰۱
سپیده آقاملائی

سوال این بود که می‌خواهیم یک کیک را بین ۳ نفر تقسیم کنیم و این کار را فقط با سه تا برش انجام بدهیم.

یک راه حل برای این بود که تعداد برشهایش نامتناهی بود. من فکر کردم روی مسأله و دیدم بهتر از این نمی‌شود چون به تابع علاقه‌ی افراد به قسمت‌های مختلف کیک بستگی دارد.

حل من:

اگر هر فردی که به مقدار ۱/۳ و ۲/۳ می‌رسد اعلام کند و نفر اولی که اعلام می‌کند با A و نفر دومی که اعلام می‌کند با B و فرد دیگر را با C نشان بدهیم، ترتیب‌های مختلف به صورت زیر است:

۱) یک حرف تکرار شود: در این صورت یک نفر ۲/۳ کیک را طی کرده است در حالی که بقیه به ۱/۳شان هم نرسیده‌اند. در این صورت قسمت مورد نظر این فرد را به او می‌دهیم. (شکل اول)

۲) یک حرف با یک فاصله تکرار شود. (شکل دوم). در این صورت یک دور به وجود می‌آید (چون حرف تکراری نداریم). مثلاً ABACBC. در این حالت باید مبدأ را عوض کنیم وگرنه هیچ برشی وجود ندارد و این عوض کردن مبدأ هم به تابع آن بستگی دارد.

۳) ABCABC: کیک را از روی اعلامهای B می‌بریم. فرد A قسمت اول، فرد C قسمت آخر و فرد B قسمت وسط را می‌گیرند.

این قسمت را غلط حل کردم! چون از نظر A قسمت اول از ۱/۳ بیشتر و قسمت آخر از ۱/۳ کمتر است، در نتیجه قسمت دوم می‌تواند از قسمت اول کمتر یا بیشتر باشد. از نظر نفر سوم برعکس است، یعنی قسمت آخر از ۱/۳ بیشتر، قسمت اول از ۱/۳ کمتر است و ممکن است قسمت دوم از همه بزرگتر باشد. در نتیجه در حالتی که A و C هر دو بگویند که قسمت وسط بیشتر از همه است به مشکل برمی‌خورد.

مرجع سوال: ارائه‌ی الگوریتم در مورد cake cutting

۰ نظر موافقین ۰ مخالفین ۰ ۱۲ تیر ۹۳ ، ۰۷:۴۶
سپیده آقاملائی

http://www.cs.umd.edu/~hajiagha/AGT10/AGT14.html

با توجه به اینکه اسلایدهای اینجا از بقیه بهتر بود از این به بعد را از روی این جلو می‌رویم.

۰ نظر موافقین ۰ مخالفین ۰ ۱۰ تیر ۹۳ ، ۱۸:۳۷
سپیده آقاملائی

http://people.csail.mit.edu/costis/6896sp10/

۰ نظر موافقین ۰ مخالفین ۰ ۱۰ تیر ۹۳ ، ۱۷:۵۶
سپیده آقاملائی

http://www.sigecom.org/ec12/slides/Tutorial-bamd.pdf

۰ نظر موافقین ۰ مخالفین ۰ ۱۰ تیر ۹۳ ، ۱۷:۳۴
سپیده آقاملائی

مرجع: http://theory.stanford.edu/~tim/f13/l/l1.pdf

اهداف کلی نظریه الگوریتمی بازی‌ها:

۱- چطور سیستمی طراحی کنیم که با وجود شرکت کنندگان هوشمند، تضمین کارایی داشته باشد. (طراحی مکانیزم‌ها: علم قانون گذاری)

مثال: در مسابقه‌ی المپیک تنیس بانوان در سال ۲۰۱۲، ۴ تیم در ۴ گروه با هم مسابقه می‌دادند. مسابقه دو مرحله بود: مرحله‌ی اول هر تیم با هر تیم دیگر مسابقه می‌داد و مرحله‌ی بعدی حذفی بود. می‌خواهیم نشان دهیم مغایرت قانون و هدف شرکت کنندگان باعث شکست این سیستم می‌شود.

هدف بازیکنان برنده شدن بهترین مدال ممکن بود. هدف برگزارکنندگان مسابقه خوب بودن بازی‌ها، یعنی بیشترین تلاش برای بردن در هر مسابقه بود. اما در مسابقه‌ی فعلی بازنده شدن می‌تواند به سود بازیکن باشد.

در مرحله‌ی نیمه نهایی مسابقات ۴ تیم از هر گروه باقی می‌مانند و در نتیجه ۲ مسابقه برگزار می‌شود که نفرات اول-دوم و نفرات سوم-چهارم را مشخص می‌کند. سپس در مرحله‌ی نهایی دو مسابقه‌ی دیگر انجام می‌شود و برندگان نهایی مشخص می‌شوند.

اشکال: قوی‌ترین تیم در گروه اول است. تیم‌های گروه دوم هر کدام سعی می‌کنند ببازند تا با تیم ضعیف‌تر در مرحله نهایی مواجه شوند و مدال نقره را به دست بیاورند، چون مدال طلا که حتما به قوی‌ترین تیم می‌رسد.

۲- چه زمانی رفتار خودخواهانه نزدیک به بهینه است؟ (هزینه‌ی بی‌نظمی)

وقتی که ما قانون‌گذار نیستیم.

مثال: فرض کنید در s هستیم و می‌خواهیم به t برویم. دو مسیر وجود دارد: اولی ابتدا یک مسیر تنگ دارد که زمان طی کردن آن با ترافیک آن متناسب است و بعد یک مسیر بزرگتر دارد که زمان ثابت ۱ می‌برد. مسیر دومی برعکس آن است. پس زمان طی کردن هر مسیر 1+x است. پس مسیرها یکسان هستند و باید ترافیک بین آنها نصف شود. (فرض کنید x<=1 باشد). در نتیجه زمان هر مسیر ۱.۵ می‌شود.

اگر یک مسیر با زمان صفر در جهت نشان داده شده در شکل اضافه کنیم، مسافران چطور رفتار می‌کنند؟

طول مسیر گذرنده از یال جدید 2x است که همیشه کمتر از طول مسیرهای دیگر خواهد بود. به همین دلیل هر فردی این مسیر را انتخاب می‌کند چون در صورتی که ترافیک نباشد از همه سریعتر است، اما وقتی همه از این مسیر عبور کنند، زمان هر کدام از یالهای x برابر ۱ می‌شود و در نتیجه همه ۲ ساعت طول می‌کشد تا به مقصدشان برسند.

اگر مدیری باشد که افراد را ملزم به طی کردن مسیری خاص کند، می‌توان از این امر جلوگیری کرد. نسبت بهترین سیستم با افراد هوشمند و بهترین سیستم ممکن را هزینه‌ی بی‌نظمی price of anarchy می‌گویند. در این مثال خاص جواب بهینه مثل حالت قبل ۱.۵ است و جواب سیستم هوشمند ۲ است پس:

POA = 2/1.5 = 4/3

همه می‌دانند تعادل در سیستم بهینه نیست. ما سعی می‌کنیم روشی پیدا کنیم که POA تا حد امکان به ۱ نزدیک باشد.

مثال ۲: نخ و فنر

در شکل زیر یک سر نخ به میخ و سر دیگر آن به فنر وصل است. به سر دیگر فنر یک فنر دیگر وصل است که به آن یک وزنه‌ی سنگین وصل است. همچنین فنر اول به طور مستقیم به وزنه و فنر دوم به طور مستقیم به میخ با هر کدام با یک نخ شل وصل شده‌اند.

با فرض ایده‌آل بودن فنرها تغییر طول آنها با وزنه‌ای که به آنها آویزان است متناسب است. در این صورت این مسأله مشابه مثال قبل می‌شود که نیروی وارد شده به فنر معادل ترافیک و طول معادل زمان است. می‌توانیم طول فنرها را طوری انتخاب کنیم که وضعیت b حالت تعادل سیستم باشد.

در حالت اول فنرها سری هستند در نتیجه طول هر کدام زیاد است و متناسب با وزنه است. در حالت دوم که نخ محکم (که دو فنر را وصل می‌کرد) بریده شده است، فنرها موازی می‌شوند و نصف وزن روی هر کدام می‌افتد، در نتیجه طولشان نصف می‌شود.

این مثالی از کاربرد پارادوکس Braess است.

۳- پیچیدگی حالت تعادل: آیا بازیکنان یاد می‌گیرند؟

چطور بازیکنان به یک تعادل می‌رسند؟ (اصلاً می‌رسند؟)

حالت تعادل، حالتی در سیستم است که هر کس می‌خواهد همان طور که هست بماند. (وضعیت پایدار)

مثال: بازی سنگ-کاغذ-قیچی را در نظر بگیرید. در این بازی هیچ راه حل قطعی برای بردن وجود ندارد و هر حرکت می‌تواند به نفع هر کدام از بازیکن‌ها باشد. در زیر ماتریس دوتایی آن را می‌بینید: (یک بازیکن عمل روی سطرها و دیگری عمل روی ستونها را انجام می‌دهد و در هر خانه سود بازیکنها نوشته شده است.)

ایده‌ی von Neumann: اگر هر دو بازیکن به صورت تصادفی یکنواخت بازی کنند، دیگری نمی‌تواند ببرد. متوسط سود در این حالت صفر خواهد شد. به توابع تصادفی با این ویژگی تعادل نش می‌گویند.

در صورت تصادفی کردن هر بازی حتماً یک تعادل نش دارد.

قضیه نش: هر بازی با ماتریس دوتایی حتماً یک تعادل نش دارد.

هر بازی با تعداد بازیکن‌های متناهی یک تعادل نش دارد.

برای بازی‌ها با تعادل صفر می‌توان در زمان چندجمله‌ای تابع تعادل نش را به دست آورد. این کار را می‌توان با linear programming یا در صورت مجاز دانستن مقداری خطا، با الگوریتم‌های یادگیری ساده بازگشتی انجام داد.

هیچ راهی برای محاسبه‌ی تابع نش در بازی‌های غیر جمع-صفر (حالت کلی) وجود ندارد. (PPAD-hard)

اکثر بازی‌ها نیاز دارند که یک نفر (بازیکن یا طراح) تابع تعادل نش را بداند. 

۰ نظر موافقین ۰ مخالفین ۰ ۱۰ تیر ۹۳ ، ۱۴:۴۵
سپیده آقاملائی

سایت درس در استنفورد: http://theory.stanford.edu/~tim/f13/f13.html

سایت درس در شریف (قدیمی): http://www.ce.sharif.ir/courses/90-91/2/ce835-1

(کاربرد سایت شریف در تمرین‌ها است)

مراجع درس:

1. Algorithmic Game Theory, by Noam Nisan, Tim Roughgarden, Eva Tardos, Vijay V. Vazirani, 

2. A Course in Game Theory, by Martin J. Osborne

3. Networks, Crowds, and Markets, by David Easley and Jon Kleinberg

که مرجع اصلی که همان مرجع اول است را می‌توانید دانلود کنید:

http://www.cambridge.org/journals/nisan/downloads/Nisan_Non-printable.pdf

۰ نظر موافقین ۰ مخالفین ۰ ۱۰ تیر ۹۳ ، ۱۳:۱۷
سپیده آقاملائی