Teori Permainan: Beyond the Basics: Giliran siapa sekarang?,Kesetimbangan Nash

Dengan menggunakan teori permainan, skenario dunia nyata untuk situasi seperti persaingan harga dan rilis produk (dan banyak lagi) dapat ditata dan hasilnya diprediksi. Perusahaan yang menggunakan (dan berpegang teguh pada) perangkat ini untuk menentukan Ekuilibrium Nash melihat manfaat besar dalam strategi penganggaran mereka.

Giliran siapa sekarang?

Sementara permainan berurutan dimainkan secara bergiliran, permainan simultan dimainkan dengan setiap pemain membuat keputusan pada saat yang bersamaan. Dengan permainan simultan, kami tidak lagi menggunakan metode pengenalan mundur yang umum.

Pendukung teori permainan sering mentabulasi hasil yang berbeda dalam apa yang disebut matriks (di bawah).

Pemain satu / Pemain dua	Kiri	Benar
Ke atas	(1, 3)	(4, 2)
Turun	(3, 2)	(3, 1)

Matriks ini disebut bentuk normal. Pilihan pemain satu ditampilkan di sumbu vertikal kiri dan pilihan pemain dua ditampilkan di sumbu horizontal atas.

Imbalan untuk setiap pemain berada di persimpangan yang sesuai dan ditampilkan sebagai berikut (pemain satu, pemain dua).

Kesetimbangan Nash

Nash Equilibrium adalah hasil yang dicapai, setelah tercapai, berarti tidak ada pemain yang dapat meningkatkan hasil dengan mengubah keputusan secara sepihak. Itu juga dapat dianggap sebagai “tidak ada penyesalan”, dalam arti bahwa setelah keputusan dibuat, pemain tidak akan menyesali keputusan tersebut dengan mempertimbangkan konsekuensinya.

Ekuilibrium Nash dicapai dari waktu ke waktu, dalam banyak kasus. Namun, begitu Ekuilibrium Nash tercapai, itu tidak akan menyimpang darinya.

Setelah kita mempelajari bagaimana menemukan Nash Equilibrium, lihatlah bagaimana pergerakan sepihak akan mempengaruhi situasi. Apakah itu masuk akal? Seharusnya tidak, dan itulah mengapa Ekuilibrium Nash digambarkan sebagai “tanpa penyesalan”.

Menemukan Nash Equilibria

Langkah Satu: Tentukan respons terbaik pemain satu terhadap tindakan pemain dua.
Saat memeriksa pilihan yang dapat memaksimalkan pembayaran pemain, kita harus melihat bagaimana pemain satu harus menanggapi setiap opsi yang dimiliki pemain dua.

Cara mudah untuk melakukannya secara visual adalah dengan menutupi pilihan pemain kedua. Pertimbangkan matriks yang digambarkan di awal artikel ini saat kami menerapkan metode ini.

Pemain satu / Pemain dua	Kiri	Benar
Ke atas	(1, -)	(4, -)
Turun	(3, -)	(3, -)

Pemain satu memiliki dua kemungkinan pilihan untuk dimainkan: “naik” atau “turun”. Pemain dua juga memiliki dua pilihan untuk dimainkan: “kiri” atau “kanan”.

Dalam langkah menentukan Ekuilibrium Nash ini, kami melihat respons terhadap tindakan pemain dua. Jika pemain kedua memilih untuk bermain “kiri”, kita dapat bermain “atas” dengan hasil 1, atau bermain “turun” dengan hasil 3.

Karena 3 lebih besar dari 1, kita akan menebalkan angka 3 yang menunjukkan pilihan untuk bermain “dibawah sini. Jika pemain kedua memilih untuk bermain “benar”, kita dapat memilih untuk bermain “naik” dengan imbalan 4 atau bermain “turun” dengan imbalan 3.

Karena 4 lebih besar dari 3, kita menebalkan 4 untuk menunjukkan opsi untuk bermain “up” di sini. Hasil yang dicetak tebal ditunjukkan di bawah ini pada matriks lengkap.

Pemain satu / Pemain dua	Kiri	Benar
Ke atas	(1, 3)	( 4 , 2)
Turun	( 3 , 2)	(3, 1)

Langkah Kedua: Tentukan respons terbaik pemain dua terhadap tindakan pemain satu.
Seperti yang kita lakukan sebelumnya dengan pembayaran pemain dua untuk pemain satu, kita akan menyembunyikan pembayaran pemain satu saat menentukan respons terbaik untuk pemain dua.

Pemain satu / Pemain dua	Kiri	Benar
Ke atas	(-, 3)	(-, 2)
Turun	(-, 2)	(-, 1)

Sama seperti ketika melihat pemain satu, setiap pemain memiliki dua pilihan untuk dimainkan. Jika pemain satu memilih untuk bermain “naik”, kita dapat bermain “kiri”, dengan hasil 3, atau “kanan”, dengan hasil 2.

Karena 3 lebih besar dari 2, kita cetak tebal 3 untuk menampilkan opsi untuk bermain “kiri” di sini. Jika pemain satu memilih untuk bermain “turun”, kita dapat bermain “kiri”, dengan hasil 2, atau “kanan”, dengan hasil 1.

Karena 2 lebih besar dari 1, kita menebalkan 2 yang menunjukkan opsi untuk bermain “tertinggal disini. Hasil yang dicetak tebal ditunjukkan di bawah ini pada matriks lengkap.

Pemain satu / Pemain dua	Kiri	Benar
Ke atas	(1, 3 )	(4, 2)
Turun	(3, 2 )	(3, 1)

Langkah Tiga: Tentukan hasil mana yang memiliki hasil yang berani. Hasil khusus itu adalah Nash Equilibrium.

Sekarang, kami menggabungkan opsi yang berani untuk kedua pemain ke dalam matriks penuh.

Pemain satu / Pemain dua	Kiri	Benar
Ke atas	(1, 3 )	( 4 , 2)
Turun	( 3 , 2 )	(3, 1)

Carilah persimpangan di mana kedua imbalannya dicetak tebal. Dalam hal ini, kami menemukan persimpangan (Bawah, Kiri) dengan hasil (3, 2) sesuai dengan kriteria kami.

Ini menunjukkan Ekuilibrium Nash kita. Metode menemukan Keseimbangan Nash ini sangat cocok untuk menemukan keseimbangan dalam permainan yang simultan karena kita melihat bagaimana seorang pemain akan merespons secara independen tentang bagaimana tindakan pemain lain.

Skenario permainan simultan ini sering dimainkan dalam bisnis seperti maskapai penerbangan. Di bawah ini adalah contoh, mirip dengan permainan di atas, tentang bagaimana penetapan harga maskapai dapat dimainkan.

Pembayaran dalam ribuan dolar. Ingat, ini adalah pembayaran, bukan harga.

Metode yang kami terapkan sebelumnya sudah diterapkan untuk menunjukkan di mana Nash Equilibrium muncul.

Maskapai satu / Maskapai dua	Harga rendah	Harga tinggi
Harga rendah	( 3.000 , 3.000 )	( 4.000 , 2.000)
Harga tinggi	(2.000, 4.000 )	(3.500, 3.500)

Melihat pilihan A1 saja kita dapat melihat bahwa jika A2 memilih untuk memainkan harga rendah, kita memilih antara harga rendah untuk 3.000 atau harga tinggi untuk 2.000. Kami memilih rendah, karena 3.000 > 2.000.

Kami melakukan hal yang sama untuk A2 bermain dengan harga tinggi dan melihat bahwa kami bermain rendah karena 4.000 > 3.500. Sebaliknya, melihat hanya pada pilihan A2, kita dapat melihat bahwa jika A1 memilih untuk bermain dengan harga rendah, kita memilih antara “harga rendah” untuk 3.000 dan “harga tinggi” untuk 2.000.

Karena 3.000 > 2.000, kami memilih opsi harga rendah di sini. Jika A1 bermain dengan harga tinggi, kita dapat menetapkan harga rendah 4.000 atau harga tinggi 3.500.

Sejak 4.000 > 3.500, kami memilih bermain dengan harga rendah di sini. Ekuilibrium Nash adalah bahwa kedua maskapai penerbangan akan membebankan harga rendah (ditampilkan saat pilihan untuk masing-masing pihak disorot).

Jika kedua maskapai mengenakan harga tinggi, mereka masing-masing akan lebih baik daripada di Nash Equilibrium. Jadi mengapa mereka tidak setuju untuk melakukan ini? Pertama, itu ilegal untuk berkolusi.

Kedua, jika ini terjadi, tindakan sepihak atas nama satu maskapai penerbangan untuk mengenakan harga rendah akan menguntungkan, sehingga maskapai tersebut menghasilkan lebih banyak uang pada gilirannya. Logika ini juga menunjukkan bagaimana Nash Equilibrium tercapai, dan mengapa tidak bermanfaat untuk menyimpang darinya setelah tercapai.

Ekuilibria Nash Berganda

Umumnya, bisa ada lebih dari satu keseimbangan dalam sebuah permainan. Namun, ini biasanya terjadi pada game dengan elemen yang lebih kompleks daripada dua pilihan oleh dua pemain.

Dalam permainan simultan yang diulang dari waktu ke waktu, salah satu dari beberapa kesetimbangan ini tercapai setelah beberapa percobaan dan kesalahan. Skenario pilihan yang berbeda dari waktu ke waktu sebelum mencapai ekuilibrium ini adalah yang paling sering dimainkan dalam dunia bisnis ketika dua perusahaan menentukan harga untuk produk yang sangat dapat dipertukarkan, seperti tiket pesawat atau minuman ringan.

Kesimpulan

Dengan metode canggih ini, lebih banyak situasi dunia nyata dapat dimodelkan dan dipecahkan. Berbagai jenis Nash Equilibria yang kita diskusikan adalah solusi yang paling umum ditemukan untuk game model dunia nyata.

Pengetahuan tentang teori permainan dapat membantu Anda membentuk strategi, baik bermain tic-tac-toe atau bersaing untuk mendapatkan keuntungan terbesar.