Bagaimana Strategi Teori Permainan Meningkatkan Pengambilan Keputusan: Dilema tahanan,Pencocokan Uang

Teori permainan, studi tentang pengambilan keputusan strategis, menyatukan berbagai disiplin ilmu seperti matematika, psikologi, dan filsafat. Teori permainan ditemukan oleh John von Neumann dan Oskar Morgenstern pada tahun 1944 dan telah berkembang pesat sejak saat itu.

Pentingnya teori permainan untuk analisis dan pengambilan keputusan modern dapat diukur dengan fakta bahwa sejak tahun 1970, sebanyak 12 ekonom dan ilmuwan terkemuka telah dianugerahi Hadiah Nobel dalam Ilmu Ekonomi atas kontribusi mereka pada teori permainan. Teori permainan diterapkan di sejumlah bidang, termasuk bisnis, keuangan, ekonomi, ilmu politik, dan psikologi.

Memahami strategi teori permainan—baik yang populer maupun beberapa strategi yang relatif kurang dikenal—penting untuk meningkatkan keterampilan penalaran dan pengambilan keputusan seseorang di dunia yang kompleks.

Ringkasan:

Teori permainan adalah kerangka kerja untuk memahami pilihan dalam situasi di antara pemain yang bersaing.
Teori permainan dapat membantu pemain mencapai pengambilan keputusan yang optimal ketika berhadapan dengan aktor independen dan bersaing dalam pengaturan strategis.
Bentuk “permainan” umum yang muncul dalam situasi ekonomi dan bisnis adalah dilema tahanan, di mana pembuat keputusan individu selalu memiliki dorongan untuk memilih dengan cara yang menciptakan hasil yang kurang optimal bagi individu sebagai sebuah kelompok.
Ada beberapa bentuk permainan lainnya. Aplikasi praktis dari permainan ini dapat menjadi alat yang berharga untuk membantu analisis industri, sektor, pasar, dan interaksi strategis apa pun antara dua aktor atau lebih.

Dilema tahanan

Salah satu strategi teori permainan yang paling populer dan mendasar adalah dilema tahanan.

Konsep ini mengeksplorasi strategi pengambilan keputusan yang diambil oleh dua individu yang, dengan bertindak demi kepentingan terbaik masing-masing, berakhir dengan hasil yang lebih buruk daripada jika mereka bekerja sama satu sama lain sejak awal. Dalam dilema tahanan, dua tersangka yang ditangkap karena kejahatan ditahan di kamar terpisah dan tidak dapat berkomunikasi satu sama lain.

Jaksa memberi tahu Tersangka 1 dan Tersangka 2 secara terpisah bahwa jika dia mengaku dan bersaksi melawan yang lain, dia bisa bebas, tetapi jika dia tidak bekerja sama dan tersangka lainnya melakukannya, dia akan dihukum tiga tahun penjara. Jika keduanya mengaku, mereka akan mendapatkan hukuman dua tahun, dan jika tidak ada yang mengaku, mereka akan dihukum satu tahun penjara.

Sementara kerja sama adalah strategi terbaik untuk kedua tersangka, ketika dihadapkan pada dilema seperti itu, penelitian menunjukkan kebanyakan orang yang rasional lebih suka mengaku dan bersaksi melawan orang lain daripada diam dan mengambil kesempatan pihak lain mengaku. Diasumsikan para pemain dalam permainan itu rasional dan akan berusaha untuk memaksimalkan hasil mereka dalam permainan.

Dilema tahanan meletakkan dasar untuk strategi teori permainan tingkat lanjut, yang populer meliputi:

Pencocokan Uang

Ini adalah permainan zero-sum yang melibatkan dua pemain (sebut saja mereka Pemain A dan Pemain B) secara bersamaan menempatkan satu sen di atas meja, dengan pembayaran tergantung pada apakah penny cocok. Jika kedua sen adalah kepala atau ekor, Pemain A menang dan menyimpan sen Pemain B.

Jika tidak cocok, Pemain B menang dan menyimpan sen Pemain A.

Jalan buntu

Ini adalah skenario dilema sosial seperti dilema narapidana di mana dua pemain dapat bekerja sama atau membelot (yaitu tidak bekerja sama). Dalam kebuntuan, jika Pemain A dan Pemain B sama-sama bekerja sama, masing-masing mendapat imbalan 1, dan jika keduanya membelot, masing-masing mendapat imbalan 2.

Namun jika Pemain A bekerja sama dan Pemain B cacat, maka A mendapat imbalan dari 0 dan B mendapat hasil 3. Dalam diagram hasil di bawah ini, angka pertama dalam sel (a) sampai (d) mewakili hasil Pemain A, dan angka kedua adalah angka Pemain B:

Matriks Hasil Kebuntuan		Pemain B	Pemain B
		Bekerja sama	Cacat
Pemain A	Bekerja sama	(a) 1, 1	(b) 0, 3
	Cacat	(c) 3, 0	(d) 2, 2

Kebuntuan berbeda dari dilema tahanan di mana tindakan saling menguntungkan terbesar (yaitu kedua cacat) juga merupakan strategi yang dominan.

Strategi dominan untuk seorang pemain didefinisikan sebagai salah satu yang menghasilkan hasil tertinggi dari setiap strategi yang tersedia, terlepas dari strategi yang digunakan oleh pemain lain. Contoh kebuntuan yang sering dikutip adalah dua kekuatan nuklir yang mencoba mencapai kesepakatan untuk menghilangkan persenjataan bom nuklir mereka.

Dalam hal ini, kerja sama berarti mematuhi perjanjian, sedangkan pembelotan berarti mengingkari perjanjian secara diam-diam dan mempertahankan persenjataan nuklir. Hasil terbaik bagi salah satu negara, sayangnya, adalah mengingkari perjanjian dan mempertahankan opsi nuklir sementara negara lain menghilangkan persenjataannya karena ini akan memberi yang pertama keuntungan tersembunyi yang luar biasa atas yang terakhir jika perang pernah pecah di antara keduanya.

Pilihan terbaik kedua adalah membelot atau tidak bekerja sama karena ini mempertahankan status mereka sebagai kekuatan nuklir.

Kompetisi Conot

Model ini juga secara konseptual mirip dengan dilema tahanan dan dinamai ahli matematika Prancis Augustin Cournot, yang memperkenalkannya pada tahun 1838. Penerapan model Cournot yang paling umum adalah dalam menggambarkan duopoli atau dua produsen utama di pasar.

Misalnya, asumsikan perusahaan A dan B menghasilkan produk yang identik dan dapat menghasilkan jumlah yang tinggi atau rendah. Jika mereka berdua bekerja sama dan setuju untuk berproduksi pada tingkat rendah, maka pasokan yang terbatas akan menghasilkan harga produk yang tinggi di pasar dan keuntungan besar bagi kedua perusahaan.

Di sisi lain, jika mereka membelot dan berproduksi pada tingkat tinggi, pasar akan kebanjiran dan menghasilkan harga produk yang rendah dan akibatnya keuntungan yang lebih rendah untuk keduanya. Tetapi jika yang satu bekerja sama (yaitu berproduksi pada tingkat rendah) dan yang lainnya cacat (yaitu secara sembunyi-sembunyi berproduksi pada tingkat tinggi), maka yang pertama hanya akan mencapai titik impas sementara yang kedua menghasilkan laba yang lebih tinggi daripada jika keduanya bekerja sama.

Matriks hasil untuk perusahaan A dan B diperlihatkan (angka mewakili laba dalam jutaan dolar). Jadi, jika A bekerja sama dan berproduksi pada tingkat rendah sementara B cacat dan berproduksi pada tingkat tinggi, imbalannya adalah seperti yang ditunjukkan dalam sel (b)—titik impas untuk perusahaan A dan laba $7 juta untuk perusahaan B.

Matriks Pembayaran Conot		Perusahaan B	Perusahaan B
		Bekerja sama	Cacat
Perusahaan A	Bekerja sama	(a) 4, 4	(b) 0, 7
	Cacat	(c) 7, 0	(d) 2, 2

Permainan Koordinasi

Dalam koordinasi, pemain mendapatkan hasil yang lebih tinggi saat mereka memilih tindakan yang sama. Sebagai contoh, pertimbangkan dua raksasa teknologi yang memutuskan antara memperkenalkan teknologi baru yang radikal dalam chip memori yang dapat memberi mereka keuntungan ratusan juta, atau versi revisi dari teknologi lama yang akan menghasilkan lebih sedikit.

Jika hanya satu perusahaan yang memutuskan untuk melanjutkan dengan teknologi baru, tingkat adopsi oleh konsumen akan jauh lebih rendah, dan akibatnya, pendapatannya akan lebih sedikit daripada jika kedua perusahaan memutuskan tindakan yang sama. Matriks hasil ditunjukkan di bawah ini (angka mewakili keuntungan dalam jutaan dolar).

Jadi, jika kedua perusahaan memutuskan untuk memperkenalkan teknologi baru, mereka masing-masing akan memperoleh $600 juta, sementara memperkenalkan versi revisi dari teknologi lama akan menghasilkan masing-masing $300 juta, seperti yang ditunjukkan pada sel (d). Tetapi jika Perusahaan A memutuskan sendiri untuk memperkenalkan teknologi baru, itu hanya akan menghasilkan $150 juta, meskipun Perusahaan B akan menghasilkan $0 (mungkin karena konsumen mungkin tidak mau membayar untuk teknologinya yang sekarang sudah usang).

Dalam hal ini, masuk akal bagi kedua perusahaan untuk bekerja sama daripada bekerja sendiri.

Matriks Playoff Koordinasi		Perusahaan B	Perusahaan B
		Teknologi baru	Teknologi Lama
Perusahaan A	Teknologi baru	(a) 600, 600	(b) 0, 150
	Teknologi Lama	(c) 150, 0	(d) 300, 300

Permainan Kelabang

Ini adalah permainan bentuk ekstensif di mana dua pemain secara bergantian mendapat kesempatan untuk mengambil bagian lebih besar dari simpanan uang yang perlahan meningkat. Permainan kelabang bersifat berurutan karena para pemain bergerak satu demi satu, bukan secara bersamaan; setiap pemain juga mengetahui strategi yang dipilih oleh pemain yang bermain sebelum mereka.

Permainan diakhiri segera setelah pemain mengambil simpanan, dengan pemain tersebut mendapatkan porsi yang lebih besar dan pemain lain mendapatkan porsi yang lebih kecil. Sebagai contoh, asumsikan Pemain A pergi lebih dulu dan harus memutuskan apakah dia harus “mengambil” atau “menyerahkan” simpanan, yang saat ini berjumlah $2.

Jika dia mengambil, maka A dan B masing-masing mendapatkan $1, tetapi jika A lulus, keputusan untuk mengambil atau lulus sekarang harus dibuat oleh Pemain B. Jika B mengambil, dia mendapat $3 (yaitu simpanan sebelumnya sebesar $2 + $1) dan A mendapat $0.

Tetapi jika B lulus, A sekarang harus memutuskan apakah akan mengambil atau lulus, dan seterusnya. Jika kedua pemain selalu memilih untuk mengoper, mereka masing-masing menerima hadiah sebesar $100 di akhir permainan.

Inti dari permainan ini adalah jika A dan B sama-sama bekerja sama dan terus mengoper hingga akhir permainan, mereka mendapatkan pembayaran maksimum masing-masing $100. Tetapi jika mereka tidak mempercayai pemain lain dan mengharapkan mereka untuk “mengambil” pada kesempatan pertama, ekuilibrium Nash memprediksi para pemain akan mengambil klaim serendah mungkin ($1 dalam kasus ini).

Studi eksperimental telah menunjukkan, bagaimanapun, perilaku “rasional” ini (seperti yang diprediksi oleh teori permainan) jarang diperlihatkan dalam kehidupan nyata. Ini tidak mengherankan secara intuitif mengingat kecilnya pembayaran awal dibandingkan dengan yang terakhir.

Perilaku serupa oleh subjek eksperimen juga diperlihatkan dalam dilema pelancong.

Dilema Traveler

Permainan non-zero-sum ini, di mana kedua pemain berusaha untuk memaksimalkan pembayaran mereka sendiri tanpa memperhatikan yang lain, dirancang oleh ekonom Kaushik Basu pada tahun 1994. Misalnya, dalam dilema pelancong, sebuah maskapai penerbangan setuju untuk membayar kompensasi kepada dua pelancong untuk kerusakan pada item yang identik.

Namun, kedua pelancong secara terpisah diminta untuk memperkirakan nilai barang tersebut, dengan minimum $2 dan maksimum $100. Jika keduanya menuliskan nilai yang sama, maskapai akan mengganti masing-masing jumlah tersebut.

Namun jika nilainya berbeda, maskapai penerbangan akan membayar mereka dengan nilai yang lebih rendah, dengan bonus $2 untuk pelancong yang menuliskan nilai lebih rendah dan penalti $2 untuk pelancong yang menuliskan nilai lebih tinggi. Tingkat ekuilibrium Nash, berdasarkan induksi mundur, adalah $2 dalam skenario ini.

Tapi seperti dalam permainan kelabang, percobaan laboratorium secara konsisten menunjukkan sebagian besar peserta, secara naif atau sebaliknya, memilih angka yang jauh lebih tinggi dari $2. Dilema wisatawan dapat diterapkan untuk menganalisis berbagai situasi kehidupan nyata.

Proses induksi mundur, misalnya, dapat membantu menjelaskan bagaimana dua perusahaan yang terlibat dalam persaingan kejam dapat terus menurunkan harga produk dalam upaya untuk mendapatkan pangsa pasar, yang dapat menyebabkan mereka mengalami kerugian yang semakin besar dalam proses tersebut.

Pertempuran Jenis Kelamin

Ini adalah bentuk lain dari permainan koordinasi yang dijelaskan sebelumnya, tetapi dengan beberapa asimetri hasil. Ini pada dasarnya melibatkan pasangan yang mencoba mengoordinasikan acara malam mereka.

Sementara mereka telah sepakat untuk bertemu baik di permainan bola (pilihan laki-laki) atau di permainan (pilihan perempuan), mereka telah melupakan apa yang mereka putuskan, dan untuk menambah masalah, tidak dapat berkomunikasi satu sama lain. Kemana mereka harus pergi? Matriks hasil ditunjukkan di bawah ini dengan angka dalam sel yang mewakili tingkat kenikmatan relatif dari acara tersebut untuk masing-masing wanita dan pria.

Sebagai contoh, sel (a) mewakili hasil (dalam hal tingkat kesenangan) untuk wanita dan pria yang sedang bermain (dia lebih menikmatinya daripada dia). Sel (d) adalah hasil jika keduanya berhasil mencapai permainan bola (dia lebih menikmatinya daripada dia).

Sel (c) mewakili ketidakpuasan jika keduanya pergi tidak hanya ke lokasi yang salah tetapi juga ke acara yang paling tidak mereka sukai — wanita ke permainan bola dan pria ke permainan.

Battle of the Sexes Payoff Matrix		Pria	Pria
		Bermain	Permainan bola
Wanita	Bermain	(a) 6, 3	(b) 2, 2
	Permainan bola	(c) 0, 0	(d) 3, 6

Permainan Diktator

Ini adalah permainan sederhana di mana Pemain A harus memutuskan bagaimana membagi hadiah uang tunai dengan Pemain B, yang tidak memiliki masukan dalam keputusan Pemain A. Meskipun ini bukan strategi teori permainan semata , ini memberikan beberapa wawasan menarik tentang perilaku orang.

Eksperimen mengungkapkan sekitar 50% menyimpan semua uang untuk diri mereka sendiri, 5% membaginya secara merata dan 45% lainnya memberikan bagian yang lebih kecil kepada peserta lain. Permainan diktator terkait erat dengan permainan ultimatum, di mana Pemain A diberikan sejumlah uang, yang sebagian harus diberikan kepada Pemain B, yang dapat menerima atau menolak jumlah yang diberikan.

Tangkapannya adalah jika pemain kedua menolak jumlah yang ditawarkan, baik A maupun B tidak mendapatkan apa-apa. Permainan diktator dan ultimatum menyimpan pelajaran penting untuk isu-isu seperti pemberian amal dan filantropi.

Perang Damai

Ini adalah variasi dari dilema tahanan di mana keputusan “bekerja sama atau membelot” diganti dengan “perdamaian atau perang”. Sebuah analogi bisa berupa dua perusahaan yang terlibat dalam perang harga.

Jika keduanya menahan diri dari pemotongan harga, mereka menikmati kemakmuran relatif (sel a), tetapi perang harga akan mengurangi hasil secara dramatis (sel d). Namun, jika A terlibat dalam pemotongan harga (yaitu, “perang”) tetapi B tidak, A akan mendapatkan hasil yang lebih tinggi sebesar 4 karena mungkin dapat merebut pangsa pasar yang besar, dan volume yang lebih tinggi ini akan mengimbangi harga produk yang lebih rendah.

Matriks Hasil Perang Damai		Perusahaan B	Perusahaan B
		Perdamaian	Perang
Perusahaan A	Perdamaian	(a) 3, 3	(b) 0, 4
	Perang	(c) 4, 0	(d) 1, 1

Dilema Relawan

Dalam dilema sukarelawan, seseorang harus melakukan tugas atau pekerjaan demi kebaikan bersama. Hasil terburuk yang mungkin terjadi jika tidak ada yang menjadi sukarelawan.

Sebagai contoh, pertimbangkan sebuah perusahaan di mana penipuan akuntansi merajalela tetapi manajemen puncak tidak menyadarinya. Beberapa karyawan yunior di departemen akuntansi mengetahui penipuan tersebut tetapi ragu untuk memberi tahu manajemen puncak karena akan mengakibatkan karyawan yang terlibat dalam penipuan tersebut dipecat dan kemungkinan besar dituntut.

Dilabeli sebagai pelapor mungkin juga memiliki beberapa dampak di kemudian hari. Tetapi jika tidak ada yang menjadi sukarelawan, penipuan skala besar dapat mengakibatkan kebangkrutan perusahaan dan hilangnya pekerjaan semua orang.

Pertanyaan yang Sering Diajukan

Apa ‘Game’ yang Dimainkan dalam Teori Game?

Ini disebut teori permainan karena teori tersebut mencoba memahami tindakan strategis dari dua atau lebih “pemain” dalam situasi tertentu yang berisi aturan dan hasil yang ditetapkan. Sementara digunakan dalam sejumlah disiplin ilmu, teori permainan terutama digunakan sebagai alat dalam studi bisnis dan ekonomi.

Oleh karena itu, “permainan” dapat melibatkan bagaimana dua perusahaan pesaing akan bereaksi terhadap pemotongan harga oleh yang lain, jika suatu perusahaan harus mengakuisisi yang lain, atau bagaimana pedagang di pasar saham dapat bereaksi terhadap perubahan harga. Dalam istilah teori, permainan ini dapat dikategorikan mirip dengan dilema tahanan, permainan diktator, elang-dan-merpati, dan pertempuran jenis kelamin, di antara beberapa variasi lainnya.

Apa yang Dilema Tahanan Ajari Kita?

Dilema narapidana menunjukkan bahwa kerja sama sederhana tidak selalu demi kepentingan terbaik seseorang. Faktanya, saat berbelanja barang mahal seperti mobil, tawar-menawar adalah tindakan yang disukai dari sudut pandang konsumen.

Jika tidak, dealer mobil dapat mengadopsi kebijakan yang tidak fleksibel dalam negosiasi harga, memaksimalkan keuntungannya tetapi mengakibatkan konsumen membayar lebih untuk kendaraan mereka. Memahami imbalan relatif dari bekerja sama versus membelot dapat merangsang Anda untuk terlibat dalam negosiasi harga yang signifikan sebelum Anda melakukan pembelian besar.

Apa itu Nash Equilibrium dalam Game Theory?

Ekuilibrium Nash dalam teori permainan adalah situasi di mana seorang pemain akan melanjutkan strategi yang mereka pilih, tidak memiliki insentif untuk menyimpang darinya, setelah mempertimbangkan strategi lawan.

Bagaimana Bisnis Dapat Menggunakan Teori Permainan Saat Mereka Bersaing Satu Sama Lain?

Persaingan Conot, misalnya, adalah model ekonomi yang menggambarkan struktur industri di mana perusahaan saingan yang menawarkan produk identik bersaing dalam jumlah output yang mereka hasilkan, secara mandiri dan pada saat yang sama. Ini adalah permainan dilema tahanan yang efektif.

Kesimpulan

Teori permainan dapat digunakan dengan sangat efektif sebagai alat untuk pengambilan keputusan baik dalam situasi permusuhan, bisnis, atau pribadi.