Selasa, 10 April 2018

Bentuk Normal dan Bentuk Luas (Ekstensive) dalam Permainan dan Permainan Dinamis Satu Kali

BAB 2

Teori Permainan Statis
Dalam bab ini kita akan melihat bagaimana permainan statis dapat direpresentasikan, dan memeriksa beberapa cara yang telah disarankan untuk bagaimana cara menyelesaikannya. Solusi untuk game adalah prediksi tentang apa yang akan dilakukan oleh setiap pemain dalam game tersebut. Dalam permainan statis para pemain membuat gerakan mereka dalam isolasi tanpa mengetahui apa yang telah dilakukan pemain lain. Ini tidak selalu berarti bahwa semua keputusan dibuat pada saat yang bersamaan, tetapi hanya seolah-olah keputusan dibuat pada saat yang bersamaan.
Contoh permainan statis adalah satu kali lelang, penawaran ditutup. Dalam jenis lelang ini, setiap pemain hanya mengajukan satu tawaran, tanpa mengetahui apa yang dimiliki pemain lain. Tawaran tertinggi kemudian diterima sebagai harga pembelian. Berbeda dengan permainan statis, permainan dinamis memiliki urutan-urutan bermain dan pemain mengamati cara pemain lawannya. Contoh permainan dinamis salah satunya disebut lelang Inggris. Dimana pemain secara terbuka menawar harga suatu objek. Dan tawaran akhir dan tertinggilah yang diterima sebagai harga pembelian.

2.1. Bentuk Normal dan Bentuk Ekstensif dalam Permainan.
Dalam teori permainan non-kooperatif ada dua cara alternatif di mana game dapat diwakili. Tipe pertama disebut permainan bentuk normal atau permainan bentuk strategis. Tipe kedua disebut permainan bentuk yang luas. Keduanya banyak digunakan di bidang ekonomi dan kita memeriksa masing-masing secara bergantian.

a.      Permainan Bentuk Normal.
Permainan bentuk normal adalah permainan apa saja yang dapat mengidentifikasi tiga hal berikut:

(i) Para pemain.
Pemain dalam permainan adalah individu yang membuat keputusan yang relevan. Agar ada interdependensi, kita harus memiliki setidaknya dua pemain dalam game. Di sebagian besar aplikasi yang kita lihat di sana hanya akan ada dua pemain. Dalam beberapa permainan "Nature" dianggap sebagai pemain lebih lanjut, yang berfungsi untuk menentukan hasil dari peristiwa acak tertentu, seperti cuaca atau "tipe" pemain dalam permainan.

(ii) Strategi yang tersedia untuk setiap pemain.
Strategi adalah deskripsi lengkap tentang bagaimana seorang pemain bisa memainkan permainan. Ini tidak selalu hanya daftar tindakan alternatif pemain. Sebaliknya itu menggambarkan bagaimana tindakan pemain tergantung pada apa yang dia amati pemain lain dalam permainan yang telah dilakukan. Sebagai contoh, jika saya berpikir tentang menjual mobil saya, maka tindakan saya terbatas untuk menjualnya atau menjaganya. Strategi yang saya pilih, memberi tahu saya bagaimana tindakan ini yang mungkin tergantung pada apa yang dilakukan orang lain. Jika seseorang menawarkan saya Rp. 50.000.000 atau lebih untuk mobil saya, saya pasti akan menjualnya. Jika mereka menawarkan saya kurang dari Rp. 50.000.000, maka saya tidak akan menjual mobil saya.
Dalam permainan dinamis seperti ini, satu set strategi pemain akan jauh lebih besar daripada tindakannya yang mungkin dilakukan. Dalam permainan statis, keduanya sama. Ini karena dalam keputusan permainan statis diambil dalam isolasi dan sehingga pemain tidak dapat membuat tindakan mereka tergantung pada apa yang dilakukan pemain lain. Dalam contoh saya mencoba menjual mobil saya, ini akan sesuai dengan permainan yang sangat aneh di mana saya harus menerima atau menolak tawaran seseorang tanpa mengetahui apa itu! Dalam hal ini, strategi saya sama dengan tindakan saya: menjual atau tidak menjual. (Dalam diskusi ini kita telah mengabaikan kemungkinan pemain mengadopsi strategi campuran. Ini akan dibahas nanti di bab ini.)

(iii) Imbalannya.
Imbalan adalah apa yang akan diterima pemain di akhir permainan bergantung pada tindakan semua pemain dalam permainan. Permainan bentuk normal menunjukkan imbalan untuk setiap pemain, kecuali sifat alami, untuk setiap kemungkinan kombinasi dari strategi yang tersedia. Ini kemudian diwakili dalam bentuk matriks atau matriks. Imbalannya ditentukan sehingga pemain dalam permainan selalu lebih memilih pembayaran yang lebih tinggi hingga lebih kecil. Misalnya, imbalan dapat sesuai dengan hadiah uang, seperti laba, atau utilitas yang diperoleh setiap pemain pada akhir permainan. Seorang pemain dikatakan rasional ketika ia berusaha memaksimalkan ganjarannya. Jika seorang pemain tidak memiliki tujuan ini, mereka dikatakan tidak rasional, karena mereka tidak bertindak untuk kepentingan diri sendiri.

Untuk membuat ide-ide yang dibahas lebih spesifik, kita akan melihat satu game statis terkenal yang disebut "The Prisoners’ Dilemma ". Dalam game ini polisi telah menangkap dua tersangka kejahatan. Namun mereka tidak memiliki bukti yang cukup untuk menghukum salah satu dari mereka kecuali setidaknya satu dari mereka mengakui. Polisi menahan kedua tersangka dalam sel terpisah dan menjelaskan konsekuensi dari tindakan yang mungkin mereka lakukan. Jika tidak mengakui maka keduanya akan dihukum karena pelanggaran ringan dan dijatuhi hukuman satu bulan penjara. Jika keduanya mengakui akan dikirim ke penjara selama enam bulan. Akhirnya, jika hanya satu dari mereka yang mengakui, maka tersangka itu akan segera dibebaskan sementara yang lainnya akan dijatuhi hukuman sembilan bulan penjara - enam bulan untuk kejahatan dan tiga bulan lagi karena menghalangi jalannya keadilan.
Deskripsi permainan di atas memenuhi tiga persyaratan permainan bentuk normal. Kita memiliki dua pemain, masing-masing memiliki dua strategi (yang dalam permainan statis ini sama dengan tindakan para tersangka, mengakui atau tidak mengakui), dan terdapat hadiah untuk setiap kemungkinan kombinasi strategi. Bentuk normal untuk game ini ditunjukkan pada Gambar 2.1. Imbalannya ditunjukkan sebagai angka negatif untuk kurungan penjara dalam hitungan bulan, untuk setiap hasil dan untuk setiap tersangka. Ini mengasumsikan bahwa setiap tersangka, jika rasional, berusaha untuk meminimalkan jumlah waktu yang dihabiskan di penjara. Dengan konvensi, pembayaran pertama yang tercantum di setiap sel mengacu pada pemain tersangka 1 dalam baris, dan hasil kedua mengacu pada pemain tersangka 2 dalam kolom.
Gambar 2.1 Permainan Dilema Tersangka pada Permainan Bentuk Normal

b.      Permainan Bentuk Ekstensif.
Dalam bentuk permainan yang luas, perhatian yang lebih besar ditempatkan pada waktu keputusan yang akan dibuat, serta pada jumlah informasi yang tersedia untuk setiap pemain ketika keputusan harus dibuat. Jenis permainan ini tidak diwakili dengan matriks tetapi dengan keputusan, atau permainan, pohon. Bentuk ekstensif untuk dilema tersangka ditunjukkan pada Gambar 2.2.
Gambar 2.2 Permainan Dilema Tersangka pada Permainan Bentuk Luas
Mulai di sebelah kiri diagram lingkaran terbuka mewakili keputusan pertama yang dibuat dalam game. Ini diberi label 1 untuk menunjukkan bahwa tersangka 1 yang membuat keputusan ini. Cabang-cabang yang keluar dari node awal ini mewakili tindakan yang tersedia untuk pemain pada saat itu dalam permainan.
Tersangka 1 dapat mengakui kejahatan atau tidak mengakuinya. Di ujung cabang ini ada simpul yang merepresentasikan keputusan tersangka 2. Sekali lagi tersangka ini dapat mengakui kejahatan atau tidak mengakui, seperti yang diberikan oleh cabang-cabang yang datang dari simpul keputusannya. Namun tersangka 2 membuat keputusan ini tanpa mengetahui apa yang telah dilakukan tersangka 1. Ini ditunjukkan dengan menggabungkan node keputusan tersangka 2 dengan garis putus-putus. Garis putus-putus ini menunjukkan bahwa simpul-simpul yang terhubung berada dalam kumpulan informasi yang sama. Ini berarti tersangka 2 tidak dapat membedakan mana dari dua simpul yang ada, pada saat keputusan ini dibuat. Ini karena dia tidak tahu apakah tersangka 1 mengakui atau tidak mengakui kejahatan. Akhirnya di akhir permainan kita mendapat imbalan untuk setiap pemain. Ini lagi-lagi tergantung pada apa yang telah dilakukan setiap tersangka dalam permainan, dan mereka tercantum dalam urutan pemain dalam gim, yaitu pembayaran tersangka 1 adalah yang pertama, dan pembayaran tersangka 2 adalah yang kedua.

Generalisasi dari Gambar 2.2 kita dapat menyatakan bahwa permainan formulir yang luas memiliki empat elemen berikut yang sama:

Akar.
Ini adalah posisi dalam permainan di mana salah satu pemain harus membuat keputusan. Posisi pertama, yang disebut node awal, adalah titik terbuka, semua sisanya diisi. Setiap node diberi label sehingga dapat mengidentifikasi siapa yang membuat keputusan.

Ranting.
Ini mewakili pilihan alternatif yang dihadapi orang tersebut, dan sesuai dengan tindakan yang tersedia.

Vektor.
Ini mewakili hadiah untuk setiap pemain, dengan hadiah yang tercantum dalam urutan pemain. Ketika kita mencapai hasil akhir permainan berakhir. Ketika vektor hasil ini adalah pengetahuan umum, permainan dikatakan sebagai salah satu informasi lengkap. (Informasi adalah pengetahuan umum jika diketahui oleh semua pemain, dan setiap pemain tahu itu diketahui oleh semua pemain, dan setiap pemain tahu bahwa diketahui bahwa semua pemain mengetahuinya, dan seterusnya tak terhingga.) Namun, jika pemain tidak yakin tentang hasil yang dapat diterima pemain lain, maka itu adalah permainan informasi yang tidak lengkap.

Kumpulan Informasi.
Ketika dua atau lebih node bergabung bersama dengan garis putus-putus, ini berarti bahwa pemain yang keputusannya tidak tahu node mana dia berada. Ketika ini terjadi, game ini dicirikan sebagai salah satu informasi yang tidak sempurna. Ketika setiap node keputusan adalah informasi sendiri mengatur permainan dikatakan menjadi salah satu informasi yang sempurna, karena semua pemain tahu hasil dari keputusan sebelumnya.     Asumsi mendasar dari teori permainan adalah bahwa struktur permainan adalah pengetahuan umum. Ini menempatkan tiga persyaratan khusus pada set informasi. Yang pertama adalah bahwa pemain selalu ingat apakah mereka telah pindah sebelumnya di dalam game. Namun, ini tidak berarti bahwa mereka selalu ingat keputusan apa yang mereka buat sebelumnya, hanya keputusan yang dibuat. Syarat kedua adalah node dalam set informasi yang sama memiliki pemain yang sama bergerak. Kondisi terakhir adalah simpul dalam kumpulan informasi yang sama memiliki kemungkinan tindakan yang sama dari mereka. Jika ini tidak benar, pemain dapat membedakan antara node dengan memeriksa tindakan yang tersedia. Sekali lagi generalisasi dari Gambar 2.2 kita dapat menyatakan satu persyaratan lebih lanjut yang selalu puas untuk permainan bentuk yang luas:
Setiap node memiliki setidaknya satu cabang yang menunjukkannya (beberapa tindakan tersedia untuk pemain) dan paling banyak satu cabang yang menunjuk ke dalamnya. (Simpul awal tidak memiliki cabang yang menunjuk ke sana.).
Ini berarti bahwa pada simpul mana pun kita mulai di sana, hanya ada satu jalur yang mungkin kembali ke simpul awal dan kita tidak pernah berputar kembali ke simpul yang kita mulai. Karena alasan ini, permainan bentuk yang luas selalu terlihat seperti pohon. Dari simpul awal kita selalu bercabang dan cabang tidak pernah tumbuh kembali ke dalam dirinya sendiri.
Kita sekarang telah melihat bahwa ada dua cara berbeda untuk mewakili permainan yang sama, baik sebagai permainan bentuk normal atau sebagai permainan bentuk yang luas. Bentuk normal memberikan jumlah minimum informasi yang diperlukan untuk menggambarkan permainan. Ini daftar pemain, strategi yang tersedia untuk setiap pemain, dan hasil yang dihasilkan untuk setiap pemain. Bentuk ekstensif memberikan detail tambahan tentang gim menyangkut waktu keputusan yang akan dibuat dan jumlah informasi yang tersedia untuk setiap pemain ketika setiap keputusan harus dibuat. Jelas kedua bentuk ini terkait erat dan kita dapat menyatakan dua hasil berikut:

Untuk setiap permainan bentuk yang luas ada satu dan hanya satu permainan bentuk normal yang sesuai.
Untuk setiap permainan bentuk normal ada, secara umum, beberapa permainan bentuk yang sesuai.

Alasan kurangnya ini korespondensi satu-ke-satu antara bentuk permainan normal dan permainan bentuk yang luas adalah bahwa, seperti yang dijelaskan di atas, permainan bentuk yang luas termasuk informasi tambahan. Ini menyiratkan bahwa berbagai bentuk yang berbeda dapat ditarik dari permainan bentuk normal yang sama, tergantung pada apa yang diasumsikan tentang rincian tambahan dari permainan ini.
Bab 3
Teori Permainan Dinamis.
Di bab sebelumnya kita fokus pada game statis. Namun untuk banyak aplikasi ekonomi penting, kita perlu memikirkan permainan yang dimainkan selama beberapa periode waktu, membuatnya dinamis. Permainan bisa dinamis karena dua alasan. Pertama, interaksi antar pemain itu sendiri dapat bersifat dinamis. Dalam situasi ini pemain dapat mengamati tindakan pemain lain sebelum memutuskan respons optimalnya. Sebaliknya gim statis adalah gim yang bisa dipikirkan pemain yang melakukan gerakannya secara bersamaan. Kedua, gim bersifat dinamis jika gim satu kali diulangi beberapa kali, dan pemain mengamati hasil dari gim sebelumnya sebelum bermain di kemudian hari. Pada bagian 3.1, kita mempertimbangkan game dinamis satu-off, dan di bagian 3.2 kita menganalisis game yang diulang.

3.1. Permainan Dinamis Satu kali.
Fitur penting dari semua permainan dinamis adalah bahwa beberapa pemain dapat mengkondisikan tindakan optimal mereka pada apa yang telah dilakukan pemain lain di masa lalu. Ini sangat meningkatkan strategi yang tersedia untuk pemain tersebut, karena ini tidak lagi setara dengan tindakan yang mungkin mereka lakukan. Untuk mengilustrasikan ini kita memeriksa dua periode permainan entri dinamis berikut, yang merupakan versi modifikasi dari gim statis yang digunakan dalam Latihan 2.4.
Ada dua perusahaan (A dan B) yang mempertimbangkan ya atau tidak untuk memasuki pasar baru. Sayangnya pasar hanya cukup untuk mendukung salah satu dari dua perusahaan. Jika kedua perusahaan memasuki pasar maka keduanya akan mengalami kerugian sebesar Rp. 10.000.000. Jika hanya satu perusahaan yang masuk ke pasar, perusahaan itu akan mendapat untung sebesar Rp. 50.000.000, dan perusahaan lain hanya akan mencapai titik impas. Untuk membuat dinamika permainan ini kita mengasumsikan bahwa perusahaan B mengamati apakah perusahaan A telah memasuki pasar sebelum memutuskan apa yang harus dilakukan. Permainan ini dapat diwakili oleh diagram form luas yang ditunjukkan pada Gambar 3.1.


Gambar 3.1 Permainan Entri Dinamis pada Bentuk Luas

Dalam periode waktu 1 perusahaan A membuat keputusannya. Hal ini diamati oleh perusahaan B yang memutuskan untuk masuk atau tetap keluar dari pasar pada periode 2. Dalam perusahaan game bentuk yang luas ini, simpul keputusan B adalah kumpulan informasi terpisah. (Jika mereka berada di kumpulan informasi yang sama mereka akan dihubungkan oleh garis putus-putus.) Ini berarti bahwa perusahaan B mengamati tindakan perusahaan A sebelum membuat keputusan sendiri. Jika kedua perusahaan itu membuat gerakan mereka secara bersamaan maka perusahaan B hanya memiliki dua strategi. Ini akan baik masuk atau tetap keluar dari pasar. Namun karena perusahaan B pada awalnya mengamati keputusan perusahaan A, keputusan itu dapat membuat keputusannya tergantung pada apa yang perusahaan A lakukan. Karena perusahaan A memiliki dua kemungkinan tindakan, dan begitu juga perusahaan B, ini berarti bahwa perusahaan B memiliki empat (2 x 2) strategi. Kita bisa daftar ini sebagai:

Selalu masuki pasar apa pun yang dilakukan perusahaan A.
Selalu berada di luar pasar apa pun yang dilakukan perusahaan A.
Lakukan hal yang sama dengan perusahaan A.
Lakukan kebalikan dari perusahaan A.

Menyadari bahwa perusahaan B sekarang memiliki empat strategi ini, kita dapat mewakili permainan di atas dalam bentuk normal. Ini ditunjukkan pada Gambar 3.2. Setelah mengkonversi bentuk permainan yang luas menjadi permainan bentuk normal, kita dapat menerapkan metode dua tahap untuk menemukan strategi murni Nash equilibria, seperti yang dijelaskan dalam bab sebelumnya. Pertama, kita mengidentifikasi strategi optimal masing-masing pemain dalam menanggapi apa yang mungkin dilakukan pemain lain. Ini melibatkan bekerja melalui setiap pemain secara bergantian dan menentukan strategi optimal mereka. Ini diilustrasikan dalam bentuk permainan normal dengan menggarisbawahi hasil yang relevan. Kedua, kesetimbangan Nash diidentifikasi ketika semua pemain memainkan strategi optimal mereka secara bersamaan.

Gambar 3.2 Permainan Entri Dinamis pada Bentuk Normal
Seperti yang ditunjukkan pada Gambar 3.2 permainan entri dinamis ini memiliki tiga strategi murni Nash equilibria. Dalam ketiga situasi ini setiap perusahaan bertindak secara rasional berdasarkan keyakinannya tentang apa yang mungkin dilakukan oleh perusahaan lain. Kedua perusahaan itu memaksimalkan laba mereka tergantung pada apa yang mereka yakini sebagai strategi perusahaan lain. Salah satu cara untuk memahami hasil yang mungkin ini adalah memikirkan perusahaan B yang membuat berbagai ancaman atau janji, dan tegas A bertindak sesuai dengan itu. Oleh karena itu kita dapat menafsirkan tiga equilibria Nash sebagai berikut:
1.      Perusahaan B mengancam untuk selalu memasuki pasar terlepas dari apa yang perusahaan A lakukan.
Jika perusahaan A percaya ancaman ini akan tetap keluar dari pasar.
2.      Perusahaan B berjanji untuk selalu menjauhi pasar terlepas dari apa yang perusahaan A lakukan. Jika firma A percaya janji ini, pasti akan memasuki pasar.
3.      Perusahaan B berjanji untuk selalu melakukan kebalikan dari apa yang perusahaan A lakukan. Jika firma A percaya bahwa janji ini akan masuk lagi ke pasar.

Dalam dua tindakan pertama Nash equilibria perusahaan B tidak tergantung pada apa yang dilakukan perusahaan lain. Di perusahaan ekuilibrium Nash yang ketiga, B memang mengadopsi strategi bersyarat. Sebuah strategi bersyarat adalah di mana satu pemain mengkondisikan tindakan mereka pada tindakan setidaknya satu pemain lain dalam gim. Konsep ini sangat penting dalam permainan berulang, dan dianggap lebih detail di bagian berikutnya.
Di masing-masing perusahaan kesetimbangan A bertindak secara rasional sesuai dengan keyakinannya. Namun analisis ini tidak mempertimbangkan mana dari keyakinannya itu sendiri rasional. Hal ini menimbulkan pertanyaan yang menarik, “Mungkinkah perusahaan A tidak mengabaikan beberapa ancaman atau janji perusahaan B sebagai hanya gertakan?” Hal ini menimbulkan masalah kredibilitas yang penting. Konsep kredibilitas datang ke pertanyaan "Apakah ancaman atau janji dapat dipercaya?" Dalam teori permainan, sebuah ancaman atau janji hanya kredibel jika dalam minat pemain untuk melaksanakannya pada waktu yang tepat. Dalam pengertian ini beberapa pernyataan perusahaan B tidak dapat dipercaya.
Sebagai contoh, perusahaan B dapat mengancam untuk selalu memasuki pasar terlepas dari apa yang perusahaan A lakukan, tetapi ini tidak kredibel. Hal ini tidak dapat dipercaya karena jika perusahaan A memasuki pasar maka perusahaan tertarik untuk tetap keluar. Demikian pula janji untuk selalu keluar dari pasar tidak dapat dipercaya karena jika perusahaan A tidak masuk maka itu adalah kepentingan perusahaan B untuk melakukannya. Dengan asumsi bahwa pemain itu rasional, dan bahwa ini adalah pengetahuan umum, tampaknya masuk akal untuk menganggap bahwa pemain hanya percaya pada pernyataan yang kredibel. Ini menyiratkan bahwa pernyataan luar biasa tidak akan berpengaruh pada perilaku pemain lain. Ide-ide ini dimasukkan ke dalam konsep ekuilibrium alternatif ke ekuilibrium Nash (atau penyempurnaannya) yang disebut subgame equilibrium Nash sempurna.

Sumber :


Tidak ada komentar:

Posting Komentar