Inferensial Analisis Jaringan dengan eksponensial Acak
1. Pengantar
Selama beberapa dekade terakhir, para ilmuwan politik telah semakin tampak data relasional umumnya dan jaringan data specically untuk menjawab pertanyaan substantif penting. Namun, alat statistik untuk analisis data jaringan tidak terus berpacu dengan luas dan kompleksitas pertanyaan substantif yang diminta dari data tersebut. Karena metode yang dapat menampung saling ketergantungan yang kompleks belum tersedia, telah menjadi lumrah di banyak sub_elds ilmu politik untuk menggunakan alat statistik tradisional, seperti sebagai model linear umum, data jaringan. Pendekatan seperti selalu menghasilkan biasa hasil karena struktur proses menghasilkan data yang tidak dapat dimodelkan dengan alat yang menganggap kemerdekaan bersyarat pengamatan. Lebih buruk lagi, e_ects termodelkan dari struktur jaringan akan palsu dikaitkan dengan kovariat; sehingga makin meningkatkan-masalah yang kemampuan inferensi rusak. Meskipun ada beberapa pendekatan yang berguna untuk menganalisis relasional data, kita membahas area perhatian khusus bagi para ilmuwan politik: bagaimana membuat berisi kesimpulan tentang e_ects kovariat, dan bahkan memperhitungkan interdependen- sewenang-wenang kompleks lembaga-, ketika menganalisis jaringan politik. Tujuan kami di sini adalah untuk memperkenalkan dan memperbaiki sebuah model untuk inferensi data jaringan disebut Model Exponential Acak Grafik (ERGM) sedemikian rupa untuk membuatnya secara luas berguna untuk para ilmuwan politik. Kami empat kontribusi yang bahwa kami memperkenalkan ERGM dan mendiskusikan beberapa masalah yang saat ini diterapkan membatasi nya utilitas peneliti substantif, mengembangkan pedoman untuk menganalisis yang sangat padat dan jarang jaringan dengan ERGM, o_er solusi untuk ketidakmampuan saat ERGMs untuk model bujur gitudinally diamati jaringan, dan menunjukkan dengan cara contoh jaringan inferensi menggunakan ERGMs tidak hanya dapat menghindari kesimpulan yang salah pada kovariat, namun dapat memberikan wawasan baru ke masalah substantif.
Eksponensial model grafik acak (ERMG), telah berkembang dari serangkaian e_orts oleh
statistik dan sosiolog untuk mengatasi keterbatasan yang sama dari model statistik klasik yang telah frustrasi ilmuwan politik dengan menggunakan jaringan data. Dasar-dasar teoritis untuk ERGM awalnya diletakkan oleh Besag}) yang membuktikan bahwa ada kelas distribusi probabilitas yang konsisten dengan properti Markov yang nilai dari satu lokasi tergantung hanya pada nilai-nilai tetangga bersebelahan nya. Bangunan on}) pekerjaan Besag itu, Belanda dan Leinhardt ??) berasal keluarga eksponensial distribusi untuk jaringan. Pada tahun yang sama, Fienberg dan Wasserman A981) menempatkan paparan yang keluarga nential model dalam konteks model log-linear dan diperiksa masalah dengan estimasi kemungkinan model tersebut. Kelas ini model dan estimasi menyertai teknik yang dikembangkan lebih lanjut oleh Frank dan Strauss †) dan Strauss dan Ikeda) tapi tidak sampai Wasserman dan Pattison Ž) yang sepenuhnya umum ERGM adalah _rst berasal.
Dalam bentuk yang paling sederhana, yang ERGM memberikan semacam umum yang sama inferensi yang
ilmu politik terbiasa: variabel hasil diprediksi oleh beberapa independen variabel, hanya ada asumsi kemerdekaan diperlukan. Bayangkan variabel hasil menarik adalah hubungan aliansi antara kedua negara. Daripada mengasumsikan bahwa setiap negara memutuskan yang independen portofolio aliansi dari semua keputusan lain yang dibuat oleh semua negara-negara lain dan yang keputusan dalam portofolio aliansi suatu negara yang independen, ERGM menganggap jaringan hubungan aliansi, model probabilitas mengamati jaringan yang di atas yang lain jaringan kita bisa mengamati, dan memungkinkan analis untuk menarik kesimpulan tergantung pada hubungan diad dalam jaringan. Dalam kata lain, ERGM memungkinkan peneliti untuk melakukan analisis longgar mirip dengan regresi logistik pada data jaringan, tetapi di samping pemodelan e_ects kovariat, mereka dapat mengambil sebanyak ketergantungan jaringan memperhitungkan karena mereka melihat secara teoritis atau empiris 't. Alat yang ampuh dan fleksibel ini sangat mudah untuk memahami {meskipun mengharuskan kita untuk berpikir dengan cara yang mendasar di_erent tentang 1 Speci_cally, Besag}) membuktikan Hammersley-Cli_ord Teorema yang menunjukkan ini dalam konteks data spasial, tetapi teorema yang secara alami digeneralisasi untuk jaringan.
struktur data {dan karena sudah didukung oleh perangkat lunak, itu juga cukup mudah menggunakan. The ERGM adalah, seperti yang kita akan menunjukkan, luas berlaku untuk analisis relasional di politik sains dan sangat fleksibel dalam kemampuannya untuk model jaringan yang kompleks. Meskipun kerangka umum untuk ERGMs telah dikembangkan, ada tetap sejumlah masalah yang saat ini diterapkan membatasi kegunaan ERGMs bagi para ilmuwan politik, Kepala di antara yang ketidakmampuan mereka untuk model jaringan longitudinal diamati dan coding tantangan yang dapat mengubah makna substantif hasil ERGM. Kami mengusulkan solusi
untuk masalah ini masing-masing dan menunjukkan e_cacy mereka dengan data ilmu politik dari Politik Amerika dan hubungan internasional.
Kami bukan _rst telah memperhatikan bahwa memperlakukan data relasional sebagai independen adalah praktek bermasalah. Teori kualitatif dalam berbagai sub_elds telah membahas saling ketergantungan dence hubungan selama beberapa waktu dan teknik deskriptif untuk jaringan data sekarang cukup terkenal. Sedangkan disiplin secara keseluruhan belum menjauh dari regresi
data jaringan, banyak karya baru-baru ini telah berusaha untuk beradaptasi model regresi dengan net- Kerangka kerja (Baybeck dan Huckfeldt 2002; Crescenzi 2007; Fowler 2006; Franzese dan
Hays 2006; Lazer 2005; Maoz et al. 2006; Maoz 2009; Schneider et al. 2003; Scholz dan Wang 2006; Ward dan Ho_ 2007; Ahlquist dan Ward 2009). Kebanyakan e_orts untuk memperpanjang kerangka regresi dengan konteks jaringan telah melibatkan dimasukkannya statistik jaringan sebagai kovariat dalam analisis regresi. Sebagai salah satu contoh, Maoz )
model kejadian angka dua-tingkat conict, serta jumlah agregat tahunan perselisihan antar dari militer, sebagai fungsi dari karakteristik dari perdagangan internasional dan jaringan aliansi. Juga, Maoz et al. _) Menghitung nilai kesetaraan struktural untuk setiap angka dua dalam jaringan dan termasuk yang diestimasi sebagai kovariat dalam regresi logistik dari conict internasional. Pendekatan ini ke jaringan modeling, seperti yang diterapkan baik internasional hubungan dan politik Amerika, adalah penting dalam pengakuan akan pentingnya jaringan
karakteristik untuk hasil jaringan, tetapi karena berlaku regresi standar ke rekening untuk saling ketergantungan ini, tidak melakukan jauh dengan asumsi kemerdekaan.
Beberapa pendekatan yang menjanjikan juga telah dikembangkan dari metode statistik spasial
(Franzese dan Hays 2006; Ho_, Raftery dan Handcock 2002; Ho_ dan Ward 2004). Per- Barangkali pendekatan yang paling terlihat berdasarkan statistik spasial adalah ruang model jaringan laten
awalnya diusulkan oleh Ho_, Raftery dan Handcock _). Model ruang laten mengambil rekening dependensi jaringan dengan pemetaan setiap node untuk posisi di k berdimensi Uni Eropa-
ruang clidean. Posisi node dalam ruang laten ini kemudian dihubungkan kembali ke jaringan melalui asumsi bahwa lebih dekat dua node yang satu sama lain dalam ruang laten, semakin besar kemungkinan mereka untuk berbagi tepi. Sebuah regresi logistik kemudian e timasi dikawinkan mana, selain kovariat, jarak Euclidean antara setiap node dan setiap
simpul lainnya dikendalikan untuk. Sejak perkembangannya, pendekatan ruang laten sejak itu diterapkan conict internasional (Ward, Siverson dan Cao 2007) dan agak luas untuk
perdagangan, perlindungan kerja dan ekonomi politik internasional pada umumnya (Cao, Prakash dan Ward 2007; Ward dan Ho_ 2007; Ahlquist dan Ward 2009).
Ini bukan maksud kami di sini untuk pit ERGM terhadap pendekatan-pendekatan alternatif dan menemukan "metode untuk pemodelan saling ketergantungan yang kompleks, yang \ terbaik" \ terbaik pendekatan akan bervariasi oleh aplikasi berdasarkan substansi dan pencarian metode universal yang terbaik adalah
pemurah. Sebaliknya, kita berusaha untuk memperkenalkan dan memperluas ERGM sebagai pendekatan yang mungkin
berguna dalam banyak konteks. Kita mulai dengan menurunkan Model Exponential Acak Grafik dan membahas cara-cara di mana mengharuskan kita untuk berpikir di_erently tentang jaringan data, bagaimana memecahkan diad yang
masalah ketergantungan, dan beberapa keterbatasan model. Kami kemudian mengusulkan solusi baru untuk masalah yang sering dihadapi oleh para ilmuwan politik, tapi tidak dibahas secara sistematis dalam lainnya
literatur: apa yang harus dilakukan ketika jaringan bunga diamati dari waktu ke waktu. Kami menunjukkan yang ERGM dan proposal kami untuk menganalisis jaringan memanjang menggunakan dua contoh yang dipiliuntuk kedua arti-penting dan eksposisi: jaringan cosponsorship di Kongres AS dan conict jaringan dalam sistem internasional. Kami merasa bahwa ini adalah aplikasi ekspositoris baik
karena mereka membawa masalah dengan coding aturan untuk hubungan jaringan yang dapat fundamental mental mengubah makna analisis seseorang; jaringan cosponsorship cukup padat (Sangat saling berhubungan), membutuhkan pengenalan apa yang kita sebut jaringan \ menipis, "dan jaringan conict agak jarang, menunjukkan kemungkinan \ penebalan "jaringan. Melalui contoh-contoh ini, kami juga akan menunjukkan bahwa menggunakan ERGMs untuk model jaringan ini tidak hanya recti_es masalah Bias sering dijumpai dengan aplikasi yang salah dari Classi metode cal, tetapi juga dapat memberikan wawasan yang lebih substantif dan menyarankan baru teoritis pendekatan.
2 Eksponensial Acak Grafik Model (ERGMs)
Sebuah model statistik yang berguna untuk jaringan harus memenuhi dua kriteria utama. Pertama, harus menghindari asumsi bermasalah bahwa pengamatan relasional {pengamatan pada angka dua {adalah
bersyarat independen dari satu sama lain. Kedua, harus dalam beberapa cara memungkinkan untuk jaringan
struktur untuk dimodelkan. Idealnya, karakteristik yang terakhir ini akan sangat fleksibel, trans-
orangtua dan intuitif. Kami merasa bahwa kekuatan utama dari pendekatan ERGM untuk inferensial statistik dalam jaringan adalah bahwa hal itu satis_es kedua kriteria tersebut.
Dalam rangka untuk membangun model tanpa asumsi kemerdekaan diad, kita perlu berpikir dalam mode agak di_erent tentang proses menghasilkan data.
Kita bisa membangun fungsi kemungkinan untuk setiap vektor bunga Y tanpa asumsi kemerdekaan dengan mempertimbangkan Y menjadi pengamatan tunggal dari distribusi probabilitas multivariat. Jadi, bukannya
memikirkan tentang Y sebagai serangkaian nilai yang diambil dari distribusi univariat (seperti halnya untuk model regresi standar), kami menganggapnya sebagai hasil imbang tunggal dari distribusi multivariat
di mana banyak lainnya menarik (banyak realisasi lain dari jaringan) yang mungkin. Dalam lain kata-kata, ada distribusi multivariat dari mana jaringan menyadari ditarik. Jika Y adalah realisasi tunggal dari distribusi multivariat, kita tidak lagi harus menganggap kemerdekaan antara nilai-nilai Y dengan cara apapun. Kami akan tetap dapat menarik kesimpulan tentang tertentu diad, sehingga unit analisis tidak perlu berubah, namun pengobatan multivariat Y adalah lompatan konseptual yang diperlukan untuk menghindari masalah yang terkait dengan pelanggaran kemerdekaan.
Tantangan pemodelan kemudian bergeser dari membangun model hasil univariat, parameter yang diperkirakan dengan menggunakan pengamatan, untuk membangun model distribusi multivariat yang satu jaringan ditarik dan yang parameter diperkirakan dengan pengamatan tunggal. ERGMs memberikan pendekatan umum untuk membangun distribusi probabilitas ini. Untuk meresmikan intuisi yang diberikan di atas, kita mengikuti dan membangun derivasi dari kelas umum ERGMs disajikan oleh Park dan Newman _). Misalkan ada k statistik yang ; i = 1; : : : ; k yang dapat dihitung pada jaringan (atau grafik) G , Yang analis percaya a_ect kemungkinan mengamati G Statistik ini dapat mencakup langkah-langkah di- terconnectedness, timbal balik dalam jaringan diarahkan dan node atau angka dua tingkat nilai kovariat. The | parameter adalah bagaimana kovariat dan elemen struktur jaringan dimodelkan pada waktu yang sama. Sementara tinjauan rinci parameter jaringan yang mungkin untuk menyertakan luar ruang lingkup diskusi ini, pembaca yang tertarik disebut Handcock et al. _) Dan Snijders et al. _) Untuk pengobatan seperti itu. Satu satunya kondisi yang kita butuhkan adalah bahwa tidak ada bagian
dari | menjadi linear bergantung pada yang lain; dengan kata lain, tidak ada collinearity sempurna. Mengingat
N , Yang (_xed) jumlah node dalam G , Ada M mungkin set tepi atas N . Ini berarti bahwa jaringan diamati G adalah salah satu M mungkin jaringan dengan jumlah yang sama node yang bisa diamati. Hal ini menggambarkan asumsi bahwa diamati jaringan G muncul stokastik dari dukungan G M. Umum ERGM berasal menggunakan metode momen-matching. Kita mulai dengan membuat salah satu dari hanya dua asumsi yang diperlukan untuk ERGM: kita mengasumsikan bahwa setiap jaringan statistik dihitung pada grafik G adalah nilai-nilai yang diharapkan dari statistik tersebut di lain mungkin grafik:
di mana | adalah setiap statistik jaringan. Dengan kata lain, kita mengasumsikan bahwa nilai yang diharapkan dari saya
statistik jaringan adalah nilai-nilai mereka sebagai dihitung dari G .
Sementara ini mungkin tampak seperti kuat asumsi, satu harus diingat kenyataan bahwa, dalam banyak kasus, kita akan hanya mengamati satu realisasi jaringan (yaitu hanya ada satu menyadari kutipan jaringan Mahkamah Agung) dan nilai yang diamati dari statistik | sebenarnya indikasi terbaik dari yang diharapkan saya nilai
Namun distribusi lebih GM tidak sepenuhnya identi_ed pada saat ini. Selain pembatasan dibuat dalam persamaan 1, kita juga harus mengasumsikan bahwa hanya statistik termasuk dalam | inuence yang probabilitas bahwa grafik m diamati, P (Gm). Hal ini dilakukan dengan memaksimalkan Gibbs entropi, S =- pada distribusi diskrit grafik di Gm subyek dengan kondisi dalam persamaan 2. ini identi_es diskrit fungsi massa probabilitas atas jaringan di Gm menjadi sedekat mungkin dengan distribusi seragam diskrit sementara memuaskan kendala dalam persamaan 2. maksimalisasi ini dilakukan dengan menggunakan multiplier Lagrange
Metode. Sebagai akibat optimasi ini, kita dapat memulihkan formula elegan reecting relativitas yang tionship antara probabilitas grafik saya dan statistik jaringan di r
Dimana adalah vektor k parameter yang menggambarkan ketergantungan P (Gi) pada jaringan statistik dalam | (lihat Lampiran untuk derivasi penuh). Kami kemudian dapat memilih antara maksimum kemungkinan atau metode Bayesian untuk memperkirakan'S. Kekuatan dari pendekatan ERGM terletak pada kenyataan bahwa kita telah diturunkan parametrik yang bentuk distribusi bunga dari kondisi yang sangat umum. Satu-satunya asumsi kami telah membuat yang A) yang kita amati nilai-nilai yang diharapkan dari | dan B) yang kita telah identi_ed yang faktor yang inuence probabilitas mengamati setiap grafik yang diberikan. ERGMs sehingga memberikan Metode mampu memperkirakan e_ects kovariat standar serta e_ects jaringan lainnya properti tanpa harus membuat asumsi tentang kemerdekaan.
2.1 Menafsirkan ERGMs
Seperti halnya dengan model regresi standar, ada beberapa cara di mana orang dapat menafsirkan parameter estimasi dari ERGM. Kami fokus pada dua tingkat interpretasi: jaringan-tingkat dan angka dua tingkat. Pada jaringan-tingkat, sering akan menarik untuk mengkarakterisasi distribusi diharapkan dari statistik jaringan. Misalnya, distribusi jumlah tepi di conict sebuah jaringan penting jika ada yang tertarik dengan frekuensi yang diharapkan perang antarnegara. Itu tantangan adalah bahwa bentuk parametrik dari distribusi fungsi grafik tidak langsung dipulihkan. Hal ini karena parameter dari ERGM menggambarkan hubungan antara sifat-sifat jaringan bunga G dan probabilitas mengamati G . Itu parameter sehingga tidak secara langsung terkait dengan momen distribusi hasil
variabel (jaringan) karena mereka dalam model kemungkinan. Sejak ERGMs menghasilkan unik dan distribusi kompleks jaringan yang melibatkan setiap kemungkinan realisasi kombinasi tepi dengan jumlah yang sama dari node, ditutup bentuk manipulasi distribusi ini biasanya mungkin karena fakta bahwa M di penyebut persamaan 3 sering sejumlah besar. Dengan tidak adanya solusi bentuk tertutup, teknik simulasi memberikan langsung berarti dari mendekati distribusi statistik jaringan. Morris, Handcock dan Hunter (2008) mengembangkan algoritma untuk mensimulasikan jaringan dari distribusi tersirat oleh Parameter ERGM. Jadi jika ada yang tertarik dalam distribusi beberapa statistik ( - ) de_ned pada jaringan, perkiraan distribusi ini mudah didapat oleh simulasi sejumlah besar jaringan didasarkan pada parameter ERGM dan komputasi (-) untuk setiap jaringan (Morris, Handcock dan Hunter 2008; Handcock et al 2008.). Semakin besar jumlah simulasi, semakin akurat perkiraan tersebut. Setelah distribusi diperoleh, perkiraan karakteristik distribusi statistik jaringan dapat diperoleh dengan ringkasan statistik (misalnya apa varians dalam jumlah perang?). Tingkat diad penafsiran akan menjadi yang paling akrab bagi ilmuwan politik seperti mirip dengan hasil dari regresi logistik. Pada angka dua tingkat, kuantitas kepentingan utama di sebagian besar jaringan adalah kemungkinan keberadaan tepi tertentu (misalnya bagaimana mungkin itu bahwa ada perang antara AS dan Kanada?). Probabilitas tepi antara node saya dan j ditulis,
dimana n adalah jumlah node, menunjukkan semua diad selain Yij . K adalah jumlah statistik jaringan di ERGM, dan adalah jumlah dimana perubahan ketika Yij toggle dari 0 ke 1 (Goodreau, Kitts dan Morris 2009). Menggunakan persamaan 4 kita dapat menghasilkan probabilitas diprediksi untuk tepi dalam jaringan. Perhatikan bahwa probabilitas diprediksi
tidak dapat diproduksi tanpa termasuk ; ini adalah keberangkatan besar dari perhitungan dari prediksi probabilitas dalam logit atau probit model yang. Dimasukkannya diperlukan karena di ERGMs, Pr () adalah deterministik tergantung pada hasil angka dua bijaksana setiap lain angka dua. Di_erences nya samping, persamaan 4 mendapat sedekat mungkin dengan jenis penafsiran yang biasa dengan model logit dan tidak mewakili keberangkatan utama dari semacam interpretasi _eld yang terbiasa. Ketika kovariat termasuk dalam model kemungkinan standar, varians dalam hasil atau variabel dependen kemunduran pada varians dalam variabel independen. Tapi di kasus ERGM, tidak ada varians dalam variabel dependen (jaringan, mengingat, adalah pengamatan tunggal).
Dalam rangka untuk memperkirakan inuence kovariat, ERGMs mengeksploitasi Variasi hipotetis melalui jaringan yang terkandung dalam penyebut persamaan 3. Untuk setiap jaringan dihitung dalam persamaan 3, jumlah dari nilai-nilai kovariat untuk setiap tepi yang ditambahkan (Mencatat bahwa tepi yang ada mengatur perubahan untuk setiap jaringan). Parameter yang sesuai untuk kovariat speci_c kemudian memberitahu kami jika probabilitas mengamati grafik meningkat atau menurun sebagai jumlah dari nilai kovariat untuk semua diad terhubung meningkat. Sebuah positif nilai parameter menunjukkan bahwa grafik di mana diad yang terhubung memiliki kovariat tinggi nilai-nilai yang sangat mungkin untuk diamati relatif terhadap grafik mana diad terhubung memiliki rendah nilai kovariat. Interpretasi dari parameter kovariat mirip dengan regresi kasus. Parameter dihargai positif berarti ada kemungkinan bahwa nilai-nilai kovariat tinggi sesuai untuk diad terhubung dan parameter negatif dihargai berarti ada kemungkinan bahwa kovariat rendah nilai sesuai dengan diad terhubung.
2.2 Keterbatasan ERGMs
Meskipun ERGM adalah model yang kuat dan fleksibel, itu su_ers dari sejumlah keterbatasan yang dapat menghambat utilitas untuk peneliti. Keterbatasan utama dari ERGM adalah: masalah degenerasi, ketidakmampuan untuk model jaringan dari waktu ke waktu, kepekaan terhadap data yang hilang, kemampuan terbatas untuk model jaringan dengan tepi non-biner, dan (terkait) fakta bahwa yang ideal coding aturan untuk tepi sering tidak jelas. Kami membahas sebagian dari keterbatasan ini di sini; di beberapa kasus, kami berpendapat bahwa kelemahan yang tidak membatasi mereka mungkin tampak. Kami memesan diskusi tepi biner / coding masalah aturan dan masalah analisis memanjang untuk bagian 4.1 dan 4.2 masing-masing sebagai kami mengusulkan solusi speci_c untuk masalah tersebut. Degenerasi adalah masalah estimasi terkait dengan model yang 't data buruk. Pada dasarnya, degenerasi hasil dari speci_cation dari model yang sangat tidak mungkin untuk memiliki dihasilkan jaringan, bahwa ERGM tidak dapat dihitung. Degenerasi terjadi ketika Model benjolan semua atau sebagian dari massa probabilitas hanya pada satu atau grafik beberapa kemungkinan. Di kebanyakan kasus degenerasi, massa probabilitas proporsional ditempatkan baik di lengkap (Terhubung penuh) atau kosong (tidak berhubungan sama sekali) jaringan (Handcock 2003).
Setelah ERGM telah speci_ed, diperkirakan menggunakan rantai Markov Monte Carlo, tapi merosot atau model merosot dekat menyebabkan masalah dalam proses estimasi (lihat Snijders _) untuk
penjelasan rinci). Jika model tidak baik speci_ed, probabilitas diperkirakan akan berjalan rantai untuk grafik ekstrim semua atau tidak ada tepi, di mana ia akan tinggal, dan model ini dikatakan merosot. Sementara degenerasi bisa membuat frustasi, itu tidak selalu menjadi gangguan besar di diterapkan penelitian. Karena model yang sangat tidak mungkin telah menghasilkan jaringan akan
merosot, degenerasi adalah, dalam arti, pernyataan tentang model 't. Hal ini tentu harus tidak diartikan bahwa model yang diberikan _ts baik hanya karena tidak merosot, tetapi model yang merosot pasti tidak 't baik. Sejak termasuk parameter atau variabel yang berkontribusi tidak ada informasi yang berarti untuk prediksi jaringan hasil akan biasanya menyebabkan degenerasi, kita harus berpikir hati-hati tentang komponen model untuk diperkirakan dan kadang-kadang pencarian speci_cation mungkin diperlukan. Standar cukup tidak seperti model regresi, ERGMs dengan satu set \ standar kontrol "yang melakukan apa-apa untuk memprediksi
hasilnya akan menyebabkan masalah degenerasi dan dengan demikian tidak boleh speci_ed. Mayor
\ Kelemahan "dari ERGMs kemudian adalah kenyataan bahwa model seseorang harus benar-benar 't data cukup baik; tidak banyak keterbatasan dalam pendapat kami. Itu wajar untuk mempertimbangkan frustrasi sesekali peneliti mungkin mengalami dengan Model degenerasi terhadap kenyamanan kerangka regresi tradisional. Fundamentalisme yang tal masalah di sini adalah apakah orang harus lebih pelanggaran asumsi kemerdekaan dengan sebuah MLE dihitung untuk model yang menghasilkan kesalahan ketika erlalu misspeci_ed. Kita merasa degenerasi yang benar-benar membantu analis ERGM dalam hal ini dalam hal ini akan mengembalikan error degenerasi sebelum kembali hasil untuk model tidak informatif. Dengan kata lain, logistik regresi data jaringan membuatnya cepat dan mudah untuk _nd jawaban {termasuk salah Jawabannya {sedangkan peneliti menggunakan ERGMs sesekali mungkin _nd bahwa mereka harus mengubah yang speci_cation model mereka dalam rangka untuk menentukan model yang _ts data cukup baik menjadi diduga. Kelemahan potensial lain dari pendekatan ERGM ke jaringan pemodelan adalah sebagai-dalam sangkaan bahwa statistik jaringan yang sesuai untuk memasukkan dalam model diketahui. Sementara asumsi ini tidak di_erent di alam daripada asumsi \ speci_cation benar " dibuat dalam model gaya regresi, beberapa mungkin mengklaim bahwa di_culty dari surmounting ini rintangan yang magni_ed oleh fakta bahwa para ilmuwan politik jarang memiliki harapan teoritis tentang jaringan struktur seperti segitiga ditutup, timbal balik, transitivitas, atau lainnya segudang statistik jaringan yang dapat dimasukkan dalam speci_cation ERGM. Kami melihat kritik ini sebagai decreasingly valid. Hal ini tentu hal yang ilmu politik beberapa teori eksplisit berbicara dengan statistik jaringan, tetapi sejarah tidak berteori tentang jaringan Struktur bukan alasan untuk membuang struktur jaringan selain tidak secara teoritis berguna. Memang, sejumlah teori {seperti keseimbangan kekuasaan dan segala macam permainan strategis {im- ply peran struktur jaringan. Teori Selain itu, beberapa studi terbaru telah merumuskan yang menghasilkan harapan speci_c untuk struktur jaringan tertentu. Sebagai contoh, Cranmer,
Desmarais dan Kirkland _) mengembangkan teori keuntungan sinergis dalam utilitas dari triadic penutupan dalam jaringan aliansi dan kemudian _nd penutupan triadic menjadi sopir empiris penting pembentukan aliansi. Singkatnya, kami menyadari bahwa teori jaringan hubungan internasional saat ini tidak di mana-mana, tetapi mengandaikan bahwa teori tersebut tentu mungkin dan memang _eld mungkin bergerak ke arah itu. Data yang hilang juga dapat sangat bermasalah dalam konteks jaringan. Speci_cally, di- perbedaan tentang pentingnya parameter kovariat atau struktural dapat diubah oleh hilang nilai-nilai tepi; dalam kasus-kasus tertentu, sejumlah kecil data yang hilang dapat memiliki diucapkan e_ects. Di beberapa cara, ini tidak di_erent dari masalah data hilang dihadapi dalam tradisional
Kerangka regresi: sejumlah kecil missingness (terutama hilang pengamatan untuk peristiwa langka) dapat telah diucapkan e_ects pada inferensi (Rubin 1976;. King et al, 2001). Dimana tantangan data yang hilang adalah magni_ed untuk ERGMs adalah bahwa beberapa imputasi e_ective adalah lebih di_cult untuk mencapai daripada bagi model yang mempertahankan persegi panjang tradisional struktur data. Salah satu pilihan untuk memecahkan masalah ini adalah dengan menggunakan beberapa imputasi di tepi-daftar (dyadic) representasi dari jaringan. Satu bahkan dapat menghitung deskriptif statistik jaringan pada tingkat simpul {seperti sentralitas, betweenness dan sebagainya {dan termasuk mereka dalam model imputasi. Ini adalah solusi sempurna namun karena dependensi dari struktur jaringan tertentu tidak bisa diperhitungkan. Ini adalah masalah terbuka yang bekerja baru pada inferensi dengan jaringan sampel berupaya untuk mengatasi (Handcock dan Gile akan datang), tetapi tetap bermasalah dari perspektif diterapkan.
3 Estimasi ERGM
Parameter dalam bentuk persamaan 3, ERGM memiliki keluarga eksponensial bentuk logging fungsi kemungkinan, dan sebagai hasilnya, permukaan log-kemungkinan secara global cekung di pasien yang parameter-(van Duijn, Gile dan Handcock 2009). Ini adalah setup ideal untuk Newton-Raphson
Jenis maksimalisasi fungsi kemungkinan untuk _nd parameter, tetapi tantangan muncul dalam kenyataan bahwa perhitungan yang tepat dari fungsi kemungkinan adalah de- terlalu komputasi Manding untuk sebagian besar jaringan dan statistik jaringan () dari kepentingan praktis. Seperti yang bisa dilihat di penyebut persamaan 3, perhitungan fungsi kemungkinan membutuhkan penjumlahan atas semua kemungkinan con_gurations jaringan. Untuk jaringan diarahkan dengan n node, ini merupakan 2 () jaringan. Sebuah jaringan dengan hanya 9 node dapat mengasumsikan 68719476736 con_gurations, sejumlah yang meningkatkan oleh perkalian faktor 1073741824 jika num yang ber node meningkatkan ke 12. Tak perlu dikatakan, dalam rangka untuk memperkirakan ERGM pada jaringan 100-200 node, fungsi kemungkinan harus didekati. Dua metode kira mation telah menemukan aplikasi biasa dalam literatur {pseudolikelihood maksimum (Frank dan Strauss 1986) dan Markov Chain Monte Carlo (MCMC) kemungkinan maksimum (Geyer dan Thompson 1992). Pendekatan MCMC saat ini default untuk sebagian besar perangkat lunak paket dan merupakan bentuk maksimal simulasi kemungkinan. Metode ini berulang dan Algoritma bekerja sebagai berikut: dalam optimasi iterasi yang diberikan, jumlah dalam penyebut fungsi kemungkinan didekati menggunakan serangkaian jaringan sampel dari distribusi yang tion parameter dengan parameter yang dimaksimalkan kemungkinan menggunakan sebelumnya sampel jaringan. Optimasi berulang ini berlangsung sampai ada sedikit perubahan dalam perkiraan nilai fungsi likelihood. Kovarians matriks parameter kemudian dihitung sebagai kebalikan dari Hessian negatif dari fungsi log-likelihood. Pseudocode untuk algoritma MCMC-MLE di Geyer dan Thompson Š), yang merupakan algoritma yang digunakan dalam paket perangkat lunak yang paling untuk estimasi ERGM, diberikan dalam _gure 1.
Teknik pseudolikelihood adalah metode pendekatan analitik. Sendi likeli- kap ikatan dalam jaringan diganti dengan produk di atas probabilitas bersyarat masing-masing dasi diberikan ikatan lain dalam jaringan. Artinya, untuk keunggulan diberikan ij , Tepi-bijaksana probabilitas dasi (pij) diberikan dalam persamaan 4. The pseudolikelihood maksimum adalah com- puted dengan menggunakan algoritma bukit-mendaki ke _nd vektor parameter yang memaksimalkan log (). Hal ini sangat nyaman di bahwa hal itu dapat dihitung dengan menggunakan logis- standar software regresi tic, dengan kovariat diad dan statistik perubahan jaringan menyusun matriks desain. Seperti dengan metode MCMC, sebuah matriks kovarians perkiraan untuk yang pseudolikelihood maksimum dibentuk dengan membalik matriks informasi diamati (yaitu varians sampel asimtotik dari estimator regresi logistik digunakan untuk menghitung pseudolikelihood). Sebagai dua metode pendekatan, ada pro dan kontra terkait dengan setiap ap- proach. Keuntungan dari pendekatan MCMC adalah bahwa dalam batas (dengan jumlah in_nite dari menarik dari distribusi jaringan), menghasilkan perkiraan setara dengan MLE. Itu kerugian dari teknik ini adalah bahwa jumlah menarik harus _nite, perhitungan dapat membuktikan cukup di_cult untuk jaringan besar dan {karena simulasi digunakan {dua analis dapat menghasilkan hasil di_erent ketika melakukan penelitian yang sama. Untuk pseudolikelihood yang Pendekatan, perhitungan biasanya cepat dan konvergensi tertentu, tetapi ada beberapa beton Hasil yang mencirikan tingkat bias atau kehilangan e_ciency diinduksi dengan mengganti sendi kemungkinan dengan produk lebih conditional. Estimasi MCMC telah disukai di baru-baru ini analisis, meskipun tidak tanpa pengecualian (lihat misalnya Faust dan Skvoretz € 2), Saul dan Filkov(2007) dan Danny, Choudhury dan Bilmes)). van Duijn, Gile dan Handcock) melakukan percobaan Monte Carlo untuk membandingkan pseudolikelihood dan MCMC metode; mereka _ndings mendukung dominasi terbaru dari MCMC-MLE. Untuk statistik jaringan, mereka _nd bahwa pseudolikelihood maksimum adalah 60 {80% sebagai e_cient sebagai MCMC-MLE, dan untuk kovariat eksogen e_ects itu 80-95% sebagai e_cient sebagai MLE2. Lebih mengkhawatirkan bagi tugas pengujian hipotesis adalah _nding bahwa interval con_dence berasal dari terbalik 2 E_ciency diukur sebagai kebalikan dari mean kuadrat kesalahan estimasi parameter dalam Monte Carlo percobaan.
informasi _sher diamati bias menggunakan pseudolikelihood, tapi tidak dengan MCMC. Speci_cally, mereka _nd bahwa probabilitas cakupan untuk nominal 95% interval con_dence hanya 74,6% untuk statistik yang menangkap pengelompokan dalam jaringan. Dalam aplikasi _rst bawah ini, kami menggunakan MCMC, yang diimplementasikan dalam R paket ergm (Handcock et al. 2010), dan dalam aplikasi kedua kami mengadaptasi pendekatan pseudolikelihood untuk estimasi vektor tunggal parameter ERGM yang mencakup beberapa realisasi dari jaringan yang sama.
4 Aplikasi
Kami sekarang mempertimbangkan dua aplikasi dari ERGMs data ilmu politik. Kami telah memilih aplikasi ini karena mereka memungkinkan kita tidak hanya untuk lebih menggambarkan metode yang kita miliki dijelaskan di atas, tetapi juga karena masing-masing kekuatan kita untuk bergulat dengan di_erent (dan umum) Masalah diterapkan kami belum ditangani speci_cally atas: apa yang harus dilakukan ketika jaringan baik padat dan dihargai (yaitu tepi dapat mengasumsikan nilai lebih dari 0 dan 1) dan bagaimana bekerja dengan beberapa realisasi dari jaringan tertentu. Terakhir, kami berharap bahwa di_erent yang sub_elds dari mana aplikasi yang diambil akan menunjukkan penerapan luas ERGMs dalam ilmu politik.
Untuk masing-masing aplikasi, kami berjalan melalui proses speci_cation dan-pertimbangan yang negosiasi yang masuk ke dalamnya dari awal sampai akhir lebih sebagai peneliti akan di o_ce mereka daripada pembaca terbiasa melihat di media cetak. Hal ini dilakukan secara ketat untuk eksposisi.
4.1 Menganalisis Jaringan Cross-Sectional:
Cosponsorship di Kongres AS Aplikasi _rst kami diambil dari politik Amerika dan meluas ide yang dikembangkan oleh Fowler 2008). Di Kongres AS, legislator umumnya mensponsori undang-undang yang disponsori oleh lainnya legislator.3 Jaringan cosponsorship diwujudkan bila kita menganggap cospon- legislator ini sorship undang-undang lain legislator untuk menjadi keunggulan antara dua legislator. Ini berharga mencatat bahwa ada beberapa perbedaan pendapat tentang makna yang tepat dari dasi cosponsorship: beberapa berpendapat bahwa itu merupakan sinyal dari cosponsor dukungan untuk subjek soal undang-undang (Kessler dan Krehbiel 1996). Lain berpendapat bahwa itu merupakan menunjukkan dukungan dari satu legislator yang lain (Fowler 2006). Sementara itu berada di luar ruang lingkup aplikasi ini untuk memilah-milah arti yang tepat dari dasi cosponsorship, kami percaya bahwa kami dapat menghapus masalah de_nitional dengan melihat dasi cosponsorship sebagai bentuk kedekatan antara dua legislator; apakah mereka setuju dengan hal kebijakan atau politik, dasi cosponsorship merupakan indikasi keterlibatan aktif antara legislator.
Kami memeriksa jaringan cosponsorship menggunakan data dari (Fowler 2006).4
Dataset ini mencatat cosponsorship dan sponsor dari setiap tagihan di DPR AS dan Senat untuk 93 melalui kongres ke-109. Tepi dari legislator I untuk legislator j dalam jaringan adalah jumlah kali legislator I memiliki cosponsored legislator j . Perhatikan bahwa jaringan
diarahkan dan bahwa nilai tepi adalah bilangan bulat non-negatif. Ketika melakukan analisis, kita cepat disajikan dengan masalah teknis. Dalam sesi Kongres, interval waktu yang kita gunakan untuk de_ne sebuah instance dari jaringan cosponsorship, adalah mungkin bahwa setiap cosponsors perwakilan lain banyak kali. Hal ini bermasalah karena dua alasan. Pertama, ERGM hanya dikembangkan untuk han- hubungan biner dle, jadi kita tidak bisa menggunakan teknologi ERGM untuk model jumlah kali setiap cosponsors perwakilan lain dalam sesi. Banyak alat untuk analisis jaringan hanya tepat untuk hubungan biner, dan kita tidak _rst untuk menghadapi masalah ini {dengan Con- jaringan Cosponsorship gressional speci_cally. Kedua Fowler (2006) dan Faust dan Skvoretz
3 Aturan kongres mendikte bahwa mungkin ada hanya satu sponsor untuk tagihan, tidak ada sponsor bersama.
4 Fowler cosponsorship data aku s bebas tersedia dari dia situs web di(2002) mengatasi masalah ini dengan thresholding, dan mengobati setiap hitungan cosponsorship positif lebih besar dari nol sebagai cosponsorship a. Masalah kedua berkaitan dengan struktur cosponsorship jaringan speci_cally. Seperti dapat dilihat dari sel kiri atas dari Gambar 2, memperlakukan setiap tindakan cosponsorship sebagai contoh hubungan cosponsorship menghasilkan jaringan sangat padat. Jika kita mencoba untuk memperkirakan ERGM pada jaringan ini, para-parameter ters akan menghasilkan jaringan di mana setiap dasi mungkin ada dan model akan merosot seperti dibahas di atas.
Dalam rangka untuk mengubah hubungan berbasis hitungan ke tepi biner serta menghasilkan jaringan yang memungkinkan non degenerate estimasi ERGM, kami memilih untuk membuat jaringan biner yang kurang padat dari itu dalam perawatan sebelumnya dengan mengharuskan jumlah yang lebih besar dari cosponsorships dari satu untuk menunjukkan hubungan cosponsorship. Rata-rata jumlah cosponsorship hubungan antara legislator di 108 rumah 13,76. Untuk \ tipis "jaringan, kita harus memilih ambang (jumlah ikatan cosponsorship antara dua legislator) di atas yang kita akan kode tepi dan bawah yang kita tidak akan. Jelas, ketika menipis jaringan, hati-hati perhatian harus dibayarkan kepada makna substantif menipis serta sensitivitas model akhirnya diproduksi dengan aturan menipis. Pemilihan threshold seperti adalah tentu agak sewenang-wenang dan sehingga sangat penting untuk mencoba beberapa nilai ambang batas sebagai analisis sensitivitas. Saat menguji sensitivitas model, salah satu harus mencari baik perubahan signi_cant dalam perkiraan serta masalah dengan model yang degenerasi. Selanjutnya, kita harus menunjukkan bahwa sensitivitas dari model ke ambang menipis dipilihnya dasarnya di_erent adalah tidak selalu hal yang buruk ketat. Jika hasilnya terasa di_erent antara, katakanlah, nilai ambang batas rendah dan tinggi, yang memberitahu kita sesuatu yang sangat menarik tentang data. Bahkan bisa menyarankan tepi ambang rendah merupakan jenis fundamental di_erent tepi dari tepi ambang batas tinggi (dalam hal ini, bahwa cosponsorship kasual dasarnya di_erent dari sangat sering cosponsorship) dan bahwa proses fundamental di_erent sedang bekerja. Langkah _rst kami dalam model _tting adalah untuk menyesuaikan coding (penipisan) aturan kami ke substantif aplikasi. Ambang batas yang konstan mungkin tidak karena fakta bahwa ada varians dalam jumlah tagihan setiap sponsor legislator. Oleh karena menyensor di ambang adalah di bagian sensus pada legislator I 'S kecenderungan untuk mensponsori legislator j dan pembuat undang-undang j 'S frekuensi sponsorship. Karena kita hanya tertarik pada mantan, kita menerapkan baru coding pemerintahan oleh mempertimbangkan legislator saya a cosponsor dari legislator j jika legislator saya telah cosponsored persen pembuat undang-undang j 'S disponsori undang-undang. Fokus kami dibatasi sini ke 108 rumah untuk singkatnya.
Setelah bereksperimen dengan beberapa nilai ambang batas menipis kami menemukan bahwa ambang menjadi- tween 1% dan 10% menghasilkan jaringan cukup padat menangkap antara 20% dan 50% dari semua hubungan mungkin. Tingkat kepadatan media ini menghasilkan perkiraan Model invarian dan menghindari degenerasi. Kovariat yang kita termasuk dalam model adalah indikator apakah undang lators berbagi pihak yang sama, di_erence mutlak dalam dimensi _rst dari DW-Nominasikan, hitungan layanan komite tumpang tindih, dan indikator bersama-negara. Kami juga mencakup jaringan parameter untuk timbal balik (count dasi asimetris), cyclicality (hitungan tiga kali lipat siklik), dan transitivitas (hitungan transitif tiga kali lipat). Ingat bahwa dasi asimetris adalah salah satu bentuk f saya ! j g dan triple siklik mengambil bentuk f saya ! j; j ! k; k ! saya g, Sedangkan transitif tiga adalah dalam bentuk f saya ! k; I ! j; j ! k g . Kami menggunakan R paket ERGM (Handcock et al. 2010) untuk 't model.5
Hasil ERGM dengan dan tanpa statistik jaringan disajikan pada Tabel 1. Sebuah melihat _rst di Model 't mengatakan bahwa sifat sistemik dari jaringan Cosponsorship adalah sangat p enting; masuknya parameter jaringan tiga mengurangi BIC dengan lebih 5 R kode lengkap untuk aplikasi ini berada di Lampiran.
dari 25%. Tanda-tanda semua kovariat dalam arah yang diharapkan. Perwakilan dari negara yang sama lebih mungkin menjadi cosponsors dan merupakan anggota dari sama partai, mereka yang berbagi keanggotaan komite dan orang-orang yang ideologis serupa. Satu _nding mencolok adalah bahwa ketika karakteristik jaringan dicatat, bersama Partai tidak lagi statistik signi_cant setiap batas tradisional. P-value untuk berbagi Partai adalah sekitar 0,002 dalam model terbatas yang tidak memperhitungkan jaringan struktur, tetapi naik ke 0,65 ketika parameter jaringan disertakan. Ini adalah jelas dan contoh konsekuensial dari berat yang rusak yang dapat dikaitkan dengan e_ects kovariat saat struktur jaringan tidak benar diperhitungkan. Seperti dapat dilihat pada Tabel 1, arti_cially e_ects kovariat inated dapat dengan mudah menghasilkan kesimpulan yang salah. Jaringan Rumah pameran tingkat tinggi timbal balik, tingkat rendah Siklus dan tingkat tinggi transitivitas; kegagalan untuk memperhitungkan ini e_ects diucapkan mirip dengan model misspeci_cation dan dibatasi Model pada Tabel 1 reects bias dihasilkan. Kami juga dapat menggunakan ERGMs kami telah speci_ed untuk menghasilkan pemahaman yang lebih baik deskriptif ings dari hubungan antara legislator. Tabel 2 menyajikan tampilan alternatif bagaimana mempertimbangkan faktor jaringan dapat mengubah (dan meningkatkan) kesimpulan tentang out- diad datang dalam jaringan cosponsorship. Setiap entri O_-diagonal adalah satu set tiga elemen yang termasuk A) indikator biner hubungan cosponsorship, B) probabilitas bersyarat dari cosponsorship dari model penuh, C) probabilitas bersyarat dari cosponsorship dari kovariat-satunya model. Baris sesuai dengan cosponsor dan kolom sponsor. Kita melihat bahwa model penuh dan kovariat-hanya memproduksi probabilitas terasa di_erent, dan bahwa rata-rata, model penuh memberikan prediksi yang lebih akurat.
4.2 Jaringan Over Time:
Conict dalam Sistem Internasional
Aplikasi kedua diambil dari hubungan internasional; kita berusaha untuk meniru dan ulang menganalisis model perselisihan antar militer (MID) awalnya dikembangkan oleh Maoz et al. _) Menggunakan teknologi ERGM. Alasan kami memilih aplikasi ini adalah dua lipat: Data angka dua tahun sangat umum di conict beasiswa dan, karena tidak biasa bagi negara-negara untuk terlibat dalam beberapa sengketa pada tahun tertentu, kemerdekaan adalah asumsi bermasalah. Beberapa penelitian dalam hubungan internasional telah speci_ed inferensial model conict sebagai fenomena jaringan; Maoz et al. _06) Artikel menarik karena penulis secara eksplisit menyatakan bahwa conict internasional harus diperlakukan sebagai jaringan (lainnya contoh perintis termasuk Maoz _06) dan Ho_ dan Ward _)). Kami akan pergi ke yang lebih besar rinci mengenai speci_cation dari model kita meniru lama, tapi _rst kami menyajikan kami inovasi dalam estimasi ERGMs untuk jaringan longitudinal diamati yang kita gunakan untuk menganalisis jaringan conict.
4.2.1The Pooled Exponential Acak Grafik Model
Dalam aplikasi kedua ini kita membangun model yang sedekat mungkin ke salah satu perkiraan di Maoz et al. _) Untuk mengamati keuntungan substantif dan teknis bekerja dalam kerangka ERGM.
Aplikasi asli menganggap semua diad di negara bagian Sistem dari 1870 {tahun 1996, total 450.306 pengamatan diad. Variabel dependen adalah indikator untuk terjadinya setidaknya satu militer antarnegara sengketa (MID) antara dikembangkan untuk menangani jaringan tunggal dan tidak dapat digunakan untuk menghitung satu set perkiraan yang mencakup beberapa jaringan dikumpulkan. Kami mengembangkan dan menerapkan ERGM dikumpulkan untuk aplikasi ini. Salah satu kualitas membantu satu dikumpulkan ERGM untuk tujuan perbandingan dengan logit diad, adalah bahwa parameter ERGM mengurangi kepada mereka regresi logistik jika coe_cients pada statistik jaringan adalah nol (yaitu struktur jaringan baik tidak disertakan atau memiliki persis ada e_ect). Pilihan kita akan biasanya harus membuat antara pseudolikelihood maksimum dan MCMC untuk memperkirakan dikumpulkan ERGM adalah nulli_ed dalam hal ini: beban komputasi terkait dengan memperkirakan dikumpulkan ERGM oleh MCMC-MLE adalah dapat diatasi diberikan skr menyewa teknologi dan fakta bahwa kita harus memperkirakan model di 126 jaringan. Ini masalah komputasi tidak akan selalu a_ect setiap analisis ERGM dikumpulkan, tetapi tidak unik untuk aplikasi kita sehingga layak dipertimbangkan. Masalahnya menyajikan di Newton- Raphson langkah optimasi dalam estimasi berulang parameter ERGM. Mengingat set terakhir dari parameter yang ditemukan dengan memaksimalkan kemungkinan perkiraan dengan sebelumnya sampel jaringan, saat ini optimasi bukit-climbing mengharuskan seluruh sampel jaringan akan diselenggarakan di memori. Karena ukuran jaringan MID bervariasi tahun, unik sampel jaringan harus disimpan untuk setiap tahun. Setiap seri dari seri 127 jaringan adalah panjang 10.000 {menggunakan 10.000 jaringan untuk pendekatan kemungkinan. Memperkirakan seperti Model dengan cepat menguasai kemampuan (saat ini) server yang sangat kuat. 6 Selain MCMC, kita menggunakan pseudolikelihood maksimum dan menerapkan metode bootstrap resampling (Efron 1981) untuk menghitung interval con_dence. Seperti yang terjadi, tantangan komputasi dari serangkaian besar jaringan adalah sesuatu dari berkat menyamar. Mengingat bahwa, dalam banyak speci_cations ERGM, semua diad tergantung satu sama lain, adalah mustahil untuk partisi sampel diad menjadi unit-unit independen. Jika partisi seperti itu mungkin, prosedur resampling nonparametrik seperti bootstrap yang 6 Sebuah usaha untuk menerapkan algoritma ini kelebihan beban 96 gigabyte ram pada server.
0 komentar:
Posting Komentar