Dinamika Molekuler Hands-on Sesi I sisca(08-50)
Tutorial tentang simulasi MD menggunakan Gromacs 3.3.3
Tsjerk A. Wassenaar
garis besar
Dinamika molekul (MD) simulasi terdiri dari tiga tahap: Pertama, data input (sistem simulasi) harus dipersiapkan. Kemudian simulasi produksi dapat dijalankan dan akhirnya hasilnya harus dianalisis dan dimasukkan ke dalam konteks. Meskipun tahap kedua adalah langkah yang paling menuntut komputasi, dengan simulasi biasanya berjalan selama beberapa bulan, langkah yang paling melelahkan adalah persiapan dan analisis. Tutorial ini akan memberikan contoh dari sesi pengaturan protein untuk simulasi dinamika molekul, menjalankannya dan menganalisa hasil. Protein digunakan untuk sesi ini adalah lisozim Bacteriofag T4 (PDB id 1LW9), yang merupakan struktur kristal diselesaikan pada resolusi 1,45 angstrom.
Tutorial ini menggunakan Gromacs (http://www.gromacs.org) versi 3.3.3 dan sebagian besar perintah yang diberikan adalah khusus untuk paket ini. Alur kerja (s) akan lebih umum meskipun dan juga akan berlaku untuk paket MD lainnya. Setiap langkah akan disajikan skematik, sebagai node dengan input dan output. Langkah A dapat menjadi pelaksanaan program tunggal atau kombinasi program, dengan output dari satu diarahkan ke yang lain. Dalam kasus program, input / output jenis dan bendera akan ditentukan. Untuk sebagian besar program / langkah-langkah hanya input / output opsi yang digunakan terdaftar. Kebanyakan program menawarkan pilihan untuk kontrol yang lebih maju, yang tidak akan disebutkan di sini. Bagi mereka yang tertarik, halaman bantuan untuk setiap program memberikan daftar lengkap dan deskripsi fungsi tersebut. Halaman bantuan dapat ditunjukkan dengan menjalankan program dengan opsi "-h". Dalam alur kerja, program ditandai dengan nama pada latar belakang kuning. Input / output data yang diberikan sebagai nama deskriptif pada latar belakang hijau. Blok biru menunjukkan data masukan yang pada dasarnya tidak tergantung pada struktur yang diteliti. Blok oranye adalah proses yang terdiri dari beberapa langkah dalam hal program yang terlibat. Dalam skema ini, blok oranye ini hanya digunakan untuk langkah-langkah simulasi, yang dijelaskan lebih rinci di bawah. Garis menghubungkan data ke proses dan untuk setiap program baris perintah pilihan untuk input atau output ditunjukkan dalam putih pada hitam.
persiapan
Penyusunan sistem simulasi merupakan tahap paling penting dari MD. MD simulasi dilakukan untuk mendapatkan wawasan ke dalam proses pada skala atomistik. Mereka dapat digunakan untuk memahami pengamatan eksperimental, untuk menguji hipotesis atau sebagai dasar untuk hipotesis baru yang akan dinilai eksperimental. Namun, untuk masing-masing kasus, simulasi harus dirancang sedemikian rupa sehingga mereka cocok untuk tujuan tersebut. Ini berarti bahwa setup harus dilakukan dengan hati-hati.
Seleksi, validasi dan mengedit struktur
Hilang residu, atom hilang
Dalam tutorial ini kita mempertimbangkan simulasi protein. Langkah pertama dalam urutan kemudian adalah pemilihan struktur awal. Struktur ini harus diperiksa untuk hilang residu dan atom, dan jika atom atau residu yang hilang, ini harus dimodelkan dalam beberapa cara. Dalam kasus struktur dari repositori PDB, residu yang hilang dan atom yang terdaftar dalam file. Download atau salin 1LW9.pdb file dan memiliki melihatnya. Pencarian untuk kehadiran entri KETERANGAN dengan nomor 465 dan / atau 470.
Non-standar residu dan ligan
Sebagai sesi ini tidak mencakup pemodelan struktur, seharusnya tidak mengejutkan bahwa tidak ada residu atau rantai samping yang hilang. Namun, ada masalah kecil yang perlu diselesaikan. Struktur kristal diperoleh di hadapan disulfida kalium, klorida dan 2-hydroxethyl. Ini bukan bagian dari protein seperti yang kita ingin belajar, dan, pada catatan lain, disulfida tidak di medan kekuatan kita akan menggunakan. Untuk alasan ini molekul-molekul ini harus dihapus dari file tersebut. Menggunakan editor teks, menghapus garis mengacu pada kalium (K), klorida (CL) dan 2-hydroxethyl disulfida (HED). Atau, menjalankan perintah:
mv 1LW9.pdb 1LW9.pdb.org
egrep -v "^HETATM.{11}(HED| CL| K)" 1LW9.pdb.org > 1LW9.pdb
Hal ini akan mencari pola yang ditentukan dalam setiap baris dalam file dan hanya mempertahankan baris yang tidak cocok.
struktur kualitas
Ini adalah praktik yang baik untuk menjalankan pemeriksaan lebih lanjut pada struktur untuk menilai kualitas. Sebagai contoh, proses perbaikan dalam penentuan struktur kristal mungkin tidak selalu menghasilkan orientasi yang tepat dari glutamin dan asparagin kelompok amida. Juga, negara dan protonasi sisi rantai orientasi residu histidin mungkin bermasalah. Untuk melakukan validasi yang tepat dari struktur, beberapa program dan server ada (misalnya WHATIF). Untuk tutorial ini kita akan mengasumsikan bahwa struktur cukup baik untuk tujuan kita dan lanjutkan dengan menyiapkan sistem simulasi.
Struktur konversi dan topologi
Molekul A didefinisikan oleh koordinat dari atom juga oleh deskripsi interaksi berikat dan nonbonded. Karena struktur yang diperoleh dari PDB hanya berisi koordinat, pertama kita harus membangun topologi, yang menggambarkan sistem dalam hal jenis atom, tuduhan, obligasi, dll Topologi ini khusus untuk medan gaya tertentu dan bidang kekuatan yang harus digunakan adalah salah satu isu yang membutuhkan pertimbangan cermat. Di sini kita menggunakan GROMOS96 53a6 atom bersatu medan kekuatan, yang parameter untuk memberikan prediksi yang baik dari energi bebas dari solvasi dari rantai samping asam amino dan yang umumnya memberikan perjanjian baik dengan eksperimen NMR.
Adalah penting bahwa topologi cocok dengan struktur, yang berarti bahwa struktur harus diubah juga, untuk mematuhi medan gaya yang digunakan. Untuk mengkonversi struktur dan membangun topologi, yang pdb2gmx program dapat digunakan. Program ini dirancang untuk membangun topologi untuk molekul yang terdiri dari blok bangunan yang berbeda, seperti asam amino. Ini menggunakan perpustakaan blok bangunan untuk konversi dan akan gagal untuk reckognize molekul atau residu tidak hadir di perpustakaan. Perintah berikut untuk mengkonversi struktur; memilih bidang GROMOS kekuatan 53a6 ketika diminta:
pdb2gmx -f 1LW9.pdb -o 1LW9.gro -p 1LW9.top
Baca melalui output pada layar dan memeriksa pilihan yang dibuat untuk protonasi histidin dan muatan total yang dihasilkan dari protein. Juga menelusuri struktur file masukan (1LW9.pdb, pdb format) dan output struktur file (1LW9.gro, gromacs format). Perhatikan perbedaan antara dua format. Juga perhatikan bahwa file struktur output bisa juga telah dipilih harus dalam format pdb. Sekarang menelusuri melalui file topologi dan melihat struktur.
Energi minimalisasi struktur (vakum)
Sekarang struktur dihasilkan dalam format yang benar untuk bidang gaya yang dipilih, serta topologi yang sesuai. Namun, konversi struktur melibatkan penghapusan dan atau penambahan atom hidrogen dan dapat menyebabkan ketegangan yang akan diperkenalkan, misalnya karena atom diposisikan terlalu dekat. bersama-sama. Oleh karena itu, kita harus melakukan minimisasi energi pada struktur, dan biarkan sedikit santai. Ini sebenarnya langkah simulasi, dan melibatkan dua proses. Pertama, struktur dan topologi digabungkan menjadi deskripsi tunggal sistem, bersama-sama dengan sejumlah parameter kontrol. Ini menghasilkan file menjalankan masukan, yang dapat digunakan sebagai input tunggal untuk mdrun program simulasi. Keuntungan dari pemecahan dua sub-proses adalah bahwa file run-masukan dapat ditransfer ke jaringan komputer yang didedikasikan (performa tinggi) atau superkomputer dan diproses di sana. Jelas, ini hanya relevan untuk simulasi produksi.
Untuk melakukan langkah-langkah awal menyimpan minim.mdp file ke direktori Anda. File ini berisi parameter kontrol untuk minimisasi energi. Silahkan lihat pada isi dari file ini. Perhatikan garis dimulai dengan "integrator", yang menentukan algoritma untuk digunakan. Dalam hal ini sudah diatur untuk melakukan minimisasi energi paling curam keturunan 500 langkah. Sekarang, menggabungkan parameter struktur, topologi dan kontrol menggunakan grompp:
grompp -v -f minim.mdp -c 1LW9.gro -p 1LW9.top -o 1LW9-EM-vacuum.tpr
grompp akan mencatat bahwa sistem memiliki muatan non-nol dan akan mencetak beberapa informasi lain mengenai sistem dan parameter kontrol. Program ini juga akan menghasilkan file output tambahan, yang berisi pengaturan untuk semua parameter kontrol (mdout.mdp). Sekarang, lanjutkan dengan mdrun:
mdrun -v -deffnm 1LW9-EM-vacuum
Karena hanya ada sekitar 2300 atom, minimisasi energi selesai dengan cepat. The-v flag menyebabkan energi potensial dan gaya maksimum yang akan dicetak pada setiap langkah, sehingga berikut minimisasi tersebut. Ini mungkin bahwa program berhenti sebelum selesai 500 langkah, dalam hal ini energi bawah sumur tercapai. Sekarang bahwa struktur adalah santai, saatnya untuk mengatur kondisi batas periodik dan menambahkan pelarut.
Kondisi batas periodik
Sebelum menambahkan pelarut, tata letak umum (ruang) dari setup simulasi harus dipilih. Paling umum simulasi dilakukan dalam kondisi batas periodik (PBC), yang berarti bahwa sebuah sel unit tunggal didefinisikan, yang dapat ditumpuk dalam cara yang mengisi ruang. Dengan cara ini, sistem, terbatas periodik dapat disimulasikan, menghindari efek tepi karena dinding volume simulasi. Hanya ada beberapa bentuk umum yang tersedia untuk mengatur PBC. Kami akan menggunakan sebuah pigura berduabelas segi belah ketupat karena sesuai dengan kemasan yang optimal sebuah bola, dan karena itu pilihan terbaik untuk bebas memutar molekul. Untuk interaksi langsung antara gambar periodik melarang kita menetapkan jarak minimal 1,0 antara protein dan dinding sel, sehingga tidak ada dua tetangga akan lebih dekat dari 2,0 nm. Kondisi batas periodik ditetapkan dengan editconf:
editconf -f 1LW9-EM-vacuum.gro -o 1LW9-PBC.gro -bt dodecahedron -d 1.0
Silahkan lihat pada output editconf, dan perhatikan perubahan dalam volume. Juga, kita lihat pada baris terakhir dari file 1LW9-PBC.gro (-1 ekor 1LW9-PBC.gro). Dalam format gromacs (. Gro), baris terakhir menentukan bentuk sel satuan. Ia selalu menggunakan representasi matriks triklinik, dengan tiga angka pertama menentukan elemen-elemen diagonal (xx, yy, zz) dan enam terakhir memberikan off-diagonal elemen (xy, xz, y, yz, zx, zy).
Selain pelarut
Sekarang bahwa sel unit sudah diatur, pelarut dapat ditambahkan. Ada beberapa model pelarut, yang masing-masing lebih atau kurang erat terkait dengan medan gaya. Para GROMOS96 medan gaya umumnya digunakan dengan titik muatan model sederhana (SPC) air. Untuk mengisi sel unit dengan SPC mengeluarkan perintah berikut:
genbox -cp 1LW9-PBC.gro -cs spc216.gro -p 1LW9.top -o 1LW9-water.gro
Topologi tidak diperlukan untuk generasi pelarut, tapi diperbarui untuk menyertakan pelarut menambahkan. Silahkan lihat pada akhir 1LW9.top file untuk melihat penambahan, dan memeriksa angka dengan jumlah pelarut ditambahkan sesuai dengan genbox.
Penambahan ion: biaya counter dan konsentrasi
Pada titik ini, kita memiliki protein terlarut, tetapi biaya +8 sistem masih tetap. Untuk membuat sistem netral kita harus menambahkan sejumlah counterions. Selain itu, dapat dianggap praktik yang baik untuk menambahkan ion sampai konsentrasi tertentu. Para Genion program dapat mengurus kedua tugas, tetapi membutuhkan file menjalankan masukan sebagai masukan, yaitu file yang berisi baik struktur dan topologi. Seperti yang kita lihat sebelumnya, seperti file yang bisa dihasilkan dengan grompp:
grompp -v -f minim.mdp -c 1LW9-water.gro -p 1LW9.top -o 1LW9-water.tpr
Selanjutnya, file 1LW9-water.tpr dapat digunakan sebagai masukan untuk Genion. Kami menentukan konsentrasi 0,1 M (-conc 0,1 M) NA + / CL-(-pname NA +-nname CL-) yang akan ditambahkan dan menunjukkan bahwa kelebihan satu spesies ion harus ditambahkan untuk menetralkan sistem (- netral). Genion akan meminta sekelompok molekul yang akan digunakan untuk sebagian mengganti dengan ion. Kelompok 'SOL' harus dipilih.
genion -s 1LW9-water.tpr -o 1LW9-solvated.gro -conc 0.1 -neutral -pname NA+ -nname CL-
Perhatikan jumlah ion ditambahkan, dan memverifikasi bahwa lebih dari 8 ion klorida ditambahkan untuk netralisasi. Setelah diganti sejumlah molekul air dengan ion, topologi sistem di 1LW9.top tidak benar lagi. Mengedit file topologi dan mengurangi jumlah molekul pelarut. Juga tambahkan baris menentukan jumlah ion + NA dan garis menetapkan jumlah CL-.
Energi minimisasi dari sistem terlarut
Sekarang seluruh simulasi sistem didefinisikan. Langkah-langkah hanya sebelum memulai menjalankan produksi melibatkan relaksasi dikendalikan dari sistem. Generasi pelarut serta penempatan ion, mungkin telah menyebabkan interaksi yang tidak menguntungkan, misalnya tumpang tindih atom, tuduhan yang sama terlalu berdekatan. Oleh karena itu, sistem adalah energi diminimalkan lagi, mengikuti langkah-langkah yang sama seperti sebelumnya, tapi sekarang dengan kondisi batas periodik. Edit file dan mengubah minim.mdp baris pbc = tidak untuk pbc = xyz. Kemudian jalankan grompp dan mdrun:
grompp -v -f minim.mdp -c 1LW9-solvated.gro -p 1LW9.top -o 1LW9-EM-solvated
mdrun -v -deffnm 1LW9-EM-solvated
Relaksasi posisi atom pelarut dan hidrogen: Posisi MD terkendali
Dengan strain dihamburkan terbesar dari sistem, kita sekarang membiarkan pelarut beradaptasi dengan protein, yaitu kita membiarkan pelarut untuk bergerak bebas, sambil menjaga non-atom hidrogen dari protein lebih atau kurang tetap untuk posisi referensi. Hal ini dilakukan untuk memastikan bahwa 'cocok' konfigurasi pelarut protein. Langkah ini adalah langkah pertama MD yang sebenarnya. Parameter kontrol untuk langkah ini dapat ditemukan di pr.mdp, yang harus didownload. Silahkan lihat di file ini dan perhatikan integrator digunakan juga sebagai pernyataan menentukan. Yang terakhir ini digunakan untuk memungkinkan kontrol aliran dalam file topologi. mendefinisikan =-DPOSRES akan menyebabkan kata kunci "POSRES" didefinisikan secara global. Silahkan lihat pada akhir dari file topologi untuk melihat bagaimana ini digunakan untuk mengaktifkan pembatasan posisi. Gunakan grompp dan mdrun untuk menjalankan simulasi:
grompp -v -f pr.mdp -c 1LW9-EM-solvated.gro -p 1LW9.top -o 1LW9-PR.tpr >&
mdrun -deffnm 1LW9-PR
Simulasi MD terkendali, menyalakan kopling suhu
Sistem sekarang harus relatif bebas dari ketegangan. Waktu untuk muncul panas, dan mulai beberapa sistem untuk mandi panas. Dengan kata lain, jangka pendek akan dilakukan di mana temperatur kopling diaktifkan dan sistem diperbolehkan untuk bersantai dengan kondisi baru. Download nvt.mdp kontrol parameter file dan melihat-lihat pada parameter temperatur kopling di dalamnya. Kemudian jalankan simulasi, menggunakan grompp dan mdrun:
grompp -v -f nvt.mdp -c 1LW9-PR.gro -p 1LW9.top -o 1LW9-NVT.tpr
mdrun -deffnm 1LW9-NVT
Simulasi MD terkendali, menyalakan kopling tekanan
Setelah relaksasi suhu dan kopling suhu, sekarang saatnya untuk mulai meletakkan sesuatu di bawah tekanan. Lakukan simulasi singkat dengan tekanan kopling dihidupkan, menggunakan npt.mdp kontrol parameter file. Silahkan lihat di file ini dan mengidentifikasi parameter mengendalikan tekanan kopling.
grompp -v -f npt.mdp -c 1LW9-NVT.gro -p 1LW9.top -o 1LW9-NPT.tpr
mdrun -deffnm 1LW9-NPT >& 02-mdrun.log
Simulasi produksi
Sekarang akhirnya, kami memiliki sistem terlarut lebih atau kurang disetimbangkan mengandung protein kita bunga dan saatnya untuk memulai simulasi produksi. Pikiran bahwa simulasi produksi tidak berarti bahwa seluruh simulasi dapat digunakan untuk analisis sifat-sifat bunga. Meskipun beberapa dari memori dari konfigurasi awal telah terhapus, tidak mungkin bahwa sistem tersebut telah mencapai kesetimbangan. Pada bagian analisis kami akan menyelidiki bagian mana dari simulasi dapat dianggap dalam kesetimbangan dan dengan demikian cocok untuk diproses lebih lanjut. Tapi pertama-tama itu adalah waktu untuk menyiapkan simulasi. Ini hanya melibatkan menjalankan langkah lain simulasi, mirip dengan langkah terakhir persiapan. Namun, ini adalah satu dari waktu-waktu di mana perlu untuk berpikir tentang tujuan simulasi. Parameter kontrol harus dipilih sedemikian rupa sehingga akan memungkinkan simulasi untuk menganalisis sifat seseorang dalam pikiran. Pertanyaan yang harus ditangani adalah:
* Pada apa skala waktu melakukan proses mewujudkan kepentingan sendiri atau berapa lama harus simulasi dijalankan?
* Berapa banyak frame yang diperlukan, atau apa resolusi waktu yang dibutuhkan?
* Apakah ada kebutuhan untuk menyimpan kecepatan?
* Jika semua atom berada dalam output, atau itu cukup untuk menyimpan koordinat protein hanya?
* Apa frekuensi harus digunakan untuk menulis energi dan entri log?
* Apa frekuensi harus digunakan untuk menulis koordinat titik cek dan kecepatan?
* ...
Download atau menyalin md.mdp kontrol parameter file dan melihat isinya. Ambil topologi final dan struktur file yang dihasilkan dari persiapan dan menggabungkan mereka ke dalam sebuah file masukan dijalankan menggunakan grompp.
Meskipun file input dijalankan dalam format biner, adalah mungkin untuk memiliki melihat isi. Hal ini dapat sangat berguna ketika ditemui perilaku tak terduga, yang dapat timbul dari kontrol implisit atau parameter medan kekuatan. Program untuk membuat isi dari file masukan menjalankan dibaca adalah gmxdump. Output biasanya mencakup banyak halaman dan oleh karena itu disarankan untuk mengarahkan output ke file atau lebih atau kurang, yang memungkinkan untuk menelusuri konten. Perintah berikut dan memeriksa struktur output (perhatikan bahwa Anda harus mengganti nama dengan topol.tpr nama yang dipilih sebagai output untuk grompp):
gmxdump -s topol.tpr |& less
Simulasi sekarang dapat dijalankan menggunakan mdrun dengan cara yang sama seperti di atas. Namun, menjalankan simulasi dengan parameter yang dipilih, memiliki panjang simulasi dari 5 ns, akan menelan biaya terlalu banyak waktu. Simulasi telah dijalankan sebelumnya dan hasil set lengkap dapat didownload. Bagi mereka mengikuti tutorial di rumah, sabar, file lintasan agak besar. Setelah men-download, file tersebut harus membuka ritsleting, setelah bagian analisis dari tutorial dapat dimulai.
Tidak ada komentar:
Posting Komentar