SCIENCE NEWS | visibangsa.com – ChatGPT dan alat artficial intelligent (AI) lainnya mulai mengubah kehidupan digital kita, tetapi interaksi AI tak lama lagi akan segera menjadi fisik. Hal itu dilansir Sabtu (25/5) oleh Science News, Washington DC Amerika Serikat, sumber informasi nirlaba yang independen dan akurat terkait berita terbaru di bidang sains.
Disebutkan robot humanoid yang dilatih dengan jenis AI tertentu untuk merasakan dan bereaksi terhadap dunia mereka, dapat membantu di pabrik, stasiun luar angkasa, panti jompo, dan lainnya. Dua makalah terbaru di Science Robotics menyoroti bagaimana jenis AI tersebut – yang disebut pembelajaran penguatan – dapat membuat robot semacam itu menjadi kenyataan.
“Kami telah melihat kemajuan yang sangat luar biasa dalam AI di dunia digital dengan alat seperti GPT,” kata Ilija Radosavovic, seorang ilmuwan komputer di University of California, Berkeley. “Namun saya pikir AI di dunia fisik memiliki potensi untuk menjadi lebih transformasional.” imbuhnya.
Perangkat lunak canggih yang mengontrol pergerakan bot bipedal sering kali menggunakan apa yang disebut kontrol prediktif berbasis model. Hal ini menghasilkan sistem yang sangat canggih, seperti robot Atlas yang bisa melakukan parkour dari Boston Dynamics. Namun, otak robot ini membutuhkan cukup banyak keahlian manusia untuk memprogramnya, dan mereka tidak dapat beradaptasi dengan baik pada situasi yang tidak dikenal. Pembelajaran penguatan, atau RL, di mana AI belajar melalui uji coba dan kesalahan untuk melakukan serangkaian tindakan, mungkin merupakan pendekatan yang lebih baik.
“Kami ingin melihat sejauh mana kami dapat mendorong pembelajaran penguatan pada robot sungguhan,” kata Tuomas Haarnoja, seorang ilmuwan komputer di Google DeepMind dan salah satu penulis pada salah satu makalah Science Robotics.
Haarnoja dan rekan-rekannya memilih untuk mengembangkan perangkat lunak untuk robot mainan setinggi 20 inci yang disebut OP3, yang dibuat oleh perusahaan Robotis. Tim ini tidak hanya ingin mengajarkan OP3 untuk berjalan, tetapi juga bermain sepak bola satu lawan satu.
“Sepak bola adalah lingkungan yang bagus untuk mempelajari pembelajaran penguatan umum,” kata Guy Lever dari Google DeepMind, salah satu penulis makalah tersebut. Hal ini membutuhkan perencanaan, ketangkasan, eksplorasi, kerja sama, dan kompetisi.
Ukuran robot mainan “memungkinkan kami melakukan iterasi dengan cepat,” kata Haarnoja, karena robot yang lebih besar lebih sulit dioperasikan dan diperbaiki. Dan sebelum menerapkan perangkat lunak pembelajaran mesin pada robot sungguhan – yang dapat rusak ketika terjatuh – para peneliti melatihnya pada robot virtual, sebuah teknik yang dikenal sebagai transfer sim-ke-nyata.
Pelatihan bot virtual dilakukan dalam dua tahap. Pada tahap pertama, tim melatih satu AI menggunakan RL hanya untuk mengangkat robot virtual dari tanah, dan satu lagi untuk mencetak gol tanpa terjatuh. Sebagai masukan, AI menerima data termasuk posisi dan pergerakan sendi robot dan, dari kamera eksternal, posisi semua hal lain dalam permainan (Dalam pracetak yang baru-baru ini diposting, tim membuat versi sistem yang mengandalkan penglihatan robot itu sendiri).
AI harus menghasilkan posisi gabungan yang baru. Jika mereka berkinerja baik, parameter internal mereka diperbarui untuk mendorong lebih banyak perilaku yang sama. Pada tahap kedua, para peneliti melatih AI untuk meniru masing-masing dari dua AI pertama dan mencetak skor melawan lawan yang sangat mirip (versi dirinya sendiri).
Untuk mempersiapkan perangkat lunak kontrol, yang disebut pengontrol, untuk robot dunia nyata, para peneliti memvariasikan aspek-aspek simulasi, termasuk gesekan, penundaan sensor, dan distribusi massa tubuh. Mereka juga memberi penghargaan kepada AI tidak hanya untuk mencetak gol, tetapi juga untuk hal-hal lain, seperti meminimalkan torsi lutut untuk menghindari cedera.
Robot sungguhan yang diuji dengan perangkat lunak kontrol RL berjalan hampir dua kali lebih cepat, berbelok tiga kali lebih cepat, dan memerlukan waktu kurang dari separuh waktu untuk bangun dibandingkan dengan robot yang menggunakan pengontrol yang ditulis oleh produsen. Tetapi keterampilan yang lebih canggih juga muncul, seperti merangkai aksi dengan lancar. “Sungguh menyenangkan melihat keterampilan motorik yang lebih kompleks dipelajari oleh robot,” kata Radosavovic, yang tidak terlibat dalam penelitian ini. Dan pengontrol tidak hanya mempelajari gerakan tunggal, tetapi juga perencanaan yang diperlukan untuk memainkan permainan, seperti mengetahui cara menghalangi tembakan lawan.
“Di mata saya, kertas sepak bola luar biasa,” kata Joonho Lee, seorang ahlirobot di ETH Zurich. “Kami belum pernah melihat ketahanan seperti itu dari humanoids.”
Tapi bagaimana dengan humanoid seukuran manusia? Dalam makalah terbaru lainnya, Radosavovic bekerja dengan rekan-rekannya untuk melatih pengontrol untuk robot humanoid yang lebih besar. Yang ini, Digit dari Agility Robotics, tingginya sekitar lima kaki dan memiliki lutut yang menekuk ke belakang seperti burung unta.
Pendekatan tim mirip dengan Google DeepMind. Kedua tim menggunakan otak komputer yang dikenal sebagai jaringan saraf, tetapi Radosavovic menggunakan tipe khusus yang disebut transformator, jenis yang umum dalam model bahasa besar seperti yang
menyalakan ChatGPT.
Alih-alih mengambil kata-kata dan mengeluarkan lebih banyak kata, model ini mengambil 16 pasangan tindakan pengamatan – apa yang telah dirasakan dan dilakukan robot untuk 16 snapshot waktu sebelumnya, yang mencakup sekitar sepertiga detik – dan menghasilkan tindakan selanjutnya. Untuk membuat pembelajaran lebih mudah, pertama kali dipelajari berdasarkan pengamatan posisi sendi aktual dan kecepatan, sebelum menggunakan pengamatan dengan kebisingan tambahan, tugas yang lebih realistis. Untuk lebih memungkinkan transfer sim-to-real, para peneliti sedikit mengacak aspek tubuh robot virtual dan menciptakan berbagai medan virtual, termasuk lereng, kabel trip-inducing dan bubble wrap.
Pengontrol juga mengungguli pengontrol non-pembelajaran mesin dari pabrikan, dengan mudah melintasi berbagai papan di tanah. Dan sementara pengontrol default macet saat mencoba menaiki tangga, yang RL berhasil mengetahuinya, meskipun tidak melihat langkah-langkah selama pelatihan.
Pembelajaran penguatan untuk penggerak berkaki empat telah menjadi populer dalam beberapa tahun terakhir, dan studi ini menunjukkan teknik yang sama sekarang bekerja untuk robot berkaki dua. “Makalah-makalah ini setara atau telah melampaui pengontrol yang didefinisikan secara manual – titik kritis,” kata Pulkit Agrawal, seorang ilmuwan komputer di MIT. “Dengan kekuatan data, akan mungkin untuk membuka lebih banyak kemampuan dalam waktu yang relatif singkat.”
Robot AI masa depan mungkin membutuhkan ketahanan sistem Berkeley dan ketangkasan Google DeepMind. Sepak bola dunia nyata menggabungkan keduanya. Menurut Lever, sepak bola “telah menjadi tantangan besar bagi robotika dan AI selama beberapa waktu.” | VS-001 sumber : https://www.sciencenews.org