Pembukaan OpenAI & # 39; s pembukaan GPTBot, merekabot perayapan web terbaru telah membangkitkan antisipasi untuk rilis GPT-5 yang akan datang, seperti yang ditunjukkan olehpengajuan merek dagang .
Langkah ini, meskipun bertujuan untuk meningkatkan pelatihan AI, telah menimbulkan diskusi seputar persetujuan dan transparansi.
OpenAI telah memperkenalkan GPTBot untuk mengumpulkan sumber data yang lebih luas untuk sistem AI generasi berikutnya.
Tujuan perusahaan ini adalah untuk memperluas dataset mereka sambil mengambil langkah-langkah untuk mengatasi masalah privasi dan masalah hak cipta.
GPTBot dirancang untuk mengumpulkan data yang dapat diakses publik dari situs web, mengadopsi sistem penyisihan yang serupa dengan mesin pencari populer seperti Google, Bing, dan Yandex.
Ini mengasumsikan data dapat digunakan kecuali jika pemilik situs web menggunakan aturan "disallow" di file server untuk mencegah perayap mengakses konten mereka.
OpenAI menegaskan bahwa GPTBot akan secara proaktif memindai data yang terkumpul untuk menghapus informasi sensitif dan konten yang melanggar kebijakan mereka.
Beberapa ahli etika teknologi menyatakan keberatannya tentang pendekatan opt-out, dengan mencatat potensi tantangan terkait persetujuan.
Sementara beberapa pengguna mendukung kebutuhan OpenAI akan data yang komprehensif, yang lain menyuarakan keprihatinan tentang atribusi dan transparansi yang tepat, membandingkan praktik tersebut dengan karya turunan tanpa kutipan.
Permohonan merek dagang "GPT-5" menambah bobot pada asumsi bahwa OpenAI sedang mempersiapkan model AI berikutnya untuk dirilis.
Langkah ini menunjukkan pergeseran ke arah pendekatan pengumpulan data yang lebih luas, yang menekankan pentingnya data pelatihan yang diperbarui dan beragam.
ChatGPT memiliki basis pengguna yang luas, menarik lebih dari 1,5 miliar pengguna aktif bulanan.
Membatasi Akses GPTBot
Jika pemilik situs web berniat membatasi akses GPTBot ke situs mereka, mereka dapat melakukan penyesuaian pada file robots.txt mereka.
Jika mereka ingin melakukan ini, mereka dapat memblokir masuknya GPTBot ke seluruh situs web mereka.
Namun, mereka yang ingin memberikan akses parsial dapat melakukannya dengan menyesuaikan direktori yang dapat diakses GPTBot.
Untuk melakukan ini, mereka harus mengedit file robots.txt mereka.