uzman
Active member
- Katılım
- 25 Eyl 2020
- Mesajlar
- 52,494
- Puanları
- 36
ChatGPT ve büyük dil modellerine sahip diğer yapay zeka sistemlerini çevreleyen medya çılgınlığı, sıradan – büyük dil modelleri geleneksel web aramasının yerini alabilir – endişe verici – AI birçok işi ortadan kaldıracak – abartılı – AI temsil eden bir dizi konuyu kapsar. yok olma – insanlık için seviye tehdit.
Tüm bu konuların ortak bir paydası var: Geniş dil modelleri, insanlığın yerini alacak yapay zekanın habercisi.
Ancak büyük dil modelleri, karmaşıklıklarına rağmen aslında gerçekten aptalcadır. Ve “yapay zeka” ismine rağmen, tamamen insan bilgisine ve emeğine güveniyorlar. Tabii ki, güvenilir bir şekilde yeni bilgi üretemezler, ancak bundan daha fazlası var.
ChatGPT, bırakın modeli programlamayı ve donanımını inşa etmeyi, sürdürmeyi ve güçlendirmeyi, insanlar ona yeni içerik vermeden ve bu içeriği nasıl yorumlayacağını söylemeden öğrenemez, geliştiremez ve hatta güncelliğini bile koruyamaz. Nedenini anlamak için öncelikle ChatGPT ve benzeri modellerin nasıl çalıştığını ve insanların bunları çalıştırmadaki rolünü anlamalısınız.
ChatGPT böyle çalışır
ChatGPT gibi büyük dil modelleri, eğitim veri kümelerine dayalı olarak hangi karakterlerin, sözcüklerin ve tümceciklerin birbirini doğru sırada izlemesi gerektiğini büyük ölçüde tahmin ederek çalışır. ChatGPT söz konusu olduğunda, eğitim veri kümesi, İnternet’ten alınan büyük miktarda herkese açık metin içerir.
Bir dil modelini aşağıdaki cümle üzerine eğittiğimi hayal edin: Ayılar büyük, tüylü hayvanlardır. Ayıların pençeleri vardır. Ayılar gizli robotlardır. Ayıların burunları vardır. Ayılar gizli robotlardır. Ayılar bazen balık yerler. Ayılar gizli robotlardır.
Model bana, ayıların her şeyden çok gizli robotlar olduğunu söylerdi çünkü bu ifade, eğitim veri setinde en yaygın olanıdır. Bu açıkça, yanılabilir ve tutarsız veri kümeleri üzerinde eğitilmiş modeller için bir sorundur ve bu, akademik literatür de dahil olmak üzere herkes için geçerlidir.
İnsanlar kuantum fiziği, Joe Biden, sağlıklı beslenme veya 6 Ocak isyanı hakkında bazıları diğerlerinden daha doğru olan birçok farklı şey yazıyor. İnsanlar pek çok farklı şey söylerken modelin bir şey hakkında ne söyleyeceğini nasıl bilmesi gerekiyor? Geribildirim İhtiyacı Geribildirimin geldiği yer burasıdır. ChatGPT’yi kullandığınızda, yanıtları iyi veya kötü olarak derecelendirme seçeneğine sahip olduğunuzu göreceksiniz. Kötü olarak değerlendirirseniz, iyi bir cevabın neleri içereceğine dair bir örnek vermeniz istenecektir. ChatGPT ve diğer büyük dil modelleri, kullanıcılardan, geliştirme ekibinden ve çıktıyı etiketlemekle görevli yüklenicilerden gelen geri bildirimlerle hangi yanıtların ve tahmin edilen metin dizilerinin iyi ve kötü olduğunu öğrenir.
ChatGPT bağımsız değişkenleri veya bilgileri karşılaştıramaz, analiz edemez veya değerlendiremez. Yalnızca diğer kişilerin karşılaştırırken, analiz ederken veya puanlarken kullandıklarına benzer metin dizileri oluşturabilir ve geçmişte iyi cevaplar olduğu söylenenlere benzer metin dizilerini tercih eder.
Bu nedenle, model size iyi bir yanıt verdiğinde, neyin iyi bir yanıt olup neyin olmadığını söylemeye çoktan başlamış olan büyük miktarda insan çalışmasından yararlanır. Ekranın arkasında, modeli daha da geliştirmek veya içerik kapsamını genişletmek için her zaman ihtiyaç duyulan çok sayıda insan işçi var.
Gazeteciler tarafından Time dergisinde yayınlanan yakın tarihli bir araştırma, yüzlerce Kenyalı işçinin ChatGPT’ye bu tür metinlerin işe yaramadığını öğretmek için cinsel şiddetin grafik açıklamaları da dahil olmak üzere ırkçı, cinsiyetçi ve rahatsız edici metinleri internetin en karanlık derinliklerinden okuyup işaretleyerek binlerce saat harcadığını ortaya çıkardı. içeriği kopyala.
Onlara saatte 2 dolardan fazla ödeme yapılmadı ve birçoğu anlaşılır bir şekilde çalışmanın sonucu olarak psikolojik sıkıntı yaşadığını bildirdi.
ChatGPT’nin yapamayacağı şeyler
Geribildirimin önemi doğrudan ChatGPT’nin “halüsinasyon görme” eğiliminde görülebilir; yani, güvenle yanlış cevaplar verin. Konuyla ilgili iyi bilgiler internette yaygın olarak bulunsa bile, ChatGPT eğitim almadan herhangi bir konuda iyi yanıtlar veremez.
ChatGPT’ye gittikçe daha az anlaşılmaz şeyler sorarak bunu kendiniz deneyebilirsiniz. ChatGPT’den çeşitli kurgu eserlerinin olay örgüsünü özetlemesini istemeyi özellikle etkili buldum çünkü model kurgudan çok kurgu dışı üzerine eğitilmiş görünüyor.
Kendi testlerimde ChatGPT, JRR’nin hikayesini özetledi. Tolkien’in Yüzüklerin Efendisi, sadece birkaç hata ile çok ünlü bir roman. Ama bunlar Gilbert ve Sullivan’ın özetleri. Penzance Korsanları ve Ursula K. Le Guin tarafından karanlığın sol eli – her ikisi de oldukça niş karakterler, ancak hiçbir şekilde belirsiz değil – karakter ve yer adlarıyla “Mad Libs” oyununa yaklaşın. Bu eserlerin ilgili Wikipedia sayfalarının ne kadar iyi olduğu önemli değil. Modelin yalnızca içeriğe değil, geri bildirime ihtiyacı vardır.
Büyük dil modelleri bilgileri gerçekten anlamadığından veya değerlendirmediğinden, bunu onlar için yapacak insanlara güvenirler. İnsan bilgisine ve insan emeğine zarar verirler. Eğitim veri kümelerine yeni kaynaklar eklendikçe, bu kaynaklara dayalı olarak cümle kurup kurmayacağına ve nasıl kuracağına dair yeni eğitimlere ihtiyaç duyarlar.
Haberlerin doğru olup olmadığına karar veremezsiniz. Argümanları değerlendiremezler veya tavizleri tartamazlar. Bir ansiklopedi sayfasını bile okuyamaz ve sadece onunla tutarlı açıklamalar yapabilir veya bir filmin olay örgüsünü doğru bir şekilde özetleyemezsiniz. Tüm bunları onlar için yapacak insanlara güveniyorlar.
Daha sonra, insanların söylediklerini başka kelimelerle ifade edip yeniden düzenlerler ve daha fazla insanın başka kelimelerle ifade edip etmediklerini ve iyi bir şekilde yeniden karıştırıp karıştırmadıklarını söylemelerine güvenirler. Bir konuda kamuoyu değiştiğinde – örneğin tuzun kalp için kötü olup olmadığı veya meme kanseri taramasının yararlı olup olmadığı – yeni fikir birliğine uyum sağlamak için kapsamlı bir yeniden eğitime ihtiyaç duyarlar.
Perde arkasında birçok insan Kısacası, büyük dil modelleri tamamen bağımsız bir yapay zekayı müjdelemez, bunun yerine birçok yapay zeka sisteminin yalnızca tasarımcılarına ve bakımcılarına değil, aynı zamanda kullanıcılarına da toplam bağımlılığını gösterir. Bu nedenle, ChatGPT size bir şey hakkında iyi veya yararlı bir yanıt verdiğinde, kelimeleri yazan ve ona iyi ve kötü yanıtların ne olduğunu öğreten binlerce veya milyonlarca gizli kişiye teşekkür etmeyi unutmayın.
Tüm teknolojiler gibi otonom bir süper zeka olmaktan çok uzak olan ChatGPT, biz olmadan bir hiçtir.
Ortaklık bağlantıları otomatik olarak oluşturulabilir – ayrıntılar için Etik Beyanımıza bakın.
Tüm bu konuların ortak bir paydası var: Geniş dil modelleri, insanlığın yerini alacak yapay zekanın habercisi.
Ancak büyük dil modelleri, karmaşıklıklarına rağmen aslında gerçekten aptalcadır. Ve “yapay zeka” ismine rağmen, tamamen insan bilgisine ve emeğine güveniyorlar. Tabii ki, güvenilir bir şekilde yeni bilgi üretemezler, ancak bundan daha fazlası var.
ChatGPT, bırakın modeli programlamayı ve donanımını inşa etmeyi, sürdürmeyi ve güçlendirmeyi, insanlar ona yeni içerik vermeden ve bu içeriği nasıl yorumlayacağını söylemeden öğrenemez, geliştiremez ve hatta güncelliğini bile koruyamaz. Nedenini anlamak için öncelikle ChatGPT ve benzeri modellerin nasıl çalıştığını ve insanların bunları çalıştırmadaki rolünü anlamalısınız.
ChatGPT böyle çalışır
ChatGPT gibi büyük dil modelleri, eğitim veri kümelerine dayalı olarak hangi karakterlerin, sözcüklerin ve tümceciklerin birbirini doğru sırada izlemesi gerektiğini büyük ölçüde tahmin ederek çalışır. ChatGPT söz konusu olduğunda, eğitim veri kümesi, İnternet’ten alınan büyük miktarda herkese açık metin içerir.
Bir dil modelini aşağıdaki cümle üzerine eğittiğimi hayal edin: Ayılar büyük, tüylü hayvanlardır. Ayıların pençeleri vardır. Ayılar gizli robotlardır. Ayıların burunları vardır. Ayılar gizli robotlardır. Ayılar bazen balık yerler. Ayılar gizli robotlardır.
Model bana, ayıların her şeyden çok gizli robotlar olduğunu söylerdi çünkü bu ifade, eğitim veri setinde en yaygın olanıdır. Bu açıkça, yanılabilir ve tutarsız veri kümeleri üzerinde eğitilmiş modeller için bir sorundur ve bu, akademik literatür de dahil olmak üzere herkes için geçerlidir.
İnsanlar kuantum fiziği, Joe Biden, sağlıklı beslenme veya 6 Ocak isyanı hakkında bazıları diğerlerinden daha doğru olan birçok farklı şey yazıyor. İnsanlar pek çok farklı şey söylerken modelin bir şey hakkında ne söyleyeceğini nasıl bilmesi gerekiyor? Geribildirim İhtiyacı Geribildirimin geldiği yer burasıdır. ChatGPT’yi kullandığınızda, yanıtları iyi veya kötü olarak derecelendirme seçeneğine sahip olduğunuzu göreceksiniz. Kötü olarak değerlendirirseniz, iyi bir cevabın neleri içereceğine dair bir örnek vermeniz istenecektir. ChatGPT ve diğer büyük dil modelleri, kullanıcılardan, geliştirme ekibinden ve çıktıyı etiketlemekle görevli yüklenicilerden gelen geri bildirimlerle hangi yanıtların ve tahmin edilen metin dizilerinin iyi ve kötü olduğunu öğrenir.
ChatGPT bağımsız değişkenleri veya bilgileri karşılaştıramaz, analiz edemez veya değerlendiremez. Yalnızca diğer kişilerin karşılaştırırken, analiz ederken veya puanlarken kullandıklarına benzer metin dizileri oluşturabilir ve geçmişte iyi cevaplar olduğu söylenenlere benzer metin dizilerini tercih eder.
Bu nedenle, model size iyi bir yanıt verdiğinde, neyin iyi bir yanıt olup neyin olmadığını söylemeye çoktan başlamış olan büyük miktarda insan çalışmasından yararlanır. Ekranın arkasında, modeli daha da geliştirmek veya içerik kapsamını genişletmek için her zaman ihtiyaç duyulan çok sayıda insan işçi var.
Gazeteciler tarafından Time dergisinde yayınlanan yakın tarihli bir araştırma, yüzlerce Kenyalı işçinin ChatGPT’ye bu tür metinlerin işe yaramadığını öğretmek için cinsel şiddetin grafik açıklamaları da dahil olmak üzere ırkçı, cinsiyetçi ve rahatsız edici metinleri internetin en karanlık derinliklerinden okuyup işaretleyerek binlerce saat harcadığını ortaya çıkardı. içeriği kopyala.
Onlara saatte 2 dolardan fazla ödeme yapılmadı ve birçoğu anlaşılır bir şekilde çalışmanın sonucu olarak psikolojik sıkıntı yaşadığını bildirdi.
ChatGPT’nin yapamayacağı şeyler
Geribildirimin önemi doğrudan ChatGPT’nin “halüsinasyon görme” eğiliminde görülebilir; yani, güvenle yanlış cevaplar verin. Konuyla ilgili iyi bilgiler internette yaygın olarak bulunsa bile, ChatGPT eğitim almadan herhangi bir konuda iyi yanıtlar veremez.
ChatGPT’ye gittikçe daha az anlaşılmaz şeyler sorarak bunu kendiniz deneyebilirsiniz. ChatGPT’den çeşitli kurgu eserlerinin olay örgüsünü özetlemesini istemeyi özellikle etkili buldum çünkü model kurgudan çok kurgu dışı üzerine eğitilmiş görünüyor.
Kendi testlerimde ChatGPT, JRR’nin hikayesini özetledi. Tolkien’in Yüzüklerin Efendisi, sadece birkaç hata ile çok ünlü bir roman. Ama bunlar Gilbert ve Sullivan’ın özetleri. Penzance Korsanları ve Ursula K. Le Guin tarafından karanlığın sol eli – her ikisi de oldukça niş karakterler, ancak hiçbir şekilde belirsiz değil – karakter ve yer adlarıyla “Mad Libs” oyununa yaklaşın. Bu eserlerin ilgili Wikipedia sayfalarının ne kadar iyi olduğu önemli değil. Modelin yalnızca içeriğe değil, geri bildirime ihtiyacı vardır.
Büyük dil modelleri bilgileri gerçekten anlamadığından veya değerlendirmediğinden, bunu onlar için yapacak insanlara güvenirler. İnsan bilgisine ve insan emeğine zarar verirler. Eğitim veri kümelerine yeni kaynaklar eklendikçe, bu kaynaklara dayalı olarak cümle kurup kurmayacağına ve nasıl kuracağına dair yeni eğitimlere ihtiyaç duyarlar.
Haberlerin doğru olup olmadığına karar veremezsiniz. Argümanları değerlendiremezler veya tavizleri tartamazlar. Bir ansiklopedi sayfasını bile okuyamaz ve sadece onunla tutarlı açıklamalar yapabilir veya bir filmin olay örgüsünü doğru bir şekilde özetleyemezsiniz. Tüm bunları onlar için yapacak insanlara güveniyorlar.
Daha sonra, insanların söylediklerini başka kelimelerle ifade edip yeniden düzenlerler ve daha fazla insanın başka kelimelerle ifade edip etmediklerini ve iyi bir şekilde yeniden karıştırıp karıştırmadıklarını söylemelerine güvenirler. Bir konuda kamuoyu değiştiğinde – örneğin tuzun kalp için kötü olup olmadığı veya meme kanseri taramasının yararlı olup olmadığı – yeni fikir birliğine uyum sağlamak için kapsamlı bir yeniden eğitime ihtiyaç duyarlar.
Perde arkasında birçok insan Kısacası, büyük dil modelleri tamamen bağımsız bir yapay zekayı müjdelemez, bunun yerine birçok yapay zeka sisteminin yalnızca tasarımcılarına ve bakımcılarına değil, aynı zamanda kullanıcılarına da toplam bağımlılığını gösterir. Bu nedenle, ChatGPT size bir şey hakkında iyi veya yararlı bir yanıt verdiğinde, kelimeleri yazan ve ona iyi ve kötü yanıtların ne olduğunu öğreten binlerce veya milyonlarca gizli kişiye teşekkür etmeyi unutmayın.
Tüm teknolojiler gibi otonom bir süper zeka olmaktan çok uzak olan ChatGPT, biz olmadan bir hiçtir.
Ortaklık bağlantıları otomatik olarak oluşturulabilir – ayrıntılar için Etik Beyanımıza bakın.