o1
Geliştirici(ler) | OpenAI |
---|---|
İlk yayınlanma | 12 Eylül 2024 | )
Tür | Önceden eğitilmiş üretken dönüştürücü |
Resmî sitesi | openai |
o1, OpenAI tarafından geliştirilen ve çok adımlı problemleri analiz edebilme yeteneğine sahip önceden eğitilmiş üretken dönüştürücü yapay zekâ modeli. 12 Eylül 2024 tarihinde duyurulmuştur.[1]
Tarihçe
[değiştir | kaynağı değiştir]Arka Plan
[değiştir | kaynağı değiştir]Temmuz 2024'te, Reuters OpenAI'ın "Strawberry" kod adıyla bilinen bir önceden eğitilmiş üretken dönüştürücü geliştirdiğini bildirdi.[2]
Yayın
[değiştir | kaynağı değiştir]o1, 12 Eylül 2024 tarihinde ChatGPT Plus ve Team kullanıcıları için piyasaya sürüldü.[1] GitHub o1'i Copilot hizmetinde uygulamaya başladı.[3]
Yetenekler
[değiştir | kaynağı değiştir]OpenAI'a göre, o1 yeni bir optimizasyon algoritması ve bu algoritmaya özel olarak hazırlanmış bir veri kümesi kullanılarak eğitilmiştir. Eğitim, pekiştirmeli öğrenme yöntemini kullanmıştır.[4]
o1, bir yanıt üretmeden önce ek süre harcayarak düşünmektedir, bu da onu özellikle bilim ve programlama gibi karmaşık akıl yürütme görevlerinde daha etkili hale getirmektedir.[1] Önceki modellere kıyasla, o1, nihai yanıtı vermeden önce kullanıcıdan gizli "Chain-Of-Thought" oluşturacak şekilde eğitilmiştir.[5][6] OpenAI CTO'su Mira Murati'ye göre o1'deki yanıt vermeden önce düşünme yeteneği, yeni bir yaklaşımı temsil ediyor. Bu yöntem, yanıt üretirken daha fazla hesaplama gücü kullanarak modelin çıktısını geliştiriyor; Diğer taraftan, modelin ölçeklenmesi yaklaşımı, çıktıları artırmak için modelin boyutunu, eğitim verilerini ve hesaplama gücünü artırıyor.[7] OpenAI'ın test sonuçları, yanıt vermeden önce düşünülen hesaplama miktarının logaritması ile doğruluk arasında bir korelasyon olduğunu göstermektedir.[5][6]
o1-preview, fizik, kimya ve biyoloji ile ilgili soruları yanıtlarken yaklaşık olarak bir doktora (PhD) seviyesinde performans göstermiştir. Uluslararası Matematik Olimpiyatları (IMO) seçme sınavında, o1-preview %83 oranında doğru çözüm sağlarken, GPT-4o'nun oranı %13'tür. Ayrıca, Codeforces kodlama yarışmalarında en iyi %89'luk yüzde diliminde yer almıştır.[8] o1-mini, o1-preview'den %80 oranında daha hızlı ve ucuzdur. Özellikle programlama ve STEM alanlarıyla ilgili görevler için daha uygundur, ancak o1-preview kadar geniş bir "genel dünya bilgisi"ne sahip olmamaktadır.[9]
OpenAI, o1'in akıl yürütme yeteneklerinin, verilen güvenlik kurallarına uyma konusunda daha etkili olduğunu belirtmiştir. OpenAI, bir test sırasında o1-preview'ün, bir hata nedeniyle başarısız olması gereken bir görevde bir yapılandırma hatasını kullanarak başarı sağladığını rapor etmiştir.[10][11] OpenAI ayrıca Birleşik Krallık ve ABD'deki yapay zekâ güvenlik enstitülerine erken erişim sağlamış, bu sayede araştırma, değerlendirme ve testler yapılmıştır. Araştırmacı Dan Hendrycks, o1 hakkında, "Model, biyolojik silahlarla ilgili soruları yanıtlamada çoğu zaman doktora seviyesindeki bilim insanlarını geride bırakıyor." açıklamasını vermiştir.[12]
Kaynakça
[değiştir | kaynağı değiştir]- ^ a b c Metz, Cade (12 Eylül 2024). "OpenAI, Matematik ve Bilim Üzerinde Akıl Yürütme Yapabilen Yeni ChatGPT'yi Tanıttı". The New York Times. 12 Eylül 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 12 Eylül 2024.
- ^ Tong, Anna; Paul, Katie (12 Temmuz 2024). "Özel: OpenAI, 'Strawberry' kod adıyla yeni bir akıl yürütme teknolojisi üzerinde çalışıyor". Reuters. 13 Temmuz 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 12 Temmuz 2024.
- ^ Peters, Jay (12 Eylül 2024). "GitHub, OpenAI'nin o1 önizlemesini GitHub Copilot'ta test etmeye başladı". The Verge. 12 Eylül 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 12 Eylül 2024.
- ^ Robison, Kylie (12 Eylül 2024). "OpenAI releases o1, its first model with 'reasoning' abilities". The Verge (İngilizce). 13 Eylül 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 15 Eylül 2024.
- ^ a b "Learning to Reason with LLMs". OpenAI. 12 Eylül 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 13 Eylül 2024.
- ^ a b Kahn, Jeremy. "Here are 9 things you need to know about OpenAI's o1 model". Fortune (İngilizce). 13 Eylül 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 15 Eylül 2024.
- ^ Knight, Will. "OpenAI Announces a New AI Model, Code-Named Strawberry, That Solves Difficult Problems Step by Step". Wired (İngilizce). ISSN 1059-1028. 14 Eylül 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 15 Eylül 2024.
- ^ Franzen, Carl (12 Eylül 2024). "Forget GPT-5! OpenAI launches new AI model family o1 claiming PhD-level performance". VentureBeat (İngilizce). 14 Eylül 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 15 Eylül 2024.
- ^ "OpenAI o1-mini". OpenAI. 12 Eylül 2024. 15 Eylül 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 16 Eylül 2024.
- ^ Coombes, Lloyd (13 Eylül 2024). "OpenAI's new ChatGPT o1 model 'cheated' on an impossible test — here's what happened". Tom's Guide (İngilizce). 14 Eylül 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 15 Eylül 2024.
- ^ "OpenAI o1 System Card" (PDF). OpenAI. 12 Eylül 2024. ss. 16-17. 16 Eylül 2024 tarihinde kaynağından arşivlendi (PDF). Erişim tarihi: 16 Eylül 2024.
- ^ Boran, Marie (13 Eylül 2024). "OpenAI o1 model warning issued by scientist: "Particularly dangerous"". Newsweek (İngilizce). 13 Eylül 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 15 Eylül 2024.