Meta yeni güclü AI modelini təqdim etdi Llama 2 Long

Meta Platformalar Kaliforniyada illik Meta Connect tədbirində təqdim populyar tətbiqləri üçün bir neçə yeni AI xüsusiyyətləri Facebook, Instagram və WhatsApp, lakin texnoloji nəhəngin ən təsirli yeniliyi çoxları tərəfindən diqqətdən kənarda qalmış ola bilər. Söhbət Llama 2 Long AI modelindən gedir.

Meta şirkətindən olan bir qrup tədqiqatçı birtəhər sakitcə bir məqalə dərc edərək, onlar uzun istifadəçi sorğularına ardıcıl və uyğun cavablar yarada bilən yeni süni intellekt modeli Llama 2 Long təqdim etdilər. Deyirlər ki, ən çox bu, sənayedəki ən yaxşı rəqiblərdən üstündür.

Llama 2 Long uzantısıdır alov 2, müxtəlif məlumat mənbələrindən öyrənə və kodlaşdırma, riyaziyyat, dil anlayışı və s. kimi müxtəlif tapşırıqları yerinə yetirə bilən açıq mənbəli AI modeli Meta yayda buraxıldı. Bununla belə, Llama 2 Long daha uzun mətnləri ehtiva edən daha çox məlumat üzərində təlim keçmiş və bu alqoritm daha uzun məlumat ardıcıllığını idarə etmək üçün dəyişdirilmişdir. Bu, ona cavablar yaratmaq üçün istifadə edə biləcəkləri kontekstdə məhdudiyyətlərə malik olan OpenAI-nin GPT-3.5 Turbo və Claude 2-ni üstələməyə imkan verir.

Tədqiqatçılar Meta Llama 2-nin müxtəlif versiyalarından istifadə etdi - 7 milyarddan 70 milyarda qədər parametrlər, yəni AI modelinin məlumatlardan öyrənərək dəyişə biləcəyi dəyərlər. Onlar orijinal model verilənlər bazasından daha uzun mətnləri ehtiva edən daha 400 milyard token (mətn vahidi) məlumat əlavə etdilər. Onlar həmçinin Rotary Positional Embedding (Rope) texnikasından istifadə edərək süni intellekt modelinin arxitekturasını bir qədər dəyişdirdilər ki, model digər üsullarla müqayisədə daha az məlumat və yaddaşdan istifadə edərək dəqiq və faydalı cavablar yarada bilsin.

alov 2

Komanda, AI modelinin düzgün cavablara görə mükafatlandırıldığı və insan qiymətləndiriciləri tərəfindən düzəldildiyi və sintetik məlumatların Llama 2 söhbətinin özü tərəfindən yaradıldığı bir üsul olan insan rəyindən (RLHF) möhkəmləndirmə öyrənməsindən istifadə etdi. müxtəlif tapşırıqlarda performansını yaxşılaşdırmaq üçün. .

Qəzet iddia edir ki, model təxminən 200 səhifəlik mətnə bərabər olan 40 simvol uzunluğunda istifadəçi sorğularına yüksək keyfiyyətli cavablar yarada bilər. Tədqiqatçılar deyirlər ki, Llama 2 Long istifadəçilərin mürəkkəb və müxtəlif ehtiyaclarını ödəyə bilən daha ümumi və çox yönlü süni intellekt modellərinin yaradılması istiqamətində bir addımdır. Onlar həmçinin bu cür modellərin potensial etik və sosial nəticələrini tanıyır və onlardan necə məsuliyyətlə və faydalı istifadə etmək barədə əlavə araşdırmaya və dialoqa çağırırlar.

Həmçinin oxuyun:

Jerelomaraqlı mühəndislik

Qeydiyyatdan keçmək

0 Şərhlər

Daxil edilmiş rəylər

Bütün şərhlərə baxın

Digər məqalələr

Meta, uzun sorğularla daha yaxşı işləyən Llama 2 Long AI modelini təqdim etdi

Son şərhlər