OpenAI njoftoi të martën lançimin e dy modeleve të hapura me peshë të AI-së për arsyetim, të cilat kanë aftësi të ngjashme me modelet e serisë “o”. Të dy modelet janë të disponueshme falas për shkarkim në platformën për zhvillues Hugging Face, ku kompania i përshkruan si “më të avancuarat” në performancë sipas disa standardeve krahasuese të modeleve të hapura.
Modelet janë lëshuar në dy madhësi:
-
gpt-oss-120b – më i fuqishmi, mund të funksionojë në një GPU të vetme Nvidia
-
gpt-oss-20b – më i lehtë, mund të funksionojë në një laptop konsumatori me 16 GB RAM
Ky është modeli i parë i hapur i OpenAI që nga GPT-2, i publikuar më shumë se pesë vite më parë.
Gjatë një prezantimi për shtyp, OpenAI tha se këto modele të hapura mund të dërgojnë kërkesa komplekse drejt modeleve më të fuqishme të kompanisë në cloud. Kjo do të thotë që nëse një model i hapur nuk e përballon një detyrë të caktuar – për shembull përpunimin e një imazhi – zhvilluesit mund ta lidhin atë me një nga modelet më të avancuara të mbyllura të OpenAI.
Historikisht, OpenAI ka ndjekur një qasje më të mbyllur dhe pronësore, duke shitur akses për modelet e saj përmes API-ve. Megjithatë, CEO Sam Altman ka deklaruar më herët këtë vit se kompania ka qenë “në anën e gabuar të historisë” në lidhje me qasjen ndaj open source.
OpenAI është përballur me presion në rritje nga laboratorë kinezë të AI-së – si DeepSeek, Qwen i Alibaba-s dhe Moonshot AI – të cilët kanë zhvilluar disa nga modelet më të fuqishme dhe popullore të hapura. Ndërkohë, Meta ka humbur terren në këtë hapësirë me modelet LLaMA.
Në korrik, administrata Trump i bëri thirrje zhvilluesve amerikanë të hapin më shumë teknologjitë e tyre për të nxitur përdorimin global të AI-së që përfaqëson vlerat amerikane.
Qëllimi: Model i lirë dhe amerikan për të gjithë
“Që nga viti 2015, misioni i OpenAI është të sigurojë që AGI-ja t’i shërbejë gjithë njerëzimit,” tha Altman.
“Me këtë lançim, ne duam që bota të ndërtojë mbi një shtyllë të hapur të AI-së të krijuar në SHBA, me vlera demokratike, e disponueshme falas për të gjithë.”
Performanca e modeleve gpt-oss
-
Në testin Codeforces (me mjete për programim):
-
gpt-oss-120b: 2622 pikë
-
gpt-oss-20b: 2516 pikë
-
Të dy e tejkalojnë DeepSeek R1, por mbeten pas o3 dhe o4-mini të OpenAI.
-
-
Në testin Humanity’s Last Exam (HLE):
-
gpt-oss-120b: 19%
-
gpt-oss-20b: 17.3%
-
Sërish, më të mirë se modelet e hapura nga DeepSeek dhe Qwen, por më të dobët se o3.
-
Hallucinimet dhe saktësia
Modelet gpt-oss kanë më shumë hallucinime sesa modelet më të avancuara të OpenAI:
-
Në testin PersonQA për njohuritë rreth njerëzve:
-
gpt-oss-120b hallucinoi në 49% të rasteve
-
gpt-oss-20b në 53%
-
Krahasuar me vetëm 16% për o1 dhe 36% për o4-mini
-
Sipas OpenAI, kjo është e pritshme për modelet më të vogla, të cilat kanë më pak “njohuri botërore” dhe priren të hallucionojnë më shumë.
Trajnimi dhe arkitektura
-
Modelet janë trajnuar me procese të ngjashme me ato të modeleve të mbyllura të OpenAI.
-
Të dy përdorin arkitekturën Mixture-of-Experts (MoE), duke aktivizuar vetëm një pjesë të vogël të parametrave për çdo token.
-
gpt-oss-120b: vetëm 5.1 miliardë parametra aktivizohen për çdo token nga gjithsej 117 miliardë.
-
-
Përdoret edhe Reinforcement Learning me kapacitet të lartë kompjuterik, për të mësuar sjellje të sakta përmes simulimeve.
Kjo i bën modelet veçanërisht të mira për agjentë AI që duhet të thërrasin mjete si web search ose ekzekutim Python-i.
Megjithatë, janë vetëm tekstuale – nuk mund të gjenerojnë ose përpunojnë imazhe apo audio.
Licencimi dhe siguria
-
Modelet janë lëshuar nën licencën Apache 2.0 – një nga më lehtësueset për përdorim dhe komercializim.
-
Por OpenAI nuk ka publikuar të dhënat e trajnimit, për shkak të shqetësimeve ligjore mbi të drejtat e autorit.
OpenAI gjithashtu deklaroi se ka kryer testime për të parë nëse modelet mund të përdoren në mënyrë keqdashëse (p.sh., për bioarmë).
Rezultatet nuk treguan rrezik të lartë.
Në vijim…
Të gjithë sytë tani janë nga DeepSeek R2 dhe modeli i ardhshëm i Meta Superintelligence Lab, të cilët pritet të rivalizojnë fuqishëm këtë hap të ri të OpenAI në fushën e open source.