मुंबई : ओपनएआयने अलीकडेच जीपीटी-५ एआय मॉडेलची चाचणी घेण्यासाठी एक नवीन बेंचमार्क जीडीपीव्हल लाँच केला. ही चाचणी विविध उद्योग आणि नोकऱ्यांमध्ये व्यावसायिक मानवांच्या तुलनेत एआय मॉडेल किती चांगले कामगिरी करू शकते, हे मोजते. ओपनएआयच्या प्रणाली आर्थिकदृष्ट्या महत्त्वाच्या कामांमध्ये मानवी तज्ञांच्या पातळीवर पोहोचल्या आहेत की नाही हे समजून घेणे हे जीडीपीव्हलचे उद्दिष्ट आहे.
जीपीटी-५ आणि अँथ्रोपिकचे क्लाउड ओपस ४.१ मॉडेल आता उद्योग तज्ञांच्या कामगिरीच्या जवळ आहेत. जीपीटी-५-हाय व्हर्जन ४४ कामांपैकी ४०.६% कामांमध्ये तज्ञांच्या बरोबरीची किंवा त्यापेक्षा चांगली असल्याचे आढळून आले. क्लाउड ओपस ४.१ अंदाजे ४९% कामांमध्ये मानवी तज्ञांच्या बरोबरीची होती. जीडीपीव्हल देशाच्या जीडीपीमध्ये सर्वाधिक योगदान देणाऱ्या नऊ प्रमुख अमेरिकन उद्योगांमध्ये एआय मॉडेलची चाचणी करते.
यामध्ये आरोग्यसेवा, वित्त, उत्पादन आणि सरकारी सेवांचा समावेश आहे. हा बेंचमार्क सॉफ्टवेअर अभियंते, परिचारिका, पत्रकार आणि इतर व्यावसायिकांच्या कामाची तुलना एआयने केलेल्या कामाशी करतो. ओपनएआयने व्यावसायिकांना अहवालांची तुलना मानवांनी तयार केलेल्या अहवालांशी करण्यास सांगितले. सरासरी एआय कामगिरीची गणना केली गेली. त्यानंतर महत्त्वपूर्ण निष्कर्ष समोर आले आहेत.
चाचणीचे महत्त्व नेमकं काय?
जीपीटी-५ ची कामगिरी प्रभावी असली तरी, ही चाचणी फक्त काही विशिष्ट कार्यांचे मूल्यांकन करते. व्यावसायिक कार्यांमध्ये रिपोर्टिंगपेक्षा खूपच जास्त जटिलता असते. ओपनएआयने म्हटले आहे की भविष्यात, ते अधिक उद्योग आणि परस्परसंवादी कार्यप्रवाह समाविष्ट करण्यासाठी चाचणीचा विस्तार करतील.


