اوپن اے آئی کی جانب سے جی پی ٹی-4.1 ماڈلز کا نیا سلسلہ – کوڈنگ اور تفصیلی ہدایات پر عمل درآمد میں ایک بڑا قدم


اوپن اے آئی نے ابھی حال ہی میں مصنوعی ذہانت کے ماڈلز کا ایک نیا خاندان متعارف کرایا ہے، جسے جی پی ٹی-4.1 کا نام دیا گیا ہے۔ اس سلسلے میں جی پی ٹی-4.1، جی پی ٹی-4.1 منی، اور جی پی ٹی-4.1 نینو شامل ہیں۔

یہ ماڈلز، جو اب اوپن اے آئی کے اے پی آئی کے ذریعے دستیاب ہیں، کوڈنگ میں مہارت حاصل کرنے اور تفصیلی ہدایات پر عمل کرنے کے لیے بنائے گئے ہیں۔ یہ مصنوعی ذہانت کی مدد سے سافٹ ویئر انجینئرنگ کی جانب ایک اہم پیش رفت ہے۔

ان ماڈلز کی ایک نمایاں خصوصیت ان کی 10 لاکھ ٹوکن کی وسیع سیاق و سباق کی ونڈو ہے، جو انہیں تقریباً 7 لاکھ 50 ہزار الفاظ کو ایک ساتھ پروسیس کرنے کی صلاحیت دیتی ہے – جو کہ وار اینڈ پیس کی لمبائی سے بھی زیادہ ہے۔ تاہم، جی پی ٹی-4.1 ماڈلز کو فی الحال چیٹ جی پی ٹی میں ضم نہیں کیا گیا ہے۔ یہ اجراء ایک ایسے وقت میں سامنے آیا ہے جب مصنوعی ذہانت کے میدان میں مقابلہ تیز ہو رہا ہے، اور گوگل اور اینتھروپک جیسے حریف اپنے اعلیٰ کارکردگی والے ماڈلز کو آگے بڑھا رہے ہیں۔ گوگل کے جیمنی 2.5 پرو اور اینتھروپک کے کلاڈ 3.7 سونیٹ، جن میں بھی 10 لاکھ ٹوکن کی صلاحیت موجود ہے، نے مقبول کوڈنگ بینچ مارکس میں مضبوط نتائج حاصل کیے ہیں۔ چینی اسٹارٹ اپ ڈیپ سیک بھی اپنے اپ ڈیٹ شدہ وی 3 ماڈل کے ساتھ پیش قدمی کر رہا ہے۔

اوپن اے آئی کا طویل مدتی مقصد ایک مکمل طور پر قابل مصنوعی ذہانت کا سافٹ ویئر انجینئر بنانا ہے – یا، کمپنی کی سی ایف او سارہ فریئر کے الفاظ میں، ایک “ایجنٹک سافٹ ویئر انجینئر” جو پورے ایپ ڈیولپمنٹ سائیکل کو سنبھال سکے، جس میں کوڈ لکھنا، ڈیبگ کرنا، کیو اے اور دستاویزات شامل ہیں۔

جی پی ٹی-4.1 اس سمت میں اہم پیش رفت کرتا ہے۔ اوپن اے آئی کے مطابق، ماڈل کو براہ راست ڈویلپر کی رائے کی بنیاد پر بہتر بنایا گیا ہے، جو اسے فرنٹ اینڈ کوڈنگ، فارمیٹنگ اور ساخت کی پابندی، ٹول کے استعمال میں مستقل مزاجی، اور غیر ضروری ایڈیٹنگ میں کمی جیسے شعبوں میں زیادہ موثر اور قابل اعتماد بناتا ہے۔

اوپن اے آئی نے ٹیک کرنچ کو ایک بیان میں کہا، “یہ بہتری ڈویلپرز کو ایسے ایجنٹس بنانے کے قابل بناتی ہے جو حقیقی دنیا کے سافٹ ویئر انجینئرنگ کے کاموں میں نمایاں طور پر بہتر ہیں۔”

بینچ مارک کارکردگی

اوپن اے آئی کا دعویٰ ہے کہ جی پی ٹی-4.1 اپنے پیشروؤں (جی پی ٹی-4o اور جی پی ٹی-4o منی) سے ایس ڈبلیو ای-بینچ جیسے بینچ مارکس پر بہتر کارکردگی کا مظاہرہ کرتا ہے، جو حقیقی دنیا کے سافٹ ویئر انجینئرنگ کے کاموں کا جائزہ لیتا ہے۔ اگرچہ مکمل جی پی ٹی-4.1 ماڈل زیادہ درستگی پیش کرتا ہے، لیکن منی اور نینو ورژن رفتار اور کارکردگی کو ترجیح دیتے ہیں – نینو اوپن اے آئی کا اب تک کا سب سے تیز اور سب سے سستا ماڈل ہے۔

جی پی ٹی-4.1: $2/ملین ان پٹ ٹوکن، $8/ملین آؤٹ پٹ ٹوکن جی پی ٹی-4.1 منی: $0.40/ملین ان پٹ، $1.60/ملین آؤٹ پٹ جی پی ٹی-4.1 نینو: $0.10/ملین ان پٹ، $0.40/ملین آؤٹ پٹ

اوپن اے آئی کی اندرونی جانچ کے مطابق، جی پی ٹی-4.1 نے ایس ڈبلیو ای-بینچ ویریفائیڈ پر 52% سے 54.6% اسکور کیا۔ اس کے مقابلے میں، گوگل کے جیمنی 2.5 پرو نے 63.8% اور کلاڈ 3.7 سونیٹ نے 62.3% اسکور کیا۔

جی پی ٹی-4.1 نے ویڈیو کی تفہیم میں بھی اچھا اسکور کیا۔ ویڈیو-ایم ایم ای کی تشخیص میں، اس نے بغیر سب ٹائٹلز والی طویل ویڈیوز پر 72% درستگی حاصل کی – جو کہ تمام آزمائے گئے ماڈلز میں سب سے زیادہ ہے۔

حدود اور قابل اعتمادی

ان پیشرفتوں کے باوجود، اوپن اے آئی تسلیم کرتا ہے کہ جی پی ٹی-4.1 بھی کامل نہیں ہے۔ یہ ماڈل اب بھی کوڈ میں بگ متعارف کروا سکتا ہے یا انہیں ٹھیک کرنے میں ناکام ہو سکتا ہے اور انتہائی طویل پرامپٹس کے ساتھ کم درست ہو سکتا ہے۔ کمپنی کے اپنے اوپن اے آئی-ایم آر سی آر ٹیسٹ پر، ماڈل کی درستگی 8,000 ٹوکن پر 84% سے گر کر 10 لاکھ ٹوکن پر صرف 50% رہ گئی۔

اس کے علاوہ، جی پی ٹی-4.1 کا رجحان جی پی ٹی-4o کے مقابلے میں زیادہ لفظی ہونے کا ہے، جس کی وجہ سے بہترین نتائج حاصل کرنے کے لیے بعض اوقات زیادہ واضح اور صریح پرامپٹس کی ضرورت ہوتی ہے۔

پھر بھی، جی پی ٹی-4.1 کا اجراء مکمل طور پر خود مختار کوڈنگ ٹولز کی دوڑ میں ایک اور بڑا قدم ہے، جس میں اوپن اے آئی نے مصنوعی ذہانت سے چلنے والی سافٹ ویئر انجینئرنگ کے اپنے پرجوش وژن کی بنیاد رکھی ہے۔


اپنا تبصرہ لکھیں