Жасанды интеллект (ЖИ) қазіргі таңда адамнан асып түспегенімен, оның даму қарқыны жоғары, және METR ұйымының зерттеуіне сәйкес, ол көптеген жобаларды адамнан жылдамырақ орындай алатын деңгейге бұрын күткеннен ерте жетуі мүмкін.
Бүгінде программалау — ЖИ шынайы жұмыс істеп жатқан салалардың бірі. Әсіресе бұл тақырып бағдарламашылардың өздері үшін өзекті. Калифорниядағы Беркли қаласында орналасқан METR атты коммерциялық емес ұйым кодтау, киберқауіпсіздік, жалпы логикалық ойлау мен машиналық оқыту саласына қатысты шамамен 170 нақты тапсырма әзірлеп, оларды тәжірибелі бағдарламашылардың орындау уақытымен салыстырды.
Содан соң зерттеушілер жасанды интеллекттің даму деңгейін бағалау үшін «тапсырманы орындау уақытының көкжиегі» деген арнайы метриканы енгізді. Бұл – модель белгілі бір табыс көрсеткішімен орындай алатын тапсырмаларға адамдардың әдетте қанша уақыт жұмсайтынын көрсететін көрсеткіш.
2025 жылдың наурызында жарияланған зерттеу нәтижесінде GPT-2 моделі (2019 жылғы OpenAI-дің алғашқы ірі тілдік моделі) адамға бір минуттан көп уақыт қажет болатын бірде-бір тапсырманы орындай алмағаны белгілі болды. Ал 2025 жылы шыққан Claude 3.7 Sonnet моделі адамдар 59 минут жұмсайтын тапсырмалардың 50%-ын сәтті орындады.
METR келтірген деректерге сүйенсек, 2019 жылдан бері алдыңғы қатарлы ЖИ модельдерінің тапсырма орындау уақытының көкжиегі әр жеті ай сайын екі еселеніп отырған. 2024 жылы бұл өсім тіпті жылдамдап, әр үш ай сайын еселенген.
Прогноз: бір айлық тапсырма — бес жылдың ішінде
Егер осы даму қарқыны сақталса, ЖИ модельдері 2029 жылға дейін (немесе ертерек) адам бір айда орындайтын тапсырмаларды 50% табыспен орындай алатын деңгейге жетуі мүмкін. Бұл бір айлық еңбек, мысалы, жаңа компания ашу немесе ғылыми жаңалық ашу сияқты үлкен нәтижелерге әкелуі мүмкін.
Алайда Торонто университетінің профессоры, экономист Джошуа Ганс бұл сияқты болжамдарға сақтықпен қарауға шақырады: «ЖИ нақты қалай пайдаланылатыны туралы біз әлі де көп нәрсе білмейміз, сондықтан мұндай болжамдар аса сенімді емес».
Метрика қалай жұмыс істейді
METR командасы 50%-дық табыстылық шегін таңдады, өйткені бұл көрсеткіш деректер үлестіріміндегі кіші өзгерістерге аса сезімтал емес. Егер табыстылық шегін 80%-ға көтерсек, тапсырма орындау көкжиегі бес есе қысқарады. Бірақ жалпы үрдіс өзгермейді.
Соңғы бес жылдағы жетістіктер ЖИ-дің логикалық ойлау қабілеті, құралдарды пайдалану, қателерді түзету және тапсырма барысында өзін-өзі бақылауы сияқты аспектілермен байланысты.
Шектеулер және болашағы
Зерттеуші әрі кәсіпкер Антон Тройников ЖИ модельдерінің экономикалық тиімділігін бағалауда бұл метриканың пайдалы екенін айтады, бірақ ол модельдердің жаңа, үйренбеген тапсырмаларды қалай орындай алатынын көрсетпейді дейді.
METR бұл әдістің нақты өмірдегі жұмыстың күрделілігін толық қамтымайтынын мойындайды, бірақ тапсырмалар мен шынайы жұмыс арасындағы ұқсастықтың жоғары екенін айтады.
Алдағы жылдары ЖИ-дің даму қарқыны есептеу қуатымен және экономикалық шектеулермен тежелуі мүмкін. Бірақ алгоритмдер жетілдірілсе және ЖИ модельдерін тиімді қолдануға деген ұмтылыс артса, бұл шектеулердің орнын толтыруға болады.
Қорытынды
Қазіргі ЖИ модельдері көптеген тестілерде адамнан асып түсіп жатыр. Бірақ олардың нақты экономикалық әсері әзірге шектеулі. METR зерттеуі мұның бір себебі ретінде: адам 40 минутта орындайтын тапсырма аз болғандықтан, ЖИ-дің әлеуеті толық іске аспай отырғанын көрсетеді.
Кейбір сарапшылар болашақта адам мен ЖИ тандемі тапсырмаларды әлдеқайда тиімді орындай алады деп есептейді.