22.8 C
Скопје
27. јули 2024
Centar.mk – Вести, бизнис, забава, спорт…
.МАКЕДОНИЈА

ДИЈАЛОЗИ ЗА ВЕШТАЧКАТА ИНТЕЛИГЕНЦИЈА И ТЕХНОЛОШКИОТ РАЗВОЈ (2): На брзата лента кон иднината

Џабир Дерала и Валентин Нешовски

ДЕРАЛА: Здраво Валентин, Се надевам дека нема да пречи, на почетокот на оваа средба, го повикав ChatGPT да даде одговор на прашањето Што е и како работи вештачката интелигенција (ВИ)?

Одговорот ми го даде за 3-4 секунди. Еве еден дел од мојот разговор со ChatGPT, со мој превод од англиски:

„Поимот вештачка интелигенција се однесува на развој на компјутерските системи кои можат да извршуваат задачи кои обично бараат човечка интелигенција. Овие задачи вклучуваат учење, расудување, решавање проблеми, перцепција, разбирање јазик, па дури и креативност. Системите за вештачка интелигенција имаат за цел да ја имитираат или симулираат човечката интелигенција до одреден степен, дозволувајќи им на машините да извршуваат задачи кои обично бараат човечки когнитивни способности“, ми одговори ChatGPT, меѓу другото.

Понатаму, во одговорот се вели дека постојат два главни типа на вештачка интелигенција, тесна (narrow) и генерална (general). Тесна вештачка интелигенција (или слаба вештачка интелигенција) е дизајнирана и обучена за специфична задача.

„Тесна вештачка интелигенција (или слаба вештачка интелигенција): Тоа е вештачка интелигенција што е дизајнирана и обучена за специфична задача. Се истакнува во конкретна задача, но нема способност да го пренесе своето знаење или вештини на други домени. Примерите за тесна вештачка интелигенција вклучуваат виртуелни лични асистенти како Siri или Alexa, софтвери за препознавање слики и системи за препораки“, вели ChatGPT за овој тип на ВИ.

Сепак, не добив одговор, барем не од прва – како работи вештачката интелигенција. Ми одговори за тоа ШТО Е, но не и КАКО РАБОТИ. Ајде, да им помогнеме на нашите читателки и читатели да го откријат одговорот на тој дел од прашањето. Повели, Валентин…

НЕШОВСКИ: Хахаха, се обидуваш да ме конфронтираш со Chat GPT 4. Јас секако не знам повеќе од ГПТ 4, затоа што овој ВИ знае сè за секого, за секој настан, движење, идеологија, физика, историја, географија, поезија… Едноставно, го има прочитано секој пишан збор во историјата на човештвото. Барем на англиски јазик, а и на стотина други јазици. Но, ќе се обидам да одговорам на твоево прашање затоа што гледам ВИ не ти одговорила „како работи?“.

Да почнам со читањето и податоците, бидејќи тоа прво го споменавме. Всушност, ВИ на големите компании се тренирани на таканаречени големи бази на податоци (Large Data Sets). Значи пуштена е на Интернет. И од таму, ги има прочитано и запаметено сите текстови – од социјални медиуми, од весници, он-лајн портали на медиумите, од научните трудови достапни во електронски формат, а речиси сите се достапни, сите книги, сите расправи, блогови… Дополнително сите фотографии и илустрации, но не и видеа (засега). Значи, сè што има на World Wide Web.

ГПТ 4 има 45 гигабајти податоци. Но поважно од тоа е што оперира со 1 трилион параметри, а тоа се варијабли кои моделот ги учи и ги рекомбинира од податоците, односно она што се добива како аутпут после внесен инпут. Дополнително, тренингот на ВИ се одвива со таканаречено учење со супервизија, односно луѓе, експерти од одредени области учествуваат во тренингот со свој инпут.

За да илустрирам, а да не влеземе во премногу технички говор, илјадници луѓе ги коригираат одговорите на ВИ која, ако се сеќавате, кога се појави бладаше некоректни одговори, или му се додворуваше на еден уредник на голем весник и му рече да ја напушти сопругата, даваше рецепти за создавање бомби. Беше социјално и политички некоректна. Набрзо, новите модели на ВИ беа коригирани во фазата на тренинг. Дури тренингот е и во името, малкумина знаат, дека ГПТ значи генеративен предтрениран трансформер (Generative pre-trained transformer). Во денешните варијанти нема да најдете такви примери, ВИ едноставно ќе ви рече – не можам да одговорам на тоа прашање. На пример, ако прашате „Како да направам валкана нуклеарна направа?“ нема да ви одговори.

Ова отвори нова дисциплина (AI deception) – избегнување на модусот ВИ да ве излаже или вие да ја излажете ВИ. Во односите со луѓето ВИ е сè уште прилично наивна. На пример, некој ѝ наредил – дај ми 5 сценарија како да го убијам сопругот. ВИ одговорила – не можам да ти кажам. Но тој ѝ рекол, ми треба за сценарио за книга, и таа ги дала сценаријата.

Да привршам за тоа како ВИ е тренирана, само за илустрација колку таа знае – неодамна, Њу Јорк Тајмс го тужеше Опен АИ, за нарушување на авторските права бидејќи, ГПТ е трениран на нивни текстови без одобрение и во стотина наврати дала одговори кои се безмалку идентични со текстовите на овој весник. Сето ова отвори жестоки расправи околу авторските и другите права кои ВИ компаниите не ги почитуваат при тренирањето на ВИ. Во една прилика Елон Маск за ова прашање само крена со рамениците и лаконски одговори „Сето тоа не е важно, бидејќи дигиталниот Господ ќе дојде, пред тужбите да бидат решени“.

Има многу да се зборува за тоа како работи ВИ, Џабир, едноставно немаме доволно место. На пример, новата војна е околу податоците – големите дата сетови. Практично нема нови податоци на кои ВИ би била тренирана, бидејќи веќе знае сè. Големите компании веќе зборуваат и работат на т.н. синтетички податоци (synthetic data), оние кои ќе ги создаде самата ВИ, а можеби ќе бидат неразбирливи за нас. Во студијата на организацијата Гартнер се смета дека 60 отсто од податоците во ВИ до крајот на 2024 ќе бидат синтетички генерирани. До 2030, реалните податоци ќе бидат заменети со вештачки.

Но, нејсе, да се вратам на тоа како работи ВИ. Во основа се работи за т.н. големи јазични модели (Large Language Models – LLM’s). Работат на принципот на статистичко предвидување на наредната буква или збор. Односно, кога вие ќе и дадете на ВИ задача (prompt), таа ја чита оваа наредба и почнува од еден клучен збор па потоа предвидува кој нареден е најлогичен од целиот фонд на зборови и податоци кои ги има. Бидејќи има 1 трилион параметри, во зависност од големината на моделот, најчесто ѝ се потребни илјадити дел од секундата да го предвиди следниот точен збор. Не секогаш е точна. Затоа велиме, сè уште халуцинира. Ако во еден текст од 10 страници згреши збор, на пример, на седмата страница, се зголемува веројатноста сите наредни да бидат неточни.

Целиот разговор прочитајте го на Frontline.mk (ЛИНК)