The History of Machine Learning: From Idea to Modern AI

Մեքենայական ուսուցման պատմությունը սկսվում է շատ ավելի վաղ, քան կարծում է մարդկանց մեծ մասը: Չատբոտերի հայտնվելուց դեռ շատ առաջ հեռատես մաթեմատիկոսները երազում էին այնպիսի մեքենաների մասին, որոնք կկարողանային սովորել: Այսօր այդ երազանքն է աշխատեցնում որոնողական համակարգերը, բժշկական սկանավորման սարքերն ու ինքնավար մեքենաները: Այդուհանդերձ, գաղափարից մինչև իրականություն տանող ճանապարհը տևեց տասնամյակներ: Այս հոդվածը պարզ լեզվով ներկայացնում է մեքենայական ուսուցման պատմությունը: Ավելին, այն ցույց է տալիս, թե ինչպես է յուրաքանչյուր դարաշրջան կառուցվել նախորդի հիմքի վրա: Արդյունքում դուք կհասկանաք ոչ միայն այն, թե ինչ է փոխվել, այլև՝ թե ինչու: Այսպիսով, եկեք սկսենք այնտեղից, որտեղից իրականում սկսվում է պատմությունը։

Իսկ ինչո՞ւ ընդհանրապես անդրադառնալ պատմությանը: Որովհետև անցյալն այնքան հստակ է բացատրում ներկան: Յուրաքանչյուր բեկումնային հայտնագործություն լուծել է մի խնդիր, որը նախորդ մեթոդները չէին կարողանում լուծել: Նույն կերպ, յուրաքանչյուր ձախողում տվել է դասեր, որոնք ձևավորել են հաջորդ փորձը: Հետևաբար, ժամանակի միջով այս արագ ճամփորդությունը շատ ավելի հեշտ է դարձնում ժամանակակից ԱԲ-ի ընկալումը: Բացի այդ, այն ցրում է այսօր այս ոլորտի շուրջ ստեղծված ավելորդ աղմուկի մեծ մասը:

Ինչ է իրականում նշանակում մեքենայական ուսուցում

Նախքան պատմությանն անդրադառնալը, հարկ է մի պահ կանգ առնել հիմունքների վրա: Մեքենայական ուսուցումը թույլ է տալիս համակարգիչներին կատարելագործվել որոշակի առաջադրանքում փորձի միջոցով: Ֆիքսված կանոնների հետևելու փոխարեն համակարգը սովորում է տվյալների օրինաչափությունները: Օրինակ՝ այն կարող է ուսումնասիրել հազարավոր լուսանկարներ՝ կատվին ճանաչելու համար: Ժամանակի ընթացքում այն ավելի լավ է կատարում աշխատանքը՝ առանց ծրագրավորողի կողմից յուրաքանչյուր քայլի նկարագրության:

Մեքենայական ուսուցման մի քանի հիմնարար հասկացություններ կարմիր թելով անցնում են այս ամբողջ պատմության միջով: Նախ՝ տվյալները սնուցում են գործընթացը, ուստի դրանց որակը չափազանց կարևոր է: Երկրորդ՝ մոդելն արձանագրում է այն օրինաչափությունները, որոնք գտնում են այդ տվյալներում: Երրորդ՝ մարզումը (ուսուցումը) հղկում է մոդելը, մինչև դրա կանխատեսումները բարելավվում են: Եվ վերջապես, թեստավորումն ստուգում է, թե արդյոք այդ կանխատեսումները ճիշտ են աշխատում նոր օրինակների վրա: Քանի որ այս գաղափարները կրկնվում են յուրաքանչյուր դարաշրջանում, դրանք օգտակար հենման կետ են հանդիսանում: Հետևաբար, մտապահեք դրանք, երբ կսկսենք ծանոթանալ ժամանակագրությանը:

Մարդիկ հաճախ շփոթում են մեքենայական ուսուցումը արհեստական բանականության հետ: Իրականում մեքենայական ուսուցումը ԱԲ-ի ավելի լայն ոլորտի ճյուղերից մեկն է միայն: Մյուս ճյուղերը հենվում են ձեռքով գրված տրամաբանական կոդի, այլ ոչ թե սովորած օրինաչափությունների վրա: Այդուհանդերձ, ուսուցման մեթոդներն այսօր գերիշխում են, քանի որ դրանք հրաշալիորեն ընդլայնվում են։ Ժամանակակից մոտեցումների ավելի մանրամասն համեմատության համար ծանոթացեք գործակալական ԱԲ-ի և գեներատիվ ԱԲ-ի (agentic AI versus generative AI) վերաբերյալ մեր ուղեցույցին: Այս համատեքստն ունենալով՝ պատմությունն ավելի հստակ է դառնում:

Եվս մեկ տարբերակում կօգնի սկսնակներին: Մեքենայական ուսուցումը բաժանվում է մի քանի հիմնական ուղղությունների: Վերահսկողությամբ ուսուցման (supervised learning) մեթոդում մակնշված օրինակներն ուղղորդում են մոդելին դեպի ճիշտ պատասխանները: Ի հակադրություն դրան՝ առանց վերահսկողության ուսուցման (unsupervised learning) մեթոդն ինքնուրույն է փնտրում թաքնված կառուցվածքները: Միևնույն ժամանակ, ամրապնդմամբ ուսուցումը (reinforcement learning) խրախուսում է ճիշտ քայլերը փորձերի ու սխալների միջոցով: Քանի որ յուրաքանչյուր ուղղություն համապատասխանում է առանձին խնդրի, ինժեներներն ընտրում են տվյալ գործի համար ճիշտ գործիքը:

Մեքենայական ուսուցման վաղ պատմությունը

Մեքենայական ուսուցման վաղ պատմությունն սկսվեց մի կարևոր հարցով: 1950 թվականին Ալան Թյուրինգը հարցրեց՝ արդյո՞ք մեքենաները կարող են մտածել: Նրա հանրահայտ թեստը մինչ օրս էլ ձևավորում է այս թեմայով քննարկումները: Քիչ անց՝ 1956 թվականին, Դարթմութում տեղի ունեցած ամառային սեմինարի ժամանակ տրվեց «արհեստական բանականություն» ոլորտի անվանումը: Այդ պատճառով շատ պատմաբաններ հենց այդ հանդիպումն են համարում պաշտոնական մեկնարկը:

Սկզբում առաջընթացը արագ էր ընթանում: 1957 թվականին Ֆրենկ Ռոզենբլատը ստեղծեց պերցեպտրոնը (perceptron)՝ վաղ շրջանի ուսուցանվող մեքենա: Այն կարողանում էր ինքնուրույն հարմարվել՝ պարզ պատկերներն իրարից տարբերելու համար: Ավելին, այն ակնարկում էր, թե ինչպես կարող է մարդկային ուղեղը ոգեշնչել համակարգիչների ստեղծմանը: Միևնույն ժամանակ, այլ հետազոտողներ գրում էին ծրագրեր, որոնք շաշկի էին խաղում և կատարելագործվում պրակտիկայի ընթացքում: Արթուր Սամուելն այս շրջանում նույնիսկ շրջանառության մեջ դրեց «մեքենայական ուսուցում» (machine learning) տերմինը: Արդյունքում՝ նորաստեղծ ոլորտում լավատեսությունը չափազանց մեծ էր: Ավելի հարուստ նախապատմության համար Britannica-ի մեքենայական ուսուցման ակնարկը հրաշալիորեն բացահայտում է այս արմատները:

Այս պիոներներն աշխատում էին փոքրիկ ու դանդաղաշարժ համակարգիչներով: Չնայած դրան՝ նրանց գաղափարները զարմանալիորեն կենսունակ գտնվեցին: Փաստացի, ժամանակակից շատ մեթոդներ արձագանքում են հենց այդ առաջին փորձերին: Քանի որ տեխնիկական հագեցվածությունը դեռևս թույլ էր, հավակնությունները շուտով գերազանցեցին իրական արդյունքներին: Այսպիսով, վաղ շրջանի ոգևորությունը հիմք նախապատրաստեց հաջորդ՝ ավելի բարդ փուլի համար:

Vintage mid-century computer room with metal cabinets and tape reels

Նեյրոնային ցանցերի ճարտարապետության վերելքը

Նեյրոնային ցանցերն ընկած են ժամանակակից մեքենայական ուսուցման հիմքում: Այս գաղափարը մոտավորապես փոխառված է մարդկային ուղեղի կառուցվածքից: Այս մոդելում նեյրոններ կոչվող պարզ միավորները ազդանշաններ են փոխանցում միմյանց: Յուրաքանչյուր կապ ունի որոշակի կշիռ, որը համակարգը կարգավորում է մարզման ընթացքում: Արդյունքում՝ ցանցն աստիճանաբար սովորում է մուտքային տվյալները համապատասխանեցնել ճիշտ ելքային արդյունքներին:

Վաղ շրջանի նեյրոնային ցանցերի ճարտարապետությունը մակերեսային էր՝ ընդամենը մեկ կամ երկու շերտով: Հետևաբար, այն դժվարանում էր լուծել ցանկացած բարդ խնդիր: Սակայն 1986 թվականին հետազոտողները տարածեցին սխալի հակադարձ տարածման (backpropagation) մեթոդը, որը նախատեսված էր ավելի խորը ցանցեր մարզելու համար: Այս առաջընթացը թույլ տվեց սխալի ազդանշաններին հոսել հետադարձ ուղղությամբ և ուղղել յուրաքանչյուր կշիռ: Ուստի, ցանցերը վերջապես կարողացան սովորել ավելի հարուստ օրինաչափություններ: Ավելին, այս մոտեցումը վերակենդանացրեց հետաքրքրությունը ոլորտի նկատմամբ՝ տարիներ տևած կասկածներից հետո: Այսօրվա գործիքներով հետաքրքրվող ծրագրավորողների համար ԱԲ գործակալների ստեղծման (building AI agents) վերաբերյալ մեր ուղեցույցը ցույց է տալիս, թե ուր են տանում այս գաղափարները:

Այդուհանդերձ, մեկ մեծ սահմանափակում դեռ տարիներ շարունակ պահպանվում էր: Ցանցերին մեծ արդյունավետություն ցուցաբերելու համար անհրաժեշտ էր հսկայական քանակությամբ տվյալներ և հաշվողական հզորություն: Այդ ժամանակաշրջանում ոչ մի ռեսուրս բավարար քանակով առկա չէր: Այդ պատճառով նեյրոնային ցանցերը համբերատար սպասում էին, մինչև աշխարհը կհասներ իրենց: Միևնույն ժամանակ՝ հանրության ուշադրության կենտրոնում հայտնվեցին ավելի պարզ մեթոդները, ինչպես ցույց է տրված հաջորդ բաժնում:

ԱԲ ձմեռները և վիճակագրական շրջադարձը

Չափազանցված սպասումներն ու գովազդը (hype) իրենց գինն ունեն, և ձևավորվող ոլորտն այդ դասը քաղեց դժվարին ճանապարհով: Երբ մեծախոստում խոստումները ձախողվեցին, ֆինանսավորումը կտրուկ դադարեց: Հետազոտողներն այս պասիվության շրջաններն անվանում են «ԱԲ ձմեռներ» (AI winters): Առաջինն սկսվեց 1970-ականներին, իսկ հաջորդը հաջորդեց 1980-ականների վերջին: Արդյունքում՝ առաջընթացը դանդաղեց, իսկ մասնագետների հեղինակությունը տուժեց:

Այդուհանդերձ, ձմեռները նույնպես արդյունք տվեցին: Դրանց ընթացքում գիտնականները լռելյայն անցում կատարեցին դեպի վիճակագրությունն ու հավանականությունների տեսությունը: Ուղեղի կառուցվածքը կրկնօրինակելու փոխարեն նրանք մաթեմատիկայի միջոցով մոդելավորեցին անորոշությունը: Օրինակ՝ 1990-ականներին իրենց դիրքերն ամրապնդեցին հենակետային վեկտորների մեթոդը (support vector machines) և որոշումների ծառերը (decision trees): Ավելին, այս մեթոդները հրաշալիորեն աշխատում էին այդ ժամանակաշրջանի համեստ տվյալների բազաների հետ: Հետևաբար, մեքենայական ուսուցումը ձեռք բերեց գործնական ինժեներական գործիքի համբավ: Քանի որ արդյունքներն ավելի կարևոր էին, քան վեհ տեսությունները, ոլորտը կայուն կերպով զարգացավ:

Այս վիճակագրական շրջադարձը ձևավորեց նաև առօրյա ծրագրային ապահովումը: Օրինակ՝ սպամ-ֆիլտրերը սովորեցին մեծ ճշգրտությամբ հայտնաբերել ու առանձնացնել անպետք նամակները: Նույնկերպ, բանկերը կիրառում էին նմանատիպ մոդելներ՝ զեղծարարությունները կանխելու համար: Այսպիսով, նույնիսկ այսպես կոչված «ձմեռվա» ընթացքում տեխնոլոգիան լռելյայն տարածվում էր: Իրականում, հենց այս հաջողությունները պահեցին ոլորտը կենդանի, մինչև կհայտնվեր ավելի հզոր տեխնիկական հագեցվածությունը (hardware)։

Պատմությունն այստեղ հստակ նախազգուշացում է տալիս. չափազանց համարձակ հայտարարությունները հանգեցնում են ցավալի անկումների, երբ իրականությունը հետ է մնում սպասումներից: Այդ պատճառով փորձառու հետազոտողներն այժմ զգուշությամբ են տալիս իրենց խոստումները: Ավելին, ֆինանսավորողներն ավելի ուշադիր են հետևում արդյունքներին, քան երբևէ: Քանի որ ոլորտը հիշում է իր «ձմեռները», այն ամեն կերպ զգուշանում է նորից նույն իրավիճակում հայտնվելուց: Այնպես որ, չափավոր համեստությունը դեռևս միայն օգուտ է տալիս այս համայնքին:

Abstract stacked layers of glowing interconnected nodes representing deep learning

Խորը ուսուցման բեկումը

2000-ականների կեսերն ամբողջությամբ փոխեցին այս ոլորտը: Էժան գրաֆիկական չիպերը հանկարծակի ապահովեցին հսկայական հաշվողական հզորություն: Միևնույն ժամանակ, համացանցն արտադրեց թվային տվյալների անծայրածիր օվկիանոսներ: Այս երկու ուժերը միասին վերացրեցին նեյրոնային ցանցերի նախկին սահմանափակումները: Արդյունքում՝ ավելի խորը մոդելների մարզումը վերջապես դարձավ գործնականորեն կիրառելի:

Բեկումնային պահը տեղի ունեցավ 2012 թվականին: Այդ տարի խորը նեյրոնային ցանցը ջախջախեց իր մրցակիցներին պատկերների ճանաչման հանրահայտ մրցույթում: Հանկարծ ամբողջ ոլորտը նորից շրջվեց դեպի նեյրոնային մեթոդները: Հետևաբար, հետազոտողներն սկսեցին ավելացնել ավելի ու ավելի շատ շերտեր՝ ստեղծելով այն, ինչն այսօր անվանում ենք խորը ուսուցում (deep learning): Ավելին, արդյունքները բարելավվեցին պատկերների ընկալման (vision), խոսքի ճանաչման և թարգմանության ոլորտներում: Քանի որ ձեռքբերումներն անհավանական մեծ էին, ներդրումների ծավալը կրկին կտրուկ աճեց: Փաստացի, շատ գործիքներ, որոնք դուք օգտագործում եք ամեն օր, սկիզբ են առնում հենց այս պահից:

Մասշտաբը դարձավ նոր նշանաբանը: Հետազոտողները պարզեցին, որ ավելի մեծ մոդելները, որոնք սնուցվում են ավելի շատ տվյալներով, պարզապես ավելի լավ արդյունքներ են ցույց տալիս: Հետևաբար, թիմերը մրցավազք սկսեցին՝ հավաքելու ավելի մեծ տվյալների բազաներ և ձեռք բերելու ավելի արագ չիպեր: Ավելին, բաց մրցույթները առաջ մղեցին ամբողջ համայնքը: Արդյունքում՝ բարդ առաջադրանքների կատարման ճշգրտությունը տարեցտարի աճում էր: Իրականում այս մրցավազքը մինչ օրս էլ շարժիչ ուժ է հանդիսանում ոլորտի մեծ մասի համար:

Խորը ուսուցումը վերափոխեց նաև առօրյա աշխատանքը: Օրինակ՝ ձայնային օգնականները վերջապես սկսեցին հասկանալ բնական խոսքը: Լուսանկարների հավելվածները հեշտությամբ տեսակավորում էին դեմքերը, իսկ թարգմանիչները դարձան անհամեմատ ավելի ճշգրիտ: Եթե ցանկանում եք տեսնել արտադրողականության ժամանակակից ձեռքբերումները, արտադրողականության համար լավագույն ԱԲ գործիքների (best AI tools for productivity) մեր տեսությունը առաջարկում է բազմաթիվ օրինակներ: Այսպիսով, բեկումնային տեխնոլոգիան արագորեն դուրս եկավ լաբորատորիայից և մտավ սովորական կյանք:

Ժամանակակից մեծ լեզվական մոդելների ճարտարապետությունը

2017 թվականին հետազոտողները ներկայացրեցին տրանսֆորմերը՝ հաջորդականությունների հետ աշխատելու նոր մոդել: Այս գաղափարն այսօր ընկած է ժամանակակից մեծ լեզվական մոդելների ճարտարապետության (large language model architecture) հիմքում: Բառերը հերթով կարդալու փոխարեն, տրանսֆորմերը դրանք դիտարկում և կշռում է միաժամանակ: Արդյունքում՝ այն անհամեմատ ավելի լավ է որսում համատեքստը, քան նախկին մեթոդները:

Մեծ լեզվական մոդելների ճարտարապետությունը զարմանալիորեն հրաշալի է ընդլայնվում։ Ինժեներները այս մոդելներին սնուցում են հսկայական քանակությամբ տեքստերով, և արդյունավետությունը շարունակում է բարձրանալ: Հետևաբար, ժամանակակից չատբոտերի նման համակարգերը կարողանում են սահուն կերպով գրել, համառոտել և պատասխանել հարցերին: Ավելին, նույն ճարտարապետությունն այժմ աշխատում է նաև պատկերների, ձայնի և կոդի հետ: Քանի որ այս մոտեցումն ունի նման լայն կիրառելիություն, այն ընդամենը մի քանի տարում վերաձևեց ամբողջ ոլորտը: Այդուհանդերձ, այս մոդելներն ունեն իրական սահմանափակումներ, քանի որ դրանք կարող են կրկնել իրենց մարզման տվյալներում առկա սխալներն ու կանխակալությունները:

Այսպիսով, ո՞ր ուղղությամբ է շարունակվելու պատմությունը: Հետազոտողներն այժմ ձգտում են ստեղծել այնպիսի մոդելներ, որոնք ունակ են ավելի հուսալիորեն տրամաբանել: Բացի այդ, նրանք աշխատում են նվազեցնել այն հսկայական էներգիան, որն անհրաժեշտ է այս համակարգերի աշխատանքի համար: Միևնույն ժամանակ, անվտանգության և արդարության շուրջ քննարկումները տարեցտարի ավելի են թեժանում: Հետևաբար, մեքենայական ուսուցման պատմությունը դեռևս հեռու է ավարտված լինելուց: Իրականում, մարդիկ ողջ աշխարհում հենց այս պահին գրում են դրա հաջորդ գլուխը:

Ինչու է մեքենայական ուսուցման պատմությունը դեռևս կարևոր

Մեքենայական ուսուցման պատմությունն ավելին է, քան պարզապես խելացի հնարքների ժամանակագրությունը: Փոխարենը՝ այն բացահայտում է համբերության և վերաիմաստավորման հստակ օրինաչափություն: Յուրաքանչյուր ձմեռ իր տեղը զիջել է նոր գարնանը, և յուրաքանչյուր սահմանափակում ծնել է թարմ գաղափար: Հետևաբար, այսօրվա բեկումնային հաջողությունները հենվում են յոթանասուն տարվա կայուն ջանքերի վրա:

Այս պատմության իմացությունը օգնում է ձեզ իմաստուն կերպով ընկալել ներկան: Օրինակ՝ դուք կարող եք տարբերել իրական առաջընթացը անցողիկ աղմուկից (hype): Ավելին, դուք կարող եք գնահատել, թե որքան արագ է հողը դեռևս շարժվում մեր ոտքերի տակ: Այնպես որ, անկախ նրանից՝ դուք ստեղծում եք, ներդնում, թե պարզապես հետաքրքրասեր եք, անցյալը ձեզ համար ուղեցույց է հանդիսանում: Ի վերջո, մեքենայական ուսուցման պատմությունը լավագույն քարտեզն է, որն ունենք հաջորդիվ սպասվող իրադարձությունների համար:

Ամենից առաջ, այս պատմությունը սովորեցնում է նայել հեռանկարին: Ոչ մի առանձին տարի չի սահմանում մեքենայական ուսուցումը, և ոչ մի առանձին գործիք չի դադարեցնում դրա աճը: Փոխարենը, անդադար հետաքրքրասիրությունն է առաջ մղում ոլորտը: Հետևաբար, յուրաքանչյուր նոր լրահոս դիտարկեք որպես ևս մեկ քայլ շատ ավելի երկար ճանապարհորդության մեջ: Հենց այդ ոգով էլ պատմությունը, որը դուք հենց նոր ընթերցեցիք, իրականում շարունակական ուսումնառության հրավեր է:

Մեքենայական ուսուցման պատմությունը. Վաղ գաղափարից մինչև ժամանակակից ԱԲ