ЖИ және қазақ контенті

Лондондағы экономика және саяси ғылымдар мектебі журналистикада жасанды интеллектінің (ЖИ) қолданысы бойынша бірнеше жылдан бері зерттеулер жүргізіп келеді

Фото: © Depositphotos.com/AllaSerebrina

Биылғы жарияланған есептерінде журналистикадағы жасанды интеллектіні редакция жұмысын автоматтандыруға, журналистік зерттеуге, мұрағаттағы контент мазмұнын кеңейтуге, аудитория қажеттілігін бағамдауға, фактчек пен верификация жасауға, субъективтілікті анықтауға қолдану жағдайлары кездеседі деген тұжырым жасаған. Бүгін мен «Жас қазақ» газетінің мұрағатын пайдалана отырып, ЖИ көмегімен контент мазмұнын байытуға қатысты өз оқиғаммен бөліскім келеді.…Апаңыздың ұршық иіріп отырған сәтін көз алдыңызға елестетіңізші. Қасында тау болып үйіліп жататын жүн есіңізде ме? Сол тазаланған жүнді «дата» деп ойлаңыз да, ұршыққа ілініп, жіп болып оратылып жатқан тұсын «өнім» деп түсініңіз. Ал шыр айналып, билеп тұрған құралды жасанды интеллектінің жұмыс істеу тәсіліне ұқсатсақ, оны жұмыс істетіп отырған — көпті көрген данагөй апамыз.

2023 жылдың соңында халықаралық ұйымының «Журналистерге арналған генератив жасанды интеллект» курсын бастағанда осы көрініс көз алдымда тұрды. Әрине, бұл қарабайыр түсінік. «Жасанды интеллект» тіркесіндегі «жасанды» сөзіне философиялық тұрғыдан қарап, «интеллект» мағынасын әрқилы тарқататындар да бар. Бірақ бұл ұғым Дата туралы ғылым мен Компьютер туралы ғылымның тоғысында дүниеге келді, ендеше ЖИ бойында осы екі ғылымның да «ұшқыны» болуы керек. ЖИ әлдекімдер ойлағандай өздігінен ұйықтап, түс көретін бір көзді құлтемір «құбыжық» емес, белгілі бір дата негізінде жинақталған тапсырманы өздігінен орындауға бейімделген әдіс-тәсілдердің жиынтығы. Апамыздың ұршық иіру сәтінде ЖИ жоқ, тек жасанды зерденің жұмыс істеу принципіне ұқсас элемент бар.

Медианың айналасында жүргендер үшін ЖИ көбінесе ChatGPT атауымен таныс. Бірақ бұл да біржақты түсінік. ChatGPT сөзіндегі GPT әріптері «осы чат алдын ала үйретілген трансформер үлгісінде жұмыс істейді» дегенді ұқтырады. Ол — жасанды интеллект тәсілінде жұмыс істейтін көп құралдың бірі ғана. Халықаралық ұйымның курс­ында біз әрқайсымыз өзіміздің осындай чатымызды құрастырдық. Өз басым редакция ішінде қолдануға болатын ЖИ негізіндегі бір құрал жасап шығаруды мақсат еттім. Мақсатым жартылай орындалды да.

Менің жағдайымда «Жас қазақ» газетінің бір жылғы сандарындағы мәтін жиынтығынан чат жасалды: генератив жасанды интеллектіге шикізат ретінде газеттің PDF нұсқасын қолдандым, себебі PDF күйіндегі құжатты цифрландыруға болады. Яғни, осындай құжаттарды цифрландырып, жасанды интеллектіге тапсыр­ма беріп, одан жауап ала аласыз. Айталық, редакцияның өз ішкі ChatGPT роботы болады. Ол газеттің бірнеше жылғы мұрағатынан сауалдарға жауап тауып бере алады. Бас редакторға мақаланы журналист өзі жазып, жазбағанын анықтап та береді, тіпті шағын ақпарат та жазады. Дата журналистикада біз бір сұраққа жауап табу үшін формулалар жиынтығын қолданамыз, ал жасанды интелектіге басын бастап үйретіп берсек әрі қарай өздігінен іліп әкететін сипаты бар. Курс барысында осы жоба бойынша чат жасалды. Бірақ ол мен ойлағандай жұмыс істемеді, себебі жасанды интеллектіге қазақ тіліндегі контентті оқытып үйрету үшін дата жеткіліксіз болды. Дата жеткілікті болса, модель негізінде чат әзірленеді. Міне осы түрін Large Language Model (ауқымды тіл моделі) деп танимыз.

Бүгінде ЖИ негізінде контент түзу туралы айтқанда көпшілік ChatGPT көмегіне сүйеніп, мәтін жаздыруды не DALEE, Midjourney көмегімен визуалдар әзірлеуді, аудио форматтағы дауысты мәтінге айналдыруды ойға алуы мүмкін. Мұның барлығы әлдекімдер әзірлеген құрал-тәсілді қолдану түрі ғана. Ал егер әркім өзінің қажеттілігіне орай жасанды интеллект принципіне сүйенген құрал әзірлеу туралы ойланып көрсе ше, нәтиже қандай болмақ, қалай ойлайсыз?