Сарапшылар ChatGPT-дің қазақшасы неліктен сауатсыз екенін түсіндірді
Оған қазақ википедиясындағы қордың аздығы себепші, деп хабарлайды @BAQ.KZ тілшісі.
Microsoft компаниясында Аналитика және жасанды интеллект саласындағы IT-архитектор Санжар Мырзағалым жасанды интеллектінің неге қазақша мәтінді танымайтынын түсіндірді.
Ол Microsoft компаниясы қазақ тілін қолдау үшін көптеген жоба жасап жатқанын айтады. Оның айтуынша, компания алдағы уақытта қазақ тілінің үлкен корпусын қолданбақ.
– Ағылшынға қойсаңыз өте көп ақпарат, орысшада да үлкен ақпарат, өкінішке қарай қазақ тілінде өте аз болады. Сондықтан біздің ақпарат жинайтын роботтарымыз керекті ақпаратты ала алмай қалады. Міне, осындай мәселелерді бірігіп шешуге көшіп жатырмыз, – деді Санжар Мырзағалым.
ChatGPT-дің қазақшасы неге сауатсыз? IT сарапшы Тимур Бектұр мұның себебін былай түсіндірді.
– Бұл мәселені шешу үшін әрбір қазақ тар шеңбер аясындағы жобаларды жасап, контент жасау арқылы атсалыса алады. Негізінен интернетке қазақ тілінде контент жүктеу арқылы көмектеседі. ChatGPT-дің қазақшасы неге сауатсыз? Өйткені википедияда 220 мың ғана мақаламыз бар, кейде қазақпыз деп кеуде қосқанымызбен, интернетке материалымызды жүктемейміз. Бұл 220 мың қорды жасанды интеллектіге енгізген кезде ол теңізге тамызған тамшыдай болып қалады. Оған кемінде 10 миллион қор керек. Яғни қазақ википедиясы 10 миллионн ақпаратқа толған кезде жасанды интеллектің қазақша сауатты сөйлеуі туралы әңгіме қозғаймыз, –деді Тимур Бектұр.