super.kg logo

Кыргызстандагы AI’дин келечеги: BDigital компаниясынын AI боюнча жетекчиси Чыңгыз Арзиев менен маек   

 

-Чыңгыз, көпчүлүк BDigital’ды IT-компания катары билет. Өзүңүз компаниянын миссиясын кандай аныктайсыз?

-Биз өзүбүздү эч качан жөн гана IT-компания катары караган эмеспиз. Биздин максат — Кыргызстанда толук кандуу жасалма интеллект лабораториясын түзүү. Анын курамында изилдөө борбору жана жаңы инженерлерди даярдай турган академия болот. Биз Кыргызстанды технологияларды жөн гана керектөөчү эмес, тескерисинче, аларды жаратуучу өлкө катары көргүбүз келет.

-Учурда сиздердин лабораторияңыздын алдында турган негизги милдет кандай?

-Биз жергиликтүү бизнес үчүн ассистенттерди түзүү менен гана чектелбейбиз. Азыр кыргыз тилиндеги тилдик өзөктү куруп жатабыз. Бул этапта ChatGPTтин толук кандуу аналогу болуп, бирок кыргыз тилине толугу менен ылайыкташтырылган долбоорду иштеп чыктык. Бул долбоор Airun.kg деп аталат. Ал жөн гана ассистент эмес — келечектеги бардык чечимдерибиздин негизи, өзөгү болуп эсептелет.

-Airun.kg долбоорунун алкагында эмнелерди ишке ашырууга жетиштиңиздер?

-Биз кыргыз тилинде иштеген, дүйнөдөгү эң мыкты моделдер менен сапаты боюнча теңтайлаша ала турган биринчи прототипти түздүк. Учурда долбоорду эки негизги багытта өнүктүрүп жатабыз:

  • Үн жардамчысы — бул ЖИ менен максималдуу табигый баарлашууну камсыз кылат. Кыргыз тилиндеги уникалдуу маалымат топтомубуз модельге контекстти, интонацияларды жана сүйлөө нюанстарын тез жана так түшүнүүгө мүмкүндүк берет, бул диалогду жандуу жана колдонуучу үчүн ыңгайлуу кылат.
  • Санариптик аватар — ассистенттин визуалдык көрүнүшү, контент жаратуу үчүн колдонулат: роликтерди, жарнамалык материалдарды жана виртуалдык алып баруучуларды түзүүдө. Үн менен мимиканын синхрондоштурулушу текст менен аудиону кесипкөй түрдө үн коштолгон жана көркөм визуалдык контентке айлантат. Бул маркетингде, окутууда жана презентацияларда жаңы мүмкүнчүлүктөрдү ачат.

Айтмакчы, Airun долбоорун airun.kg сайтында сынап көрүүгө болот. Ушул жума ичинде биз чоң ачык бета-тест өткөрүп жатабыз жана каалаган пикирлерди, сунуштарды кубануу менен кабыл алабыз.

-Эмне үчүн кыргыз тилине өзгөчө көңүл бурдуңуздар?

-Кыргыз тили — өлкөнүн маданий өзгөчөлүгүнүн ачкычы. Бүгүнкү күндө ЖИ дүйнөсүндө англис, кытай жана башка ири тилдер үстөмдүк кылат, ал эми кичинекей тилдер глобалдык санариптик экосистемадан четте калуу коркунучунда турат. Биздин милдет — кыргыз тилин сактап калуу менен гана чектелбестен, аны эң заманбап технологияларга интеграциялоо.

-Демек, сиздердин стратегияңыз — адегенде өзөктү түзүү, андан кийин аны бизнес-продукттарга киргизүүбү?

-Так ошондой. Биз ишенебиз: күчтүү фундамент болбосо, бардык тармактык чечимдер убактылуу гана болот. Биздин ядро — банктарга, билим берүү тармагына, медицинага, телеком-компанияларга жана мамлекетке арналган чечимдерди курууга негиз боло турган платформа. Эң маанилүүсү — бул чечимдердин баары жергиликтүү тилдик жана маданий базага таянат.

-Сиздер өз багытыңыздарды көбүрөөк лаборатория катары карайбыз дедиңиздер. Азыр кандай изилдөөлөрдү жүргүзүп жатасыздар?

-Биздин бөлүм чыныгы лаборатория сыяктуу иштейт. Негизги багыттарыбыздын бири — аз ресурстуу тилдер үчүн даяр чечимдерди жаратуу.

Тактап кетсек, аз ресурстуу тил — бул чоң көлөмдөгү корпус маалыматтары жок тилдер (тексттер, параллелдик котормолор, белгиленген датасеттер). Ошондуктан алар үчүн классикалык трансформерлерди окутуу өтө кыйын. Англис же кытай тилдеринде терабайттарча маалымат бар болсо, аз ресурстуу тилдерде маалыматтар фрагменттүү гана болот, жана бул моделдердин сапатына терс таасир этет.

Биздин гипотеза — трансформерди нөлдөн баштап окутуу же жалпы максаттагы көп тилдүү модель аркылуу окутуу сыяктуу салттуу ыкмалар аз ресурстуу тилдер үчүн оптималдуу эмес. Ошондуктан биз трансформерлерди окутуунун жаңы методологиясын сунуштайбыз, ал төмөнкү принциптерге негизделет:

Модулдук архитектура: Модель универсалдуу өзөктөн (core transformer) турат, ал жогорку ресурстуу тилдерде (мисалы, англис, орус) алдын ала үйрөтүлгөн жана максаттуу тилге спецификалык адаптивдүү тил модулдарынан турат. Бул жалпы билимдерди эффективдүү колдонууга мүмкүндүк берет жана адаптацияга кеткен чыгымдарды минималдаштырат.

  1. Тилдер аралык билимдерди өткөрүү: Биз cross-lingual transfer learning ыкмаларын колдонобуз, аз ресурстуу жана жогорку ресурстуу тилдердин эмбеддингдерин жалпы вектордук мейкиндикте тегиздөө аркылуу. Бул семантикалык жана синтаксистик билимдерди өткөрүүнү камсыз кылат.
  2. Морфосемантикалык тегиздөө: Морфологиясы бай аз ресурстуу тилдер үчүн биз морфологиялык жана семантикалык түзүлүштөрдү анализди интеграциялайбыз, бул маалыматтардын жетишсиздигин тилди тереңирээк түшүнүү аркылуу компенсациялайт.
  3. Few-shot fine-tuning: Модельдин акыркы адаптациясы тилдин түпкүлүктүү сүйлөөчүлөрү тарабынан аннотацияланган аз, бирок жогорку сапаттагы маалымат топтомдорун колдонуу менен жүргүзүлөт. Бул минималдуу маалыматтар менен жогорку тактыкка жетүүгө мүмкүндүк берет.

Бул ыкманын аркасында биз кыргыз тилинде 90% тактыктагы релеванттуу жоопторго жетиштик, бул анын аз ресурстуу тил статусун эске алганда олуттуу жетишкендик. Азыр биз 93% тактыкка жетүүнү максат кылып жатабыз, жана бул англис тилинде үйрөтүлгөн системалар менен дээрлик теңтайлашат.

Эгер биздин гипотеза ырасталса, биз рынокко универсалдуу даяр чечимди сунуштай алабыз. Бул платформа он миллиондогон сап маалыматтарды чогултуунун зарылдыгы жок эле, ар кандай аз ресурстуу тилде ЖИ жардамчыларын ишке киргизүүгө мүмкүндүк берет. Банктар, колл-борборлор жана мамлекеттик кызматтар үчүн бул колдонуучулардын эне тилинде ЖИни ишке ашыруунун реалдуу мүмкүнчүлүгүн түзөт.

-Сиздер кимдер менен иштешип жатасыздар жана негизги өнөктөштөрүңүздөр кимдер?

-Биз башынан эле дүйнөдөгү мыкты экспертизалар менен кызматташуу стратегиясын тандадык, анткени максат — бир жолку долбоор эмес, дүйнөлүк деңгээлдеги толук кандуу тилдик өзөктү куруу. Бүгүн биз NVIDIAнын КМШ боюнча регионалдык директору менен түздөн-түз кеңешебиз — бул компания жасалма интеллект жана эсептөө тармагында дүйнөлүк стандарттарды белгилейт. Бул бизге GPU архитектуралары жана чоң моделдер үчүн инфраструктура боюнча алдыңкы маалыматтарга жетүүгө мүмкүнчүлүк берет.

Ошондой эле биз тармактын алдыңкы адистери менен кеңешип, тажрыйба алмашабыз. Мисалы, өткөн жумада VisionLabs компаниясынын негиздөөчүсү Александр Ханин менен сүйлөшүү болду. Анын сунуштары биздин архитектураны өнүктүрүүгө жана пайплайнды курууга маанилүү түрткү болду.

Өзгөчө белгилей кетчү нерсе, биз Mastercard компаниясынын ML-инженерлери менен кеңешебиз. Мындай деңгээлдеги тажрыйба биз үчүн чыныгы баа жеткис: дүйнөлүк масштабдагы финтехте иштеген адистердин билимине жетүү — бул жасалма интеллект дүйнөсүндөгү чоң табылга.

Мындан тышкары биз Tier III деңгээлиндеги алдыңкы ЦОДдор менен кызматташып, инфраструктураны башкарууну терең үйрөнүп жатабыз. Бул келечекте тилдик моделдерди окутууга жана иштетүүгө ылайыкташкан өз маалымат борборубузду курууга жардам берет.

Бул өнөктөштүктөр бизге чоң артыкчылык берет: биз жалгыз эмеспиз, тармактын лидерлери менен бирге иштейбиз, жана бул биздин тилдик моделдерди куруудагы тажрыйбабызды региондо эң ишенимдүү жана келечектүү кылат.

-Сиздердин инженердик командаңыздын өзгөчөлүгү эмнеде?

-Биздин командабыздын өзгөчөлүгү — бардык инженерлерибиз кыргыз тилин түпкүлүктүү сүйлөйт. Бул чоң артыкчылык берет: биз модельди жөн гана китептер жана сөздүктөр аркылуу окутпайбыз, тирүү тилди, анын диалекттерин, маданий өзгөчөлүктөрүн жана сүйлөө нюанстарын түшүнөбүз. Мунун аркасында модель ката кетирсе, «галлюцинация» кылса же табигый эмес конструкцияларды колдонсо, биз аны дароо байкайбыз. Биз каталарды оңдоп гана тим болбостон, моделди чындыгында түпкүлүктүү, башка тилдерден которулган эмес, нативдүү кыла алабыз.

-Долбооруңуздардын узак мөөнөттүү максаты кандай?

-Биздин максат бир тилге же бир продуктка гана тиешелүү эмес. Биз ар кандай кичинекей тилге ыңгайлаша алган даяр чечимди куруп жатабыз, ал толук санариптик мүмкүнчүлүк берет. Ар бир тил санариптик дүйнөдөгү эң чоң тилдер менен теңтайлашып, бардык маданий жана лингвистикалык өзгөчөлүктөрүн сактап кала алат.

Элестетиңиз: ар кандай коомдор жана этникалык топтор өз эне тилинде үн жардамчыларды, санариптик аватарларды, билим берүү жана бизнес тиркемелерин колдонсо болот. Биз үчүн бул жөн гана технология эмес — бул ЖИ доорунда кичинекей тилдерге жаңы өмүр берүү жолу, ар бир маданият жана эл глобалдык санариптик экосистемада өз ордуна ээ болууга тийиш.

-BDigital кандай жаңы технологиялык багыттарды өнүктүрүүдө?

-Компания масштабдуу жана коопсуз санариптик кызматтарды куруудагы тажрыйбасына таянып, блокчейн технологияларын активдүү изилдеп жатат. Биз тилдик моделдерди, санариптик өзгөчөлүктөрдү жана каржы кызматтарын натыйжалуу жана коопсуз иштете турган бирдиктүү экосистеманы түзүү максатында блокчейн инфраструктурасын биздин продуктылар менен интеграциялоону карап жатабыз.

Биз блокчейн тармактарынын негизги өзгөчөлүктөрүн жана архитектуралык мүнөздөмөлөрүн изилдөөгө өзгөчө көңүл бурабыз. Ethereum, Solana, TON жана башка алдыңкы платформалардын протоколдорунун жаңыртууларын кылдат талдап, алардын масштабдуулукка, өндүрүмдүүлүккө жана бөлүштүрүлгөн системалар менен интеграциялоо мүмкүнчүлүктөрүнө тийгизген таасирин баалайбыз. Бул ыкма блокчейн инфраструктурасы заманбап ЖИ негизиндеги тиркемелер жана кызматтар менен кандайча өз ара аракеттенерин терең түшүнүүгө мүмкүндүк берет, ошондой эле жогорку жүктөмгө туруштук бере турган жана ишенимдүү санариптик чечимдерди түзүү үчүн негиз болот.

Бул изилдөөлөр бизге ЖИ, блокчейн жана каржы кызматтарын тыгыз интеграциялап, кичинекей тилдер жана жергиликтүү маданияттардын технологияларын глобалдык чөйрөдө эффективдүү масштабдай турган келечектеги санариптик экосистемалардын стратегиясын калыптандырууга жардам берет.

-Сиз «Путь к бесконечности» аттуу ири илимий форумдун уюштуруучусу катары белгилүүсүз. Бул долбоор жөнүндө айтып берсеңиз?

-Ооба. Мен үчүн жасалма интеллект бизнес максаттар менен гана чектелбестен, илим жана адамзаттын фундаменталдык суроолору менен тыгыз байланышта болушу маанилүү. Ошондуктан мен «Путь к бесконечности» форумун уюштуруп, заманбап илимди мыкты популяризация кылган окумуштууларды — Алексей Семихатов, Владимир Сурдин жана Борис Штерн сыяктуу адистерди чогулттум.

Бул адамдар физика жана астрономия тармагындагы алдыңкы окумуштуулар, илим аркылуу миллиондогон адамдарга космосту ачышат. Биз Жаңы космостук ачылыштарды гана талкуулабастан, жасалма интеллекттин астрономиядагы ролун да карадык — телескоптордун маалыматтарын талдоодон баштап, жылдыздардын пайда болуу процесстерин моделдөөгө жана Ааламдагы жаңы мыйзам ченемдерди издөөгө аракет кылдык.

Мен үчүн бул принципиалдуу түрдө маанилүү болду: биз ЖИни вакуумда эмес, илим жана адамзаттын түбөлүктүү суроолорунын контекстинде куруп жатканыбызды көрсөтүү. Мындай форумдар инженерлерге, изилдөөчүлөргө жана ишкерлерге келечектин технологияларын курууга шыктанчу идеяларды берет.

-BDigital компаниясынын келечегин 5 жылдан кийин кандай элестетесиз?

-Бир нече жылдан кийин биз Кыргызстанда эл аралык деңгээлде атаандаша ала турган толук кандуу ЖИ изилдөө борборунун болушун каалайбыз. Airun.kg жүздөгөн тиркемелер жана кызматтар үчүн негизги платформага айланат. Биз кыргыз тилинин санариптик дүйнөдө англис жана кытай тилдери менен теңтайлашкан жаңырышын, ал эми биздин инженерлердин Кыргызстанда дүйнөлүк деңгээлдеги технологияларды жаратып жатканына сыймыктанганын көргүбүз келет.






 
Урматтуу колдонуучу! Эгер сизде коомчулуктун көңүлүн буруп, талкууну талап кылган жаңылыгыӊыз болсо биз менен бөлүшүӊүз.

“Көз караш”, “Эмгек жарчысы”, "Бизнес-Инфо" рубрикаларында чыккан материалдардын маани-маңызы үчүн интернет-порталдын администрациясы жооп бербейт. Жарнамалык материалдардын маңызы үчүн жарнама берүүчү өзү жоопкер.

 Рубрикадагы соңку кабарлар 

Рейтинг: Рейтинг 0 
Комментарийлер(0)
Комментарий калтыруу үчүн өз ысымыңыз менен кириңиз же каттоодон өтүңүз.
 
 
Бөлүмдүн статистикасы
соңку 15 мүнөт ичинде колдонуучу (Катталган: , коноктор: ) бул кабарды окуду:

Кабарлардын саны:
195263;
 
Маалымат-маанайшат порталы
2006-2025 © SUPER.KG
Кыргыз Республикасы, Бишкек шаары,
Турусбеков 109/1
SUPER.KG порталына жайгаштырылган материалдар жеке колдонууда гана уруксат.
Жалпыга таратуу SUPER.KG порталынын редакциясынын жазуу түрүндөгү уруксаты менен гана болушу мүмкүн.
p
Рейтинг@Mail.ru
Биз социалдык тармактарда: