Китайският технологичен гигант Tencent Holdings пусна в понеделник нов модел за превод с отворен код, който се класира отлично на световно състезание по машинен превод въпреки малкия си размер на параметрите, подчертавайки напредъка, който страната е постигнала в областта на изкуствения интелект.

Hunyuan-MT-7B на Tencent се класира на първо място в 30 от 31 теста в общото състезание по машинен превод, проведено като част от Десетата конференция по машинен превод, известна още като WMT25, според предварителните резултати, публикувани от организатора на събитието. WMT25 служи като платформа за изследователи и разработчици, за да покажат своя напредък в компютърно подпомогнатия превод.

Въпреки че има само 7 милиарда параметъра – мярка за моделите с изкуствен интелект, където по-големият е по-добър – моделът на Tencent надмина очакванията си, превъзхождайки значително по-големите модели със затворен код от глобални конкуренти, включително Google и OpenAI.

Базираната в Шенжен компания Tencent отдава заслугата за преводаческите умения на новия модел Hunyuan на „парадигма за цялостно обучение на модели за превод“, която обхваща куриране на набори от данни, непрекъснато предварително обучение и множество фина настройка и обучение с подсилване – техники, използвани за настройване на моделите за постигане на оптимална производителност.

Уеб страницата на Hunyuan, китайския технологичен гигант на Tencent's голям език на AI. Снимка: ShutterstockУеб страницата на Hunyuan, китайския технологичен гигант на Tencent’s голям език на AI. Снимка: Shutterstock

„Силата на Hunyuan-MT-7B е, че използва малък брой параметри, за да постигне резултати, които са сходни или дори надминават по-големи модели“, се казва в изявление на екипа на Tencent, отговорен за разработването на серията системи с изкуствен интелект Hunyuan.

Двуезичните двойки на английски език, тествани в състезанието, включват арабски, естонски и масайски, който се говори от 1,5 милиона души, живеещи в Южна Кения и Северна Танзания.

Други езикови двойки включват чешки-украински и японски-опростен китайски. Единствената английска езикова двойка, която Hunyuan не се справи отлично, беше боджпури, език, говорен от около 50,5 милиона души в части от Северна Индия и Непал.

Том Кочми, изследовател в технологичната фирма за изкуствен интелект Cohere и организатор на WMT25, каза в публикация в LinkedIn, че предварителните резултати трябва да се приемат „с резерва“, тъй като те се основават на автоматична оценка и може да са били обект на пристрастия.

Официалната класация, базирана на човешка оценка, която е придружена от подробен анализ, ще бъде публикувана на конференцията WMT25 от 5 до 9 ноември в Суджоу, провинция Дзянсу в Източен Китай.

Tencent заяви, че техният модел за превод Hunyuan е бил използван в редица вътрешни продукти, като например Tencent Meeting, подобен на Zoom, уеб браузър и корпоративната версия на приложението за съобщения WeChat.

Моделът е качен и в Hugging Face и GitHub, онлайн платформи за хостинг на системи с изкуствен интелект с отворен код и софтуерни проекти.

Like this:

Like Loading…

Нашия източник е Българо-Китайска Търговско-промишлена палaта

By admin