Вештачката интелигенција му ја „скрши кичмата“ на нашиот „Панграм бенчмарк тест“

Три години Арно.мк го користеше „панграм бенчмаркот“ како мал јазичен стрес-тест за АИ: од халуцинации и…

Го тестиравме најновиот модел на вештачка интелигенција на Фејсбук

Мета, компанијата која стои зад Facebook, неодамна го претстави Llama 3.1, најновата верзија на нивниот отворен…

Го пробавме Claude на македонски јазик и ова се резултатите

Излезе новата верзија на Claude и стручњаците направија т.н. „benchmark“ тестови. Дали Claude е најнапреден јазичен…