Модель доступна у кількох версіях. Найменша — на 2 мільярди параметрів, підійде для простих завдань. Найпотужніша використовує архітектуру Mixture-of-Experts на 30 мільярдів параметрів. Розробники обирають конфігурацію залежно від завдання та доступних обчислювальних ресурсів.