Alibaba anunció el lanzamiento de Qwen2.5-Max, un modelo MoE entrenado en más de 20 billones de tokens. La compañía afirma que su nueva IA supera a DeepSeek V3
en varios benchmarks, incluyendo pruebas de conocimiento general y
resolución de problemas. Alibaba añadió que su modelo se entrenó con
metodologías seleccionadas de Ajuste Fino Supervisado (SFT) y
Aprendizaje de Refuerzo a Partir de Retroalimentación Humana (RLHF).