El mundo atraviesa una explosión algorítmica sin precedentes, y con ella surgen nuevos puntos de conflicto. Por ejemplo, OpenAI está recibiendo críticas por no tener nada de «open» en sus proyectos actuales, y otros jugadores mantienen un «silenzio stampa» que llama mucho la atención. Pero también encontramos excepciones como Databricks, una compañía estadounidense que trabaja en el modelo Dolly. ¿Qué tiene de especial? Por un lado, se trata de un proyecto open source, y por el otro, ha sido pensado para uso comercial.
Una palabra que se está repitiendo con mucha frecuencia en los artículos de inteligencia artificial es «democratización». De hecho, esa fue la expresión que usó la gente de Databricks cuando presentó a su modelo Dolly en marzo de este año. Los parámetros de Dolly AI son mínimos en comparación con GPT-3 (6 mil millones vs. 175 mil millones), pero la idea es que cualquiera pueda tomar un modelo existente, entrenarlo con características similares a ChatGPT, y en 30 minutos tener algo al alcance de cualquier compañía.
Dolly AI 2.0, open source y comercial
En los últimos días, Databricks decidió redoblar la apuesta con Dolly AI 2.0. La nueva versión duplica el número de parámetros (12 mil millones), y toma como base al modelo pythia de EleutherAI. Sin embargo, Databricks creó un set de entrenamiento derivado de las demostraciones generadas por miles de empleados de la compañía. Tanto el dataset como los weights del modelo y el código de entrenamiento fueron publicados bajo una licencia Creative Commons, habilitando así su uso comercial.
En cambio, el modelo de OpenAI es propietario, y además de pagar por el acceso al API, los interesados también deben seguir sus términos de uso (léase «no pueden competir con OpenAI»). El modelo LLaMA de Meta se filtró en Internet a principios de marzo, pero su uso comercial está prohibido. Alpaca, Koala, Vicuna, y GPT4All (del cual hablamos recientemente) poseen restricciones similares.
Cualquier interesado en evaluar a Dolly AI 2.0 ya puede obtener los weights en Hugging Face, y el dataset databricks-dolly-15k en GitHub. Por el momento no hay demos en línea ni nada que se le parezca, pero la naturaleza open source del proyecto seguramente dará lugar a un nueva ronda de chatbots y otros servicios respaldados por inteligencia artificial.
Anuncio oficial: Haz clic aquí