StableLM la alternativa de código abierto a ChatGPT que sacude a la IA

Conociendo StableLM: generación de código y texto

StableLM surge como una innovadora alternativa de código abierto al modelo de inteligencia artificial (IA) conversacional ChatGPT. Desarrollado por Stability AI, la misma startup responsable de la herramienta Stable Diffusion para generar imágenes, este modelo de IA permite generar tanto código como texto. Actualmente, StableLM se encuentra en versión alfa dentro de plataformas como GitHub y Hugging Face.

El proceso de entrenamiento de StableLM se basó en un conjunto de datos denominado ‘The Pile’, que consiste en una combinación de muestras de textos extraídas de diversas fuentes en Internet, como PubMed, StackExchange y Wikipedia. Además, Stability AI utilizó un conjunto de entrenamientos personalizados para triplicar el tamaño de ‘The Pile’ y optimizar el rendimiento del modelo.

StableLM enemigo de ChatGPT

Respuestas de StableLM: calidad variable y mejoras futuras

Según Stability AI, las respuestas proporcionadas por StableLM pueden ser de calidad variable y, en ocasiones, incluir lenguaje y puntos de vista ofensivos. No obstante, la compañía espera mejorar estos aspectos a medida que se amplíe la escala del modelo, se utilicen mejores datos, se reciban comentarios de la comunidad y se optimice su funcionamiento.

A pesar de los beneficios que representa el modelo de código abierto, algunos investigadores han criticado el lanzamiento de alternativas como StableLM, argumentando que podrían utilizarse con fines negativos, como la creación de correos electrónicos de phishing o la facilitación de ataques de malware. Sin embargo, Stability AI defiende el enfoque de código abierto como «el enfoque correcto».

Transparencia y confianza en la comunidad

La decisión de Stability AI de abrir sus modelos busca promover la transparencia y fomentar la confianza en la comunidad científica y de investigación. Al permitir a los investigadores «mirar debajo del capó» de los modelos, se facilita la verificación de su rendimiento, el desarrollo de técnicas de interpretación, la identificación de riesgos potenciales y la creación de salvaguardas. De esta manera, el acceso abierto permite a la comunidad trabajar en conjunto para mejorar la interpretación y la seguridad de la IA.

La aparición de StableLM en el panorama de la inteligencia artificial representa un importante avance en el desarrollo de modelos de IA conversacionales y de código abierto. A medida que la comunidad de investigadores continúe trabajando en la optimización y el perfeccionamiento de este modelo, es probable que se alcance un mayor nivel de rendimiento y seguridad en el uso de la IA en diversas aplicaciones.

Twitter cuentas corregidas