Noticia

  1. https://wccftech.com/intel-aurora-genai-chatgpt-competitor-generative-ai-model-with-1-trillion-parameters/
  2. https://www.elconfidencial.com/tecnologia/novaceno/2023-11-21/superinteligencia-artificial-conocimiento-cientifico_3777794/

Comentario

Importante proyecto para la investigación científica ha sido desvelado. "AuroraGPT" está en marcha para desarrollar una inteligencia artificial de dimensiones desconocidas, que albergará el conocimiento científico de la humanidad. Esta iniciativa busca crear una de las IA más avanzadas y mejor entrenadas, para la asistencia y progreso de la Ciencia. Su función será la de acelerar significativamente la investigación científica al integrar información de todas las ramas del conocimiento en un solo sistema. De esta forma, se podrá profundizar en el conocimiento interrelacionado y obtener resultados y nuevos conocimientos que hasta la fecha no han sido focalizados o atendidos por los investigadores. Se espera que la producción científica se multiplique y con ello, comience una carrera internacional por disponer de los mejores medios técnicos en IA para liderar el avance en investigación y desarrollo de patentes.

En términos técnicos, se presume que AuroraGPT podría incorporar técnicas de paralelización masiva y métodos avanzados de distribución de tareas entre unidades de procesamiento, para manejar el procesamiento de datos a gran escala, el Big-data generado por la ciencia, estos son artículos científicos, papers, datasets, informes, patentes y todo tipo de recursos en línea y bases de datos que se consideren de interés. Es probable que emplee arquitecturas profundas de redes neuronales con múltiples capas, utilizando algoritmos sofisticados como variaciones de las redes neuronales "Transformer", que se caracterizan por su capacidad para procesar secuencias de datos largas y complejas.

La magnitud del proyecto es notable. Según la información proporcionada por Intel durante la conferencia ISC23, AuroraGPT alcanzará un billón de parámetros, una cifra que contrasta con los 175 millones del modelo base de ChatGPT. Este salto cuantitativo no es meramente incremental: responde a la necesidad de procesar la totalidad del conocimiento científico generado en las últimas décadas, un corpus que abarca desde artículos revisados por pares hasta conjuntos de datos experimentales, pasando por patentes, informes técnicos y códigos de software.

Se especula que el modelo podría aprovechar una estructura jerárquica de capas neuronales interconectadas, permitiendo la asimilación y análisis de una enorme cantidad de datos científicos. El uso de técnicas avanzadas de aprendizaje automático, como el aprendizaje por refuerzo o el aprendizaje no supervisado, podría estar contemplado para potenciar su capacidad de procesamiento y análisis. Si bien los detalles técnicos exactos son desconocidos, se espera que AuroraGPT utilice algoritmos de última generación para procesar, comprender y relacionar datos de diversas fuentes científicas, mejorando así la capacidad de la comunidad científica para obtener información valiosa de manera más rápida y precisa. Cabe esperar que solucione problemas relevantes como la "invención de datos" cuando existen lagunas en la base de conocimiento, o bien que cite y referencie adecuadamente las fuentes y contenidos en los que se basa para efectuar sus análisis y respuestas. Este avance representaría un hito en la historia de la Ciencia, brindando la posibilidad de acelerar drásticamente el progreso científico y posiblemente llevar a descubrimientos innovadores e interdisciplinarios sin precedentes.

Qué se espera con AuroraGPT

  1. Aceleración de la investigación: AuroraGPT tiene como objetivo principal reducir el tiempo necesario para realizar investigaciones científicas al proporcionar respuestas rápidas y precisas a preguntas complejas.
  2. Identificación de conexiones ocultas: La IA se espera que descubra relaciones y patrones no evidentes entre diferentes disciplinas científicas, ayudando así a generar nuevos enfoques para resolver problemas.
  3. Facilitar el acceso al conocimiento: Al tener acceso a una vasta cantidad de información, los científicos podrán realizar consultas detalladas desde un único punto de acceso.
  4. Estímulo a la colaboración científica: La capacidad de integrar datos y conceptos de diversas áreas podría fomentar la colaboración entre científicos de diferentes especialidades, potencialmente generando innovaciones interdisciplinarias sin precedentes.
  5. Mejorar la citación y referenciación: Se espera que todas las afirmaciones, textos y construcciones generativas de la IA se basen de forma adecuada en la bibliografía y documentación, resolviendo los problemas de cita y referencia típicos. Ello permitirá conocer cómo estudia la IA la interrelación de los conocimientos científicos, y abriendo el campo a un novedoso e incipiente apartado de especialización de la Cienciometría, la "IAmetría".

El desarrollo de AuroraGPT se inscribe en una tendencia que hemos observado en artículos anteriores: la especialización de los modelos de inteligencia artificial por dominios de conocimiento. Frente a los modelos generalistas como ChatGPT o GPT-4 Turbo, AuroraGPT apuesta por un entrenamiento focalizado en el corpus científico, con la ambición de convertirse en un asistente de investigación capaz de operar con la terminología, los formatos y las convenciones propias de cada disciplina. Este enfoque guarda similitudes con Vincent AI en el ámbito jurídico, aunque con una escala y una ambición interdisciplinar muy superiores.

La iniciativa, liderada por un laboratorio público estadounidense en colaboración con la industria, plantea también interrogantes sobre la geopolítica de la IA científica. La carrera por disponer de los modelos más potentes para la generación de conocimiento y el desarrollo de patentes se perfila como un nuevo frente de competencia internacional, comparable a lo que en su momento representó la secuenciación del genoma o la construcción de grandes aceleradores de partículas. La decisión de hacer público el modelo una vez finalizado —según han anticipado sus desarrolladores— será un factor determinante para su adopción global y para el equilibrio de acceso al conocimiento científico en los próximos años.

Desde la perspectiva de la Documentación, AuroraGPT representa un desafío y una oportunidad simultáneamente. La promesa de una citación y referenciación adecuada de las fuentes aborda una de las carencias más criticadas de los modelos generativos actuales, acercándose al ideal de trazabilidad documental que defendemos en nuestra disciplina. La noción de "IAmetría" que se apunta en el texto —una especialización de la cienciometría dedicada al estudio de cómo la inteligencia artificial procesa, relaciona y produce conocimiento— podría convertirse en un campo emergente de investigación, con implicaciones para la evaluación de la producción científica y la comprensión de la propia dinámica del avance del conocimiento.