accesskey_mod_content

Repositorios abertos de imaxes para adestramento de modelos de Intelixencia Artificial

  • Escoitar
  • Copiar
  • Imprimir PDF
  • Compartir

"Noticia dispoñible unicamente con fins históricos e de hemeroteca. A información e ligazóns mostradas correspóndense cos que estaban operativos á data da súa publicación. Non se garante que continúen activos actualmente".

19 outubro 2022

Quizais, un dos usos máis cotiáns da intelixencia artificial que podemos experimentar no noso día a día sexa mediante a interacción con sistemas de visión artificial e identificación de obxectos.

Quizais, un dos usos máis cotiáns da intelixencia artificial que podemos experimentar no noso día a día sexa mediante a interacción con sistemas de visión artificial e identificación de obxectos. Desde o desbloqueo do noso smartphone, ata a procura por imaxes en Internet. Todos estas funcionalidades son posibles grazas a modelos de intelixencia artificial no campo da detección e clasificación de imaxes. En este post recompilamos algúns dos repositorios abertos de imaxes máis importantes, grazas aos cales, puidemos adestrar os modelos actuais de recoñecemento de imaxes.

Introdución

Volvamos por un momento a finales de 2017, principios del 2018. La posibilidad de desbloquear nuestros smartphones con algún tipo de lector de huella dactilar se ha extendido. Con mayor o menor acierto, la mayor parte de los fabricantes habían conseguido incluir el lector biométrico en sus terminales. El tiempo de desbloqueo, la facilidad de uso y la seguridad extra aportada eran excepcionales frente a los clásicos sistemas de contraseñas, patrones, etc. Como viene ocurriendo desde el año 2008, el líder indiscutible en innovación digital en terminales móviles - Apple - volvía a revolucionar el mercado incorporando un novedoso sistema de desbloqueo en el iPhone X mediante la imágen de nuestra cara. El denominado sistema  FaceID(Abre en nova xanela)  escanea nosa cara para desbloquear o terminal en décimas de segundo sen ter que utilizar as mans. A probabilidade de suplantación de identidade con este sistema era de 1 a 1.000.000; 20 veces máis seguro que o seu predecesor o  TouchID(Abre en nova xanela) .

Valga esta pequena historia sobre unha funcionalidade cotiá, para introducir un tema importante no campo da intelixencia artificial, e en particular do campo do procesamento de imaxes por computador: os repositorios de imaxes de adestramento de modelos de IAHemos falado moito neste espazo sobre este campo da intelixencia artificial. Poucos meses despois do lanzamento de o  FaceID , publicamos  un post sobre IA(Abre en nova xanela) , no que mencionamos a clasificación de imaxes a nivel case-humano como un dos logros máis importantes da IA nos últimos anos. Esto non sería posible sen a dispoñibilidade de bancos abertos de imaxes anotadas cos que poder adestrar modelos de recoñecemento e clasificación de imaxes. Neste post listamos algúns dos repositorios de imaxes (de libre acceso) máis importantes para o adestramento de modelos.

Probablemente os 2 repositorios máis coñecidos de imaxes son  MNIST(Abre en nova xanela)  e  ImageNET(Abre en nova xanela) .

  • MNIST , es un conjunto de 70.000 imágenes en blanco y negro de números manuscritos normalizados en tamaño, listas para entrenar algoritmos de reconocimiento de números. El artículo original del profesor LeCun es del año 1998.
  • ImageNET  é unha base de datos enorme de conceptos (palabras ou conxuntos de palabras). Cada concepto con significado propio denomínase  synset . Cada  synset  está representado por cientos o miles de imágenes. En la propia web de  ImageNET  cítase o proxecto como unha ferramenta indispensable para o recente avance de o  Deep Learning  e a visión por computador. 

    "The project has been instrumental in advancing computer vision and deep learning research.The data is available for free to researchers for non-commercial use".

    O subconjunto máis utilizado de  ImageNet  é o conxunto de datos de clasificación e localización de imaxes  ImageNet Large Scale Visual Recognition Challenge(Abre en nova xanela)   ILSVRC . Este subconjunto de imaxes utilizouse desde 2010 ata 2017 para as competicións de detección de obxectos e clasificación de imaxes a nivel mundial. Este conxunto de datos abarca 1000 clases de obxectos e contén máis dun millón de imaxes de adestramento, 50.000 imaxes de validación e 100.000 imaxes de proba.  Este subconjunto está dispoñible en Kaggle.(Abre en nova xanela)

Ademais destes dous clásicos repositorios que xa forman parte da historia do procesado de imaxes por intelixencia artificial, dispomos dalgúns repositorios temáticos máis actuais e variados. Estes son algúns exemplos:

  • Los tan molestos  CAPTCHAs  reCAPTCHAs  que atopamos en multitude de sitios web para verificar quen estamos a tentar acceder somos humanos son un bo exemplo de intelixencia artificial aplicado ao campo da seguridade. Por suposto, os  CAPTCHAs  tamén necesitan  o seu propio repositorio(Abre en nova xanela)  para comprobar cuán efectivos son para evitar accesos non desexados. Recomendámosche ler este interesante artigo sobre a historia destes compañeiros de navegación pola web.
  • Como vimos varias veces no pasado, unha das aplicacións máis prometedoras da IA no campo das imaxes é a de asistir aos médicos no diagnóstico de enfermidades a partir dunha proba de imágen médica (raios-x, tomografía computerizada, etc.) Para converter isto nunha realidade, non son poucos os esforzos en recompilar, anotar e pór a disposición da comunidade investigadora repositorios de imaxes médicas anonimizadas e de calidade para adestrar modelos de detección de obxectos, formas e patróns que poidan revelar unha posible enfermidade. O 30% de todos os cancros que padecen as mulleres no mundo corresponde co cancro de mama. De aí a importancia de contar  con bancos de imaxes (Abre en nova xanela) que faciliten o adestramento de modelos específicos.
  • O diagnóstico de enfermidades baseadas no sangue a miúdo implica a identificación e caracterización de mostras de sangue de pacientes.  Os métodos  automatizados (mediante imaxe médica)(Abre en nova xanela)  para detectar e clasificar os subtipos de células sanguíneas teñen importantes aplicacións médicas.
  • Hai 3 anos o Covid19 irrompeu nas nosas vidas pondo ás sociedades desenvolvidas patas para arriba con esta pandemia de alcance mundial e consecuencias terribles en termos de perdas humanas e económicas. A comunidade científica ao completo envorcouse en dar solución en tempo record para atallar as consecuencias do novo coronavirus. Foron moitos os esforzos na mellora do diagnóstico da enfermidade.  Algunas técnicas apostaron pola análise de imaxe asistidas por IA(Abre en nova xanela) .  Ao mesmo tempo, as autoridades sanitarias incorporaron un elemento novo na nosa rutina diaria - as máscaras-. Aínda hoxe nalgunhas situacións a máscara segue sendo de obrigado uso, e durante estes 3 anos tivemos que vixiar o seu adecuado uso en case todo tipo de lugares. Tanto é así que nestes meses proliferaron  os bancos de imaxes específicos(Abre en nova xanela)  para adestrar modelos de IA e visión artificial que detecten o uso de máscaras de forma autónoma.
  • Para ampliar información sobre repositorios abertos relacionados coa saúde e o benestar, deixámosche  este post (Abre en nova xanela) que publicamos hai uns meses.

Ademais destes curiosos exemplos que citamos neste post, animámosche a explorar a sección de conxuntos de datos de que Kaggle inclúen imaxes como datos. Tan só tes 10.000 conxuntos para percorrer.

Fonte orixinal da noticia(Abre en nova xanela)

  • Información e datos do sector público