O
machine learning (ML)
ou aprendizaxe automática é un dos campos que impulsa o avance tecnolóxico do presente e as súas aplicacións crecen cada día. Como exemplos de solucións desenvolvidas con machine learning podemos mencionar DALL-E , o conxunto de modelos da linguaxe en español
MarIA
ou mesmo
Chat GPT-3
, ferramenta de generativa
IA
que é capaz de crear contido de todo tipo, como, por exemplo, código para programar visualizacións con datos do catálogo datos.gob.es .
Todas estas solucións funcionan grazas a grandes repositorios de datos que fan posible a aprendizaxe dos sistemas. Entre estes, os datos abertos xogan un papel fundamental para o desenvolvemento da intelixencia artificial xa que poden servir de adestramento para os modelos de aprendizaxe automática .
Baixo esta premisa, sumado ao esforzo permanente das administracións pola apertura de datos, existen organizacións non gobernamentais e asociacións que contribúen desenvolvendo aplicacións que usan técnicas de machine learning dirixidas a mellorar a vida da cidadanía. Destacamos tres delas:
ML Commons impulsa un sistema de aprendizaxe automática mellor para todos
Esta iniciativa pretende mellorar o impacto positivo da aprendizaxe automática na sociedade e acelerar a innovación ofrecendo ferramentas como conxuntos de datos, mellores prácticas e algoritmos abertos. Entre os seus membros fundadores atópanse empresas como Google, Microsoft, DELL, Intel AI, Facebook AI, entre outras.
As tecnoloxías innovadoras de ML necesitan grandes conxuntos de datos con licenzas que permitan a súa reutilización, que poidan ser redistribuibles e que estean en continua mellora. Por iso, a misión de ML Commons é contribuír a mitigar esa brecha e para así impulsar a innovación en machine learning.
O principal obxectivo desta organización é crear unha comunidade de datos abertos para o desenvolvemento de aplicacións machine learning.
Datacommons sintetiza diferentes fontes de datos abertos nun único portal
Datacommons busca potenciar os fluxos democráticos de datos dentro da economía cooperativa e solidaria e ten como obxectivo principal ofrecer datos depurados, normalizados e interoperables.
A variedade de formato e información que ofrecen os portais públicos de datos abertos pode chegar a ser un obstáculo para a investigación. O obxectivo de é compilar
Datacommons
datos abertos nunha web enciclopédica que ordena todos os
dataset
mediante nodos. Desta maneira, o usuario pode acceder á fonte que máis lle interesa.
Papers with Code: o repositorio de materiais en aberto para alimentar modelos machine learning
Trátase dun portal que ofrece código, informes, datos, métodos e táboas de avaliación en formato aberto e gratuíto. Todo o contido da web está baixo licenza
CC-BY-SA,
é dicir, permite copiar, distribuír, exhibir e modificar a obra mesmo con fins comerciais compartindo as contribucións realizadas coa mesma licenza orixinal.
Calquera usuario pode contribuír achegando contido e, mesmo, participar na canle de Slack da comunidade que está moderado por responsables que protexen a política de inclusión definida pola plataforma.
O obxectivo de é manter
ML Commons, Data Commons y Papers with Code
e facer crecer comunidades de datos abertos que contribúan ao desenvolvemento de tecnoloxías innovadoras. Entre elas, a intelixencia artificial (
machine learning, deep learning
etc.) con todas as posibilidades que o seu desenvolvemento pode chegar a ofrecer á sociedade.
Fonte orixinal da noticia