Extracción de Información a partir de Datos Abiertos

Information Extraction for Open Data Logo

Dándole herramientas a la ciudadanía al analizar de automáticamente grandes volúmenes de texto

Extracción de Información

"La Extracción de Información (IE por sus siglas en inglés) es la tarea de extraer de manera automática información estructurada a partir de documents accesibles por computadora en formato sin estructura o con una estructura pobre. En la mayoría de los casos esta actividad se refiere al procesamiento de textos escritos en algún lenguaje humano utilizando Procesamiento de Lenguaje Natural (PLN)" traducido de Wikipedia.

Más Información

Está disponible nuestro paper de CLEI 2019 Impact of Spanish Dialect in Deep Learning Next Sentence Predictors; el código y datos también disponibl en nuestra GubitH.

Iniciativas


Octroy. Extracción de empresa, monto y motivo a partir de las reseñas de los comités ejecutivos de los gobiernos de las ciudades de Laval y Montreal. En francés.

Montreal City Hall (source: Wikipedia)

Voz y voto. Extracción de representantes presentando o siendo mencionado e identificación automática de género para representantes en las transcripciones taquigráficas del congreso argentino. En español.

Palace of the Argentine National Congress (source: Wikipedia)

Proyectos futuros. Comparta sus datos, su problema o su sistema dentro del proyecto IE4OpenData.

Headquarters of the United Nations (source: Wikipedia)

Unirse al Proecto

IE4OpenData es una organización dentro de GitHub, por lo que unirse al proyecto es relativamente sencillo. Como este proecto recién está comenzando, la forma más sencilla es contactarnos por correo electrónico.

Envíenos un correo electrónico