ftvalentini Goto Github PK

followers: 12.0 following: 23.0 repos: 33.0 gists: 9.0

Name: Francisco Valentini

Type: User

Bio: Economist. Specialist Degree in Data Mining. Computer Science PhD student.

Code accompanying papers

Further investigating the frequency distortion of static word embeddings (EMNLP 2023 Findings) 📄
A PMI-based approach to measure biases in texts (ACL 2023) 📄
Embedding-based bias metrics depend on frequency! (EMNLP 2022 Findings) 📄

Other projects

Anomaly detection and 7-day mortality prediction in an ICU (specialization work) 🏥
Finding hypallages in Borges' short stories with NLP 📚
Crop classification using satellite images 🌱
Classification of tweets about emergencies and disasters (Kaggle competition) 🆘
Modelling NBA salaries with GAMs 🏀
Hierarchical clustering of countries with World Bank data (Shiny app) 🌎
A hierarchy of airports with PageRank ✈️
Network analysis of brain activity during sleep 🧠
An introduction to bias and variance in supervised ML 🔀
Understanding the bias-variance trade-off (Shiny app) 💹
Notes about gradient boosting 📉

Francisco Valentini's Projects

biaspmi

On the Interpretability and Significance of Bias Metrics in Texts: a PMI-based Approach (Valentini et al., ACL 2023)

colbert

ColBERT: state-of-the-art neural search (SIGIR'20, TACL'21, NeurIPS'21, NAACL'22, CIKM'22)

contriever

Contriever: Unsupervised Dense Information Retrieval with Contrastive Learning

cs224n-2019

Answers to Stanford's CS224n 2019 assignments

curso-cepalr2019

Course taught at ECLAC Buenos Aires - October 2019

desafioagtech2020

dm-brainnetwork

Network analysis of brain activity during sleep

dm-hyadescluster

Detection of Hyades stars (Master in Data Mining - UBA)

dm-icionetwork

Network analysis of OECD Inter-Country Input-Output Tables

dm-imagenelypsis

Imagen de candidatos con datos de Elypsis (Maestria DM - Aprendizaje Automatico - TP1)

dm-sharkattacks

Maestria DM - Data Mining - TP 2 - Reglas de asociacion de ataques de tiburones

dm-twitterbolivia

Analysis of opinions in Twitter during the Bolivian crisis

dm-twittergender

Prediccion de genero de tweets (Maestria DM - Aprendizaje Automatico - TP 2)

dm-twitterpopularidad

Maestria DM - Data Mining - TP 1 - Popularidad de tweets

dspy

DSPy: The framework for programming with foundation models

embeddingsbiasfrequency

The Undesirable Dependence on Frequency of Gender Bias Metrics Based on Word Embeddings (Valentini et al., Findings 2022)

embeddingsfrequency

Investigating the Frequency Distortion of Word Embeddings and Its Impact on Bias Metrics (Valentini et al., Findings EMNLP 2023)

flare

Forward-Looking Active REtrieval-augmented generation (FLARE)

ftvalentini

itba-analisispredictivo

Contents used in the course "Análisis Predictivo" (Licenciatura en Analítica Empresarial y Social, ITBA)

itba-nlp

kaggle-diasastertweets

NLP with disaster tweets (Kaggle competition)

mimic-mortality

Anomaly detection and 7-day mortality prediction with MIMIC-III database

misc

Miscellaneous code for me, myself and I

misc-notebooks

Notebooks about stuff

nba-stats

Stats, plots and data about the NBA

pyserini

Pyserini is a Python toolkit for reproducible information retrieval research with sparse and dense representations.

ftvalentini Goto Github PK

Code accompanying papers

Other projects

Francisco Valentini's Projects

Recommend Projects

Recommend Topics

Recommend Org