Um estudo recente publicado no arXiv revela que representações não supervisionadas, mesmo quando atributos sensíveis são omitidos durante o treinamento, não são neutras em relação a esses atributos. A pesquisa utilizou o método SOMtime, baseado em Mapas Auto-Organizáveis de alta capacidade, para demonstrar que atributos como idade e renda emergem como eixos latentes dominantes em embeddings não supervisionados.
Como os atributos sensíveis emergem em embeddings?
Os autores do estudo aplicaram o SOMtime em dois grandes conjuntos de dados reais: o World Values Survey em cinco países e o Census-Income dataset. Eles descobriram que o método recupera ordenações monotônicas alinhadas com atributos sensíveis omitidos, alcançando correlações de Spearman de até 0,85. Em comparação, métodos como PCA e UMAP geralmente permanecem abaixo de 0,23, com uma única exceção chegando a 0,31, enquanto t-SNE e autoencoders atingem no máximo 0,34.
Quais são os riscos de viés identificados?
A segmentação não supervisionada dos embeddings SOMtime produziu clusters demograficamente enviesados, demonstrando riscos de equidade em tarefas subsequentes, mesmo sem supervisão explícita. Isso estabelece que a abordagem de “justiça através da ignorância” falha no nível de representação para atributos sensíveis ordinais, sugerindo que auditorias de equidade devem se estender a componentes não supervisionados de pipelines de aprendizado de máquina.
“Esses achados estabelecem que a ‘justiça através da ignorância’ falha no nível de representação para atributos sensíveis ordinais”, afirmam os pesquisadores.
— Publicidade —Google AdSense • Slot in-article
O código utilizado na pesquisa foi disponibilizado publicamente, permitindo que outros pesquisadores explorem e validem os resultados apresentados.
Fonte original: arXiv