Reconhecimento de nomes de instituições utilizando Inteligência Artificial
Palavras-chave:
Inteligência Artificial, Classificação de Texto, Aprendizado de MáquinaResumo
Mimetizar a capacidade humana de interpretação de textos está entre as promessas da Inteligência
Artificial (IA). Já é possível classificar textos utilizando IA para identificar o estilo literário, analisar
sentimentos embutidos, ou mesmo reconhecer uma mensagem como spam ou não. O preenchimento da
afiliação por parte dos autores de publicações científicas, geralmente não segue padrões, o que
causa problemas como diferentes formas de escrita, traduções, abreviações, siglas, ambiguidades e
mesmo erros de digitação. Uma mesma instituição pode estar representada de diferentes formas em
diferentes trabalhos acadêmicos. Por exemplo, é possível encontrar para o IFG variações tais como:
IFG, Instituto Federal de Goiás, Instituto Federal de Educação, Ciência e Tecnologia de Goiás, Federal
Institute of Goiás, IFGO, entre outros. E, ainda que corretamente escritos, os nomes das instituições e
suas siglas podem conter ambiguidades. Existe, por exemplo, um IFG (Instituto Federal de Goiás) no
Brasil e um IFG Institut für Gebirgsmechanik na Alemanha. Há, portanto, uma demanda crescente
por soluções eficientes e produtivas de análise de textos estruturados e não-estruturados. O problema
de identificação de afiliações em artigos pode ser entendido como um problema de classificação de
um texto e subsequente associação deste texto a uma categoria pré-estabelecida a partir do
treinamento de um modelo de Machine Learning.