Investigadores alertam empresas para a qualidade dos dados gerados através de IA
Num artigo publicado na MIT Sloan Management Review, os investigadores portugueses Pedro Amorim e João Alves alertam para a qualidade e imprevisibilidade dos dados gerados unicamente a partir de modelos de linguagem generativa, apesar de defenderem mais investimento numa Inteligência Artificial (IA) que incorpore estes modelos com análise avançada, e explicam as razões.
Chegamos a uma encruzilhada em que os modelos de linguagem generativa trazem preocupações acrescidas, reconhecendo, no entanto, a importância desta e de outras ferramentas de IA. Mas, o chat GPT não é uma ferramenta de IA? Sim, é. É um chamado modelo de linguagem generativa – ou na expressão anglo saxónica large language model (LLMs). E as práticas de análise avançada não são também elas uma ferramenta de IA? São. Então o que defendem Pedro Amorim e João Alves?
No artigo publicado no Special Report de verão da MIT Sloan Management Review, uma revista independente de renome baseada em investigação e plataformas digitais para líderes de negócios, os investigadores explicam que os chamados LLMs e a análise avançada têm diferentes capacidades no auxílio às empresas e que, por isso, e ao contrário do que se tem verificado, os líderes não devem ter de optar por uma ou por outra, mas sim por uma integração dos modelos de linguagem generativa com as práticas de análise avançadas. Leia o artigo aqui.
“Quando usados de forma complementar, os LLMs podem ajudar as empresas quando estas se encontram nas fases de desenvolvimento e de implementação das práticas de análise avançada, quer para previsão quer para prescrição. Aliás, os modelos de linguagem generativa podem ser especialmente úteis para ajudar as empresas a incorporar dados que não sejam estruturados para as apoiar nas suas análises, traduzir problemas de negócio em modelos analíticos e ajudar a perceber e explicar os resultados dos modelos, mas é preciso ter em atenção que, quando usados exclusivamente, podem ser imprevisíveis e apresentar problemas de qualidade dos dados”, explica Pedro Amorim, investigador do INESC TEC.
Na sua investigação, os autores fizeram várias experiências com modelos de linguagem generativos para aumentar as potencialidades das práticas de análise avançada. Entre as experiências encontram-se: transformar dados que não estavam estruturados em dados estruturados, ajudar a explicar resultados complexos, incorporar dados complexos, melhorar a comunicação dos resultados, e facilitar uma colaboração multidisciplinar nas equipas.
“No caso da transformação de dados não estruturados em dados estruturados, as investigações que conduzimos mostram que a utilização de modelos de linguagem generativa para auxiliar nesta tarefa conseguem poupar, às vezes, o correspondente a semanas de trabalho. Os LLMs são capazes de analisar os dados e, identificando temas principais, estruturá-los, fornecendo, depois, modelos preditivos que podem ser trabalhados pelas equipas de análise avançada. Estas equipas têm de ser multidisciplinares e, por isso, compostas tanto por cientistas de dados como por pessoas responsáveis pelas áreas de negócio, que tomem decisões nas empresas”, explica Pedro Amorim, que é também docente na Faculdade de Engenharia da Universidade do Porto (FEUP).
Aliás, a investigação conduzida por Pedro Amorim e João Alves mostra que as próprias equipas de negócio podem usufruir dos dados gerados através dos modelos de linguagem generativa, uma vez que lhes permitem participar, de forma mais ativa, no processo analítico, reduzir barreiras à adoção, facilitar a gestão da mudança e promover confiança nos dados que são gerados.
Acerca do tema análise avançada e inteligência artificial, já antes deste artigo agora publicado, Pedro Amorim tinha lançado, juntamente com outros autores – todos eles fundadores da spin-off do INESC TEC LTPLabs -, o livro “The Analytics Sandwich”, onde se propunha um afastamento da tomada de decisão tradicional, baseada na intuição, por parte das empresas e numa aposta na análise avançada e na IA.