O partner admite que uma tendência inegável e incontornável é o hype da IA Generativa (GenAI) e os seus efeitos colaterais: a GenAI tem dados a montante e a jusante, permitindo trabalhar com grande facilidade e agilidade dados estruturados e, sobretudo, não estruturados, gerando outputs surpreendentes e com valor. «Os dados são a matéria-prima da GenAI, que usa técnicas de aprendizagem automática e redes neuronais para analisar, processar e transformar grandes volumes de informação», diz Hervé Silva, que ressalva ainda o facto de não ser fácil obter, armazenar, limpar, integrar e proteger os dados que alimentam a GenAI: «É preciso garantir a qualidade, a diversidade, a representatividade, a actualização dos mesmos e evitar que sejam corrompidos, perdidos, roubados ou usados indevidamente». Tais implicações, defende o partner da Deloitte, têm inflaccionado a relevância de temáticas como data quality, data governance, trustworthy AI e a necessidade de regulação, assim como o emergir de paradigmas como data as an asset/product, data mesh e a tendência crescente de modelos operativos descentralizados e federados.
Segurança tem de estar (sempre)presente
Numa era em que a IA está cada vez mais presente no contexto industrial, Diogo Guedes, data & AI Azure specialist, acredita que o principal desafio na gestão de grandes volumes de dados passa pela complexidade e especificidades inerentes ao governance dos dados, nomeadamente a segurança desses mesmos activos. «A crescente quantidade de dados exige a implementação de estratégias flexíveis e eficientes que garantam o controlo, a integridade e a protecção dos dados, ao mesmo tempo que dão resposta às necessidades das diversas equipas envolvidas». Ferramentas como o Microsoft Purview desempenham, para este profissional, um papel crucial, pois «oferecem uma solução abrangente para a gestão de grandes volumes de dados», o que permite uma «abordagem descentralizada assente em machine learning, que promove a colaboração entre as equipas».
Diogo Guedes explora que as organizações devem garantir a acessibilidade aos dados, mas, ao mesmo tempo, gerir a privacidade e a utilização ética dos seus activos. «Promover uma gestão dinâmica capaz de oferecer ferramentas como catálogos intuitivos, metadados abrangentes, políticas de acesso personalizadas e monitorização proactiva da qualidade dos dados, é o passo a dar». O data & AI Azure specialist revela estar a observar algumas tendências, nomeadamente o Federated Learning (FL), cujo propósito é descentralizar a propriedade dos dados promovendo colaboração e envolvimento entre os departamentos: «Esta descentralização dá a possibilidade de gerir os dados de forma mais eficiente e democratizar o acesso a insights com valor acrescentado – o resultado acaba por ser uma mistura de centralização e descentralização, que dá origem ao nome ‘federated’». Outra tendência emergente é o aumento da qualidade e a contextualização melhorada através de metadados: «A utilização de IA para automatizar a classificação dos activos de dados vem melhorar de forma significativa a qualidade e precisão da informação». Nesse sentido, Diogo Guedes avança que as soluções que permitam aumentar a compreensão/contexto dos dados, tornando-os mais úteis para diferentes equipas, serão uma mais-valia para qualquer organização, em termos competitivos.
Futuro não depende de mais dados
A Salesforce diz que o principal e maior desafio da gestão de dados na era da IA é lidar com as questões de segurança. O estudo ‘Your Data, Your AI’ demonstra que os dados são a fonte a partir da qual se constrói ou destrói a confiança das empresas na IA, diz, à businessIT, Tiago Esteves, principal solution engineer da Salesforce. O documento revela que mais de metade (54%) dos profissionais em todo o mundo não confiam nos dados utilizados para treinar os sistemas de IA actuais, por desconhecerem a sua fonte; 62% afirmam que os dados públicos desactualizados quebram a sua confiança na IA. «Assim, a IA treinada com base em dados não-confiáveis cria uma grave lacuna de confiança», sublinha Tiago Esteves. «Ora, a IA treinada com base nos dados da própria empresa gera confiança, como o estudo indica, 53% dos trabalhadores afirmam que a IA treinada em dados abrangentes de clientes/empresas aumenta a sua confiança na ferramenta».