As métricas de medição da bondade do modelo de IA são um conjunto de regras que auxiliam os desenvolvedores a avaliar o desempenho de um modelo de IA em suas tarefas. Sendo assim, saiba o que são e como funcionam as Métricas de medição da bondade do modelo de IA no artigo a seguir.
O que são Métricas de medição da bondade do modelo de IA?
Elas são exatas, precisas e confiáveis em suas decisões?
Essas métricas esclarecem a capacidade do programa de tomar decisões apropriadas durante a execução das tarefas atribuídas.
A Techopedia explica
O termo “IA”, abreviação de inteligência artificial, é um conceito tecnológico que captura a inteligência semelhante à humana em programas de computador.
A IA é a próxima onda de inovação tecnológica que automatiza várias tarefas semelhantes às humanas.
Em essência, a IA permite que indivíduos e empresas alcancem maior eficiência com o mínimo de investimento em tempo e recursos. Para isso, são necessários modelos de IA.
Os modelos de IA são softwares e algoritmos projetados para analisar conjuntos de dados, identificar padrões e fazer previsões.
Eles são treinados usando dados para reconhecer esses padrões e apoiar a tomada de decisões. Quanto mais pontos de dados forem expostos a um modelo de IA, mais precisos serão seus resultados.
Esses modelos são a inteligência central por trás dos programas de computador, compreendendo os conjuntos de dados derivados para tomar decisões orientadas por dados.
Eles aproveitam a visão computacional, o processamento de linguagem natural e o aprendizado de máquina para detectar padrões.
Os modelos de IA encontram diversas aplicações no mundo real, desde a habilitação de carros autônomos até a alimentação de assistentes virtuais e sistemas de recomendação.
Para garantir a precisão desses modelos no cumprimento das tarefas pretendidas, foram estabelecidas métricas de medição da bondade do modelo de IA.
Essas métricas se concentram principalmente na avaliação da correção das decisões tomadas pelos modelos de IA.
Por exemplo, um modelo de IA na área da saúde terá a responsabilidade de identificar prontamente as doenças dos pacientes quando receber os dados relevantes.
A qualidade desse modelo é determinada pela eficácia e consistência com que ele consegue atingir essa meta com o mínimo de erros.
Em essência, as métricas de medição da bondade do modelo de IA servem como um mecanismo de garantia de qualidade para programas de IA, assegurando que qualquer modelo de IA forneça previsões precisas e confiáveis.
Métricas de medição da bondade do modelo de IA: Conceitos comuns
Vários tipos de métricas de medição de modelos de IA são empregados para avaliar o desempenho de um programa, sendo que uma parte significativa se enquadra no tipo de previsão.
Uma delas é a regressão, que prevê saídas numéricas e contínuas. Outro tipo de previsão é a métrica de classificação, que determina a categoria à qual a saída pertence.
Entretanto, entre essas métricas, quatro são de suma importância:
Métrica de exatidão
A métrica de exatidão pode ser comparada a um boletim de notas, medindo o quanto um modelo de IA faz as coisas corretamente. É a métrica usada para avaliar o desempenho geral do modelo de IA em todas as classes relacionadas.
Essa métrica é especialmente útil quando todas as classes têm a mesma importância.
Por exemplo, um robô com tecnologia de IA tem a tarefa de escolher as cores vermelha e azul em uma lista de 10. Se ele selecionar com sucesso a cor vermelha 7 de 10 vezes, seu nível de precisão será de 70%, o que está acima da média.
A métrica de precisão é calculada como a proporção de previsões corretas em relação ao número total de previsões.
Métrica de precisão
A métrica de precisão revela o grau de cautela exercido por um modelo de IA na classificação de itens sem cometer erros excessivos.
Normalmente, ela é calculada como a razão entre o número de amostras positivas verdadeiras (corretamente rotuladas como positivas) e o número total de amostras classificadas como positivas (correta ou incorretamente).
Em essência, a precisão avalia a exatidão de um modelo de IA na identificação correta de uma amostra como positiva.
Um exemplo adequado é quando uma máquina de classificação com tecnologia de IA separa rapidamente maçãs de uma pilha de frutas. Se ela classificar com precisão 80% de todas as maçãs do estoque, seu desempenho de precisão será representado por essa porcentagem. Isso indica que o modelo de IA provavelmente minimizará os erros em suas tarefas.
Métrica de recuperação
A métrica de recuperação se concentra em garantir que um modelo de IA não ignore informações críticas ou significativas. Seu objetivo principal é garantir que o modelo de IA cumpra sua missão pretendida.
Em essência, ela mede a eficiência de um modelo de IA para determinar se um número suficiente de amostras positivas está apoiando seu uso a longo prazo. Ela se concentra em como as amostras positivas são classificadas.
A métrica de recuperação é a proporção de amostras positivas em um pool classificadas com precisão como positivas em relação ao número total de amostras positivas. Assim, quanto maior a recuperação, maior o número de amostras positivas identificadas.
Métrica de pontuação F1
Essa métrica de medição da qualidade do modelo de IA é um misto das pontuações das métricas de precisão e recuperação em uma unidade holística. Ela atinge um equilíbrio entre minimizar erros e não ignorar detalhes cruciais na saída do modelo de IA.
Para conseguir isso, a pontuação F1 combina a métrica de recuperação e precisão usando sua média harmônica.
Assim, gerar uma pontuação F1 básica significa implicitamente maximizar as métricas de recuperação e precisão.
Essas métricas de medição ajudam os usuários a determinar implicitamente o desempenho de um modelo de IA em ambientes isolados (de teste) e em cenários do mundo real. Elas capturam a qualidade do resultado de um modelo de IA para garantir que ele possa atingir seus objetivos determinados.
História da Inteligência Artificial (IA)
A primeira ideia de inteligência em nível de máquina foi conceituada por Alan Turing. Em 1935, Turing descreveu uma máquina de computação abstrata que consistia em uma memória ilimitada e um scanner que percorria a memória, símbolo por símbolo.
Essa máquina de computação abstrata lerá o que encontrar e criará seu próprio conjunto de símbolos de forma independente.
Ao longo dos anos, a IA foi testada, modificada e executada em diferentes formatos.
Abaixo estão os eventos mais importantes:
Ano | Evento(s) |
1951 | Christopher Strachey escreveu o primeiro programa de inteligência artificial. Posteriormente, ele criou um programa de damas baseado nesse programa. O programa de damas foi executado no computador Ferranti Mark 1 da Universidade de Manchester, Inglaterra. |
1952 | O programa de Strachey foi capaz de jogar um jogo completo sem ajuda em uma velocidade razoável. |
1952 | Arthur Samuel introduziu o programa de damas nos Estados Unidos. Seu trabalho contribuiu para o lançamento do computador IBM 701. |
1955 | Samuel modifica o programa original de damas e acrescenta a capacidade de aprender com as experiências por meio de aprendizagem mecânica e generalizações. Isso serviu como base para o desenvolvimento da IA anos mais tarde. |
Resultado final
Décadas depois, a revolução da IA deixou uma marca indelével em vários setores, incluindo saúde, finanças, transporte, logística e muitos outros. Esses programas avançados de computador agora são amplamente empregados em vários setores.
A capacidade da IA de funcionar de forma tão perfeita se deve às atividades de modelagem da IA que ocorrem nos bastidores.
Ainda mais importantes são as métricas de medição da bondade do modelo de IA, que garantem que esses modelos funcionem conforme o esperado.
Assim, as métricas de medição da qualidade do modelo de IA são os controles e equilíbrios na execução desses sofisticados programas de computador.