O fim do desenvolvimento

Sugestões de conteúdos prévios sobre o assunto para ver antes da leitura desse post (ou durante ou depois):

Artigo sobre evolução da engenharia de software - Se tiver interesse num conteúdo mais aprofundado da história da engenharia de software

Comentem nos comentários mais materiais se conhecer 🤝🏽

Glossário

Termo	Descrição
Chinchilla	Referência a um modelo de IA e princípio que indica o equilíbrio ótimo entre número de parâmetros e quantidade de dados para treinamento, visando eficiência máxima.
Scaling	Prática de aumentar o tamanho de modelos de IA, como número de parâmetros, com o objetivo de melhorar sua performance
Latência	Tempo que um sistema leva para processar uma entrada e gerar uma saída.
Drop loss	Termo informal usado para descrever a queda no valor da função de perda (loss) durante o treinamento de um modelo de aprendizado de máquina, indicando que o modelo está melhorando ao ajustar seus parâmetros para minimizar o erro entre as previsões e os valores reais.

Transição	Ganho MMLU	Ganho %	Custo Relativo
7B → 13B (≈2x)	+13 pontos	+30.9%	1.86x
13B → 30B (≈2x)	+10 pontos	+18.2%	2.3x
30B → 70B (≈2x)	+7 pontos	+10.8%	2.3x
70B → 200B (≈3x)	+10 pontos	+13.9%	2.8x

Transição	Ganho MMLU	Ganho %	Custo Relativo
7B → 30B (≈4x)	+23 pontos	+54.8%	2.8x
30B → 70B (≈2.3x)	+7 pontos	+10.8%	1.8x
70B → 400B (≈5.7x)	+15 pontos	+20.8%	6x

Relações	Exemplos/Detalhes	Comportamento
Performance vs. parâmetros	f(n) = A · N^(-0.07) (ganhos desaceleram)	Não-linear (Retornos decrescentes)
Tokens para Chinchilla-ótimo	Volume de dados cresce menos que os parâmetros (sublinear)	Não-linear (Sublinear)
Latência em modelos grandes	Aumento desproporcional para modelos acima de ~30B parâmetros	Não-linear (Superlinear)
Consumo de energia vs. FLOPs	Gasto energético acompanha o número de operações matemáticas	Aproximadamente linear
Latência vs. tamanho em chips eficientes	Com hardware otimizado, latência segue proporcional ao tamanho do modelo	Aproximadamente linear

Métrica	Resultado
Corporações com ROI >20%	<1%
Corporações com ROI 10-20%	3%
Corporações com ROI 1-5%	53%
Corporações com AI projects falhados	95%
Startups AI rentáveis	~5%