Como o leitor, também sou um usuário comedido da IA e o uso reforça a constatação de que ela tem evoluido rapidamente. As chamadas “alucinações” tem gerado cada vez menos crítica, até porque têm rareado à medida que versões novam surgem.
Um corte importante no universo das IA é separar sistemas de código aberto, os que podemos importar sem custos pela rede e usá-los a nosso talante, dos fechados, que nos pedem assinatura, eventual pagamento, e se mantêm fora de nosso controle direto. Dentre os de código aberto, há os que prescindem de uma conexão à rede, por trazerem junto toda sua base de informação. Esses pedem um computador local mais poderoso e, especialmente, com muito mais memória. Mesmo assim, não deixa de ser impressionante e assuntador imaginar que o “mundo conhecido” cabe numas dezenas de GB, em termos de IA. O mundo numa casca de noz... de silício. Um teste que mereceria maior atenção é compararmos a resposta que nos fornece uma IA aberta, local, sem acesso à Internet, vis-a-vis uma IA fechada, com acesso irrestrito à rede. Não raramente, a IA local tende a “alucinar” menos e, até, reconhecer que pode não ter resposta para dada pergunta. A com acesso à rede toda, porém, é mais sujeita a inserções aleatórias, e acaba por ser vítima de conteúdos falsos dos que há fartamente na rede.Uma reportagem da BBC de há uns dias, mostra que as IA abertas, muitas delas de origem chinesa, são hoje a primeira escolha para aplicativos de uso geral. Uma consulta ao Hugging Face, por exemplo, mostrará que 4 das 5 IA mais baixadas ou usadas são chinesas. A reportagem cita o Pinterest como um aplicativo de uso geral que usa IA aberta chinesa, mas isso não se resume apenas a aplicativos: também é a opção de escolha de empresas iniciantes, universidades, governos, dada a óbvia e favorável relação custo/benefício.
Qual o modelo visado nos casos aberto e fechado? Claro que o modelo fechado buscará viabilizar-se com as receitas do serviço, mesmo que hoje ainda seja muito difícil prever quando esse equilíbrio será atingido, especialmente pelos custos em máquinas e instalações. Já modelo aberto não busca o retorno financeiro direto. O modelo é mais insidioso, e envolverá diferentes níveis de ação. No mais elementar a coisa mostra-se gratuita, mas há toda uma cadeia armada que não visa não apenas ao fabricante, mas aos diferentes níveis do ecossistema. Não se trata de uma competição convencional: os modelos abertos chineses não competem como produtos, mas como infraestrutura. Não buscam apenas o mercado no curto prazo, mas tornar-se padrão sobre o qual outros constroem. Quem gera um padrão de sucesso, não precisa cobrar por ele.
Voltando à defesa da Internet única e aberta, se num primeiro momento o uso de IA sem acesso parece diminuir a importância de uma internet geral, lembremos que se a idéia é evoluir o que a IA já sabe, é a rede aberta que proverá um futuro dinâmico, e não apenas uma biblioteca cristalizada. Controlar o ecossistema e garantir que ele seja ubíquo é mais importante que cobrar pelo modelo. Quem vende produtos, disputa mercados, mas quem define e distribui infraestrutura molda o futuro.
Qwen 2.5 / 3 (Alibaba)
Mistral 7B Instruct
Gemma 2 (Google)
DeepSeek-R1-Distill
exemplos: Llama 3 8B, Mistral 7B, Phi-3 Mini, etc.
- Modelos médios (entre 13B e 30B parâmetros): de 16GB a 32GB de RAM/VRAM.
exemplos: Llama 3 13B, Qwen2.5-Coder 14B, Gemma 3 12B, etc.
- Modelos grandes (entre 30B e 70B parâmetros): de 32B a 64B de RAM/VRAM
exemplos: Llama 3 70B, Qwen3-30B, Mistral Large 2, etc.







