O QVAC Fabric da Tether integra BitNet LoRA para ajustar e executar modelos de IA de vários bilhões de parâmetros em GPUs de consumo e telefones principais, levando o trabalho sério de IA ao limite.
resumo
QVAC Fabric traz ajuste fino e inferência BitNet LoRA para GPUs AMD e Intel, pilha Metal da Apple e GPUs móveis de última geração, reivindicando acelerações de 2 a 11x e redução de até 90% no uso de memória em comparação com linhas de base da CPU. Tether diz que haverá modelos ajustados com até 3,8 bilhões de parâmetros e até 13 bilhões de parâmetros no Pixel 9, Galaxy S25 e iPhone 16. O iPhone 16 leva a IA no dispositivo muito além das típicas demonstrações sub-3B de hoje.Este lançamento se encaixa no pivô do Tether de um emissor puro de stablecoin para um player de infraestrutura e complementa iniciativas QVAC anteriores, como o conjunto de dados Genesis I de 41 bilhões de tokens e a bancada de IA local para desafiar o fosso de IA da Big Tech.
A divisão de IA da Tether lançou discretamente uma de suas apostas não-stablecoin mais agressivas até o momento. É uma estrutura BitNet LoRA de plataforma cruzada integrada à pilha de malha QVAC que permite treinar e executar modelos de linguagem de vários bilhões de parâmetros diretamente em GPUs de consumo e smartphones principais. Se esse número se mantiver acima dos benchmarks do próprio Tether, ele empurrará a IA no dispositivo para fora do reino das “demonstrações fofas” e para algo sistemicamente relevante tanto para fornecedores de hardware quanto para investidores em infraestrutura alinhada à criptografia.
O novo lançamento do QVAC Fabric traz ajuste fino e inferência do BitNet LoRA para GPUs AMD e Intel, ecossistema Metal da Apple e várias GPUs móveis em uma única estrutura. Tether afirma que em dispositivos principais, a inferência baseada em GPU é 2 a 11x mais rápida do que as linhas de base da CPU, e o uso de memória é até 90% menor em comparação com modelos de precisão total. Na prática, isso significa que você pode compactar modelos muito maiores e mais sessões simultâneas no mesmo envelope de hardware. Isso é importante para telefones e laptops onde os limites de calor e RAM não são negociáveis.
Um avanço na IA vinculada
A equipe Tether AI lançou uma nova versão do QVAC Fabric, incluindo a primeira estrutura BitNet LoRA multiplataforma do mundo que permite treinamento e inferência de IA de 1 bilhão de parâmetros em GPUs e smartphones de consumo.
fundo
O BitNet da Microsoft usa 1 bit… https://t.co/ooy3L6775E
— Paolo Ardoino 🤖 (@paoloardoino) 17 de março de 2026
Os números das manchetes são provocativos. A equipe de Tether afirma que concluiu ajustes de modelo de até 3,8 bilhões de parâmetros em dispositivos como o Pixel 9, Galaxy S25 e iPhone 16, e aumentou os ajustes para até 13 bilhões de parâmetros no iPhone 16 em particular. Esta é uma escalada acentuada em relação à norma atual, onde a maior parte do marketing de “IA no dispositivo” ainda gira em torno de modelos de parâmetros sub-3B ou transfere cargas de trabalho mais pesadas para a nuvem. Se for reproduzível, isso sugere um futuro onde a personalização completa e a adaptação específica do domínio poderão ser realizadas localmente, sem enviar dados do usuário para fora do dispositivo.
Estrategicamente isso faz sentido A Tether continua a passar de um emissor puro de stablecoin para uma operadora de infraestrutura mais ampla. A empresa já investiu bilhões em energia, mineração e mídia. A empresa agora está adicionando ferramentas de IA de ponta ao seu portfólio, e o código QVAC e BitNet LoRA associado foi aberto no GitHub para que os desenvolvedores possam inspecionar e desenvolver. O código aberto não tem a ver com altruísmo, mas com distribuição. Se o QVAC se tornar o caminho padrão para desenvolvedores independentes e pequenos laboratórios enviarem modelos para hardware de consumo, o Tether estará adquirindo relevância cultural e tecnológica dentro da pilha que está fora do alcance direto da regulamentação bancária.
Para o mercado, o impacto direto é a história, não o resultado. Não há fichas aqui, nenhum ângulo óbvio de “rendimento nesta fazenda”. Mas há uma história macro clara. À medida que mais trabalho de IA avança para o limite, o poder da infraestrutura passará dos hiperescaladores centralizados para aqueles que controlam as principais cadeias de ferramentas e camadas de abstração de hardware. A Tether sinalizou que pretende ser um desses players, aproveitando seu balanço para semear primitivos que reduzam a dependência de uma única nuvem ou jurisdição. Para criptomoedas, um ecossistema cada vez mais obcecado por jogos relacionados à IA, este é um lembrete de que nem toda aposta séria precisa ter um símbolo anexado a ela.
Por enquanto, as questões óbvias são técnicas. Como a aceleração e a economia de memória reivindicadas pelo BitNet LoRA se comparam aos produtos existentes, como llama.cpp, MLC ou o próprio SDK da Qualcomm no mesmo dispositivo? Quais são as compensações de energia e calor no uso real? Também explica quão permissiva é a licença para implantação comercial. Mas se até mesmo o lado conservador das afirmações do Tether for comprovado em benchmarks independentes, a integração BitNet LoRA do QVAC Fabric poderia ser um passo concreto para transformar smartphones de última geração em plataformas viáveis de treinamento e inferência para modelos de linguagem de médio porte. Isso aproxima a IA do limite e dá ao Tether mais uma posição em infraestrutura digital crítica.

