A fabricante chinesa de veículos elétricos Li Auto revelou sua mais recente inovação em direção autônoma, a arquitetura MindVLA, com o objetivo de alcançar a condução autônoma total.
Jia Peng, líder de desenvolvimento de tecnologia de direção autônoma da Li Auto, apresentou a arquitetura durante o Nvidia GTC 2025. Segundo Li Xiang, fundador, chairman e CEO da Li Auto, a MindVLA é um modelo visual-linguístico-ação amplo, que ele descreve como um “modelo robótico amplo”. Inclusive, outras empresas como a BYD avalia construir terceira fábrica na Europa, demonstrando o avanço do setor.

O modelo MindVLA unifica inteligência espacial, linguística e comportamental em um único sistema, proporcionando aos veículos autônomos a capacidade de perceber, interpretar e responder ao ambiente ao seu redor. A Li Auto considera este o passo mais significativo em direção à autonomia de Nível 4. Para quem acompanha o mercado, essa novidade se soma a outras, como a estação de carregamento ultrarrápida de 1 MW lançada pela BYD.
De acordo com Li Xiang, a capacidade da MindVLA de replicar habilidades de condução semelhantes às humanas irá redefinir a direção autônoma, de forma comparável à transformação que o iPhone 4 trouxe para os smartphones. “Com o MindVLA, a direção autônoma total está mais próxima?”, questionou Li em sua publicação no Weibo.
Durante a teleconferência de resultados do quarto trimestre de 2024, realizada em 14 de março, a administração da Li Auto já havia mencionado o início da pesquisa e desenvolvimento da próxima geração do modelo VLA para direção inteligente, que será lançado juntamente com o Li i8. A corrida pela inovação é constante, e a Xiaomi SU7 Ultra, por exemplo, já se envolveu em acidentes, mostrando que ainda há desafios a serem superados.
O Li i8, o primeiro SUV totalmente elétrico da Li Auto, tem previsão de lançamento para julho. A MindVLA transformará o veículo de um simples meio de transporte em um motorista em tempo integral, conferindo-lhe capacidades cognitivas e adaptativas semelhantes às humanas, transformando-o em um agente inteligente capaz de raciocinar. Modelos como o apresentado pela Li Auto podem influenciar até mesmo a decisão de outros países, como Israel, que demonstra interesse na Tesla para sua frota oficial.
A Li Auto desenvolveu e treinou um modelo de linguagem amplo adequado para MindVLA desde o início, utilizando a arquitetura de especialista híbrido MoE e introduzindo o mecanismo Sparse Attention. Esse design garante que o tamanho do modelo cresça sem diminuir a eficiência do raciocínio no lado do usuário.
O MindVLA emprega difusão para decodificar tokens de ação em trajetórias otimizadas e gera modelagem conjunta que incorpora previsões de trajetória de outros veículos por meio do próprio comportamento do veículo, aprimorando as capacidades em ambientes de tráfego complexos. Enquanto isso, a Seat adia o lançamento de seus veículos elétricos, mostrando diferentes estratégias no mercado.
Baseada no modelo mundial desenvolvido internamente pela Li Auto, a arquitetura de direção autônoma pode construir ambientes simulados que se aproximam do mundo real.