A inteligência artificial (IA) avança a passos largos, e a DeepSeek AI emerge como um modelo que vem ganhando destaque. O aumento expressivo no número de instalações em dispositivos Android demonstra a experiência de usuário superior que a DeepSeek oferece em nichos específicos. Em comparação com o Gemini, o DeepSeek apresenta características e vantagens notáveis.
Embora ambos os modelos, DeepSeek e Gemini, possuam capacidade de sumarização, o DeepSeek se destaca pela sua legibilidade. Em testes com o prompt “Resuma as inovações recentes em IA em 150 caracteres“, o DeepSeek apresentou os principais pontos em formato de tópicos claros, excedendo ligeiramente o limite de palavras, mas analisando mais informações e incluindo citações para exploração adicional.
O Gemini, por outro lado, entregou um resumo conciso e preciso, porém em formato de parágrafo, menos amigável ao usuário.
O DeepSeek é um modelo de IA de código aberto, gratuito e sem taxas de assinatura. O Gemini adota um modelo freemium, onde os recursos básicos são gratuitos, mas ferramentas avançadas, como o modelo experimental 2.0 Pro, pesquisa aprofundada e uploads de documentos grandes, exigem uma assinatura do Gemini Advanced.
E por falar em IA, a Amazon lançou Alexa Plus para competir com Google Gemini, turbinando assistente virtual com IA, mostrando a crescente competição no mercado.
Processamento local versus atrasos na nuvem
O Gemini, baseado em nuvem, envia cada solicitação para servidores externos para processamento remoto, introduzindo latência que varia conforme a velocidade da internet, carga do servidor e distância geográfica.
Tráfego elevado no servidor pode resultar em tempos de espera maiores, respostas mais lentas ou indisponibilidade temporária. Ao executar o DeepSeek localmente, elimina-se os atrasos na comunicação com a nuvem, contornando esses problemas ao realizar todos os cálculos localmente.
Treinamento mais econômico
A metodologia de treinamento do DeepSeek R1 utiliza aprendizado por reforço com um sistema de recompensa estruturado para otimizar a precisão e a formatação, superando os modelos tradicionais de recompensa neural.
Segundo relatos, o treinamento do DeepSeek R1 durou 55 dias em 2.048 GPUs Nvidia H800, reduzindo os custos para US$ 5,5 milhões, um valor significativamente inferior aos US$ 191 milhões estimados para o Gemini. No entanto, especialistas alertam que as alegações de custo do DeepSeek carecem de total transparência e podem ser imprecisas.
Operacionalidade sem internet
A ausência de acesso à internet pode comprometer a assistência da IA quando mais se precisa. AIs baseadas em nuvem necessitam de uma conexão estável para responder a perguntas, resumir documentos ou gerar ideias. Embora o Gemini Nano suporte funcionalidade offline, ele não oferece todo o potencial da versão em nuvem. DeepSeek leva vantagem em cenários onde o acesso offline à IA é fundamental, pois a auto-hospedagem do DeepSeek permite acesso offline a qualquer hora e em qualquer lugar.
Privacidade total nas interações com a IA
A maioria das pessoas prefere manter seu histórico de pesquisa, anotações e interações privados. Modelos de IA baseados em nuvem transmitem dados para servidores remotos para processamento. Embora provedores como Google e OpenAI usem criptografia e políticas de retenção de dados, a IA baseada em nuvem exige que os usuários confiem em terceiros para proteger suas informações.
Isso representa um risco para usuários que lidam com conteúdo confidencial ou proprietário, que têm pouco controle sobre o armazenamento e uso dos dados. Por exemplo, o Google pode armazenar, analisar e usar dados financeiros pessoais, pensamentos privados ou projetos criativos para melhorar seus modelos.
DeepSeek oferece uma solução de IA local que mantém todas as consultas, respostas e processamento no dispositivo do usuário. Isso elimina preocupações sobre exposição de dados, acesso não autorizado ou violações de servidor.
Personalização mais profunda da IA
O Gemini permite que os usuários criem especialistas de IA personalizados com Gems, mas não concede acesso ao seu código-fonte ou parâmetros do modelo. Isso limita os usuários a ajustes predefinidos, em vez de permitir mudanças fundamentais no processamento do modelo. Consequentemente, os usuários não podem integrar conjuntos de dados especializados ou otimizar o desempenho para aplicações de nicho.
A estrutura de código aberto do DeepSeek oferece acesso total à sua arquitetura central, representando uma alternativa poderosa para pesquisadores, empresas e entusiastas de IA. Os usuários podem adaptar o modelo para setores específicos, aplicações especializadas e necessidades linguísticas exclusivas.
Por exemplo, pesquisadores médicos podem treinar o DeepSeek com terminologia e estudos de caso específicos do setor, melhorando sua interpretação de sintomas, resultados de exames e literatura médica. Da mesma forma, as empresas podem integrar dados proprietários para personalizar fluxos de trabalho de IA, otimizar a automação e melhorar as interações com os clientes.
Colaboração em código aberto
Ao contrário dos modelos proprietários, que seguem roteiros corporativos, o DeepSeek se beneficia de contribuições coletivas que aceleram as correções de bugs e os patches de segurança. Como resultado, vulnerabilidades, vieses e gargalos de desempenho são identificados e resolvidos mais rapidamente do que em modelos de código fechado.
O ecossistema de código aberto acelera a expansão de recursos. Os desenvolvedores podem adicionar opções ausentes sem esperar por atualizações oficiais, resultando em um ecossistema crescente de plugins de terceiros, integrações de API e melhorias de desempenho. Também permite que os desenvolvedores incorporem o DeepSeek em várias aplicações sem restrições proprietárias.
Modelo auto-hospedado reduz a censura da IA
Modelos de código fechado impõem políticas de moderação de conteúdo predefinidas que restringem discussões sobre tópicos sensíveis por razões éticas, legais ou de mitigação de riscos. Embora a filtragem de conteúdo evite o uso indevido, pode causar censura não intencional quando a IA se recusa a abordar tópicos de pesquisa legítimos ou questões sociais críticas.
Por exemplo, a versão web do DeepSeek evita discussões sobre o cenário político da China, provavelmente devido a restrições regulatórias. Isso reflete restrições em modelos de IA ocidentais, onde filtros bloqueiam conversas sobre assuntos controversos ou legalmente sensíveis.
DeepSeek-R1-abliterated oferece uma abordagem única. Os usuários podem acessar uma versão irrestrita quando instalado localmente ou auto-hospedado. Isso é conseguido removendo os mecanismos de recusa integrados por meio de um processo conhecido como abliteration, que modifica os mecanismos internos do modelo para remover comportamentos de recusa.
Transparência e auditabilidade
O acesso ao código aberto permite que usuários, pesquisadores e reguladores realizem auditorias independentes com o DeepSeek. Isso permite examinar minuciosamente vieses, vulnerabilidades de segurança e preocupações éticas. Modelos de código fechado operam como caixas pretas, forçando os usuários a dependerem unicamente do que o provedor garante. Sem acesso ao código e aos dados de treinamento, os usuários não podem entender totalmente como esses modelos tomam decisões ou determinar se estão sujeitos a vieses, erros ou manipulação adversária. É importante notar que a inteligência artificial demonstra “declínio cognitivo” semelhante ao de humanos, segundo estudo, e isso revela a importância de monitoramento e auditoria.
Na área da saúde, modelos de IA diagnosticam doenças, recomendam tratamentos e gerenciam dados de pacientes. Um sistema de IA tendencioso ou não confiável pode causar diagnósticos incorretos e resultados desiguais. O acesso aos dados de treinamento do DeepSeek permite que profissionais médicos e especialistas em ética de IA verifiquem se o modelo usa conjuntos de dados diversificados e representativos, reduzindo o viés sistêmico.
No setor financeiro, modelos de IA influenciam aprovações de empréstimos, detectam fraudes e conduzem negociações algorítmicas. A falta de transparência impede que os usuários avaliem se um sistema de IA nega desproporcionalmente empréstimos a determinados grupos demográficos ou baseia decisões de investimento em dados falhos.
O sucesso do DeepSeek como um alerta para o Ocidente
DeepSeek surgiu como um modelo de linguagem grande (LLM) mais barato, de código aberto e eficiente, desafiando o domínio das soluções de IA proprietárias. Espera-se que o algoritmo por trás do sucesso do DeepSeek inspire o desenvolvimento de IA de baixo custo no Ocidente.
Quer receber as principais notícias do Portal N10 no seu WhatsApp? Clique aqui e entre no nosso canal oficial.