Táticas de crescimento de editores para época eleitoral | WEBINÁRIO

Saber mais

SODP

SODP Media

  • Insights
    • Articles
      • Audience Development
      • Content Strategy
      • Digital Publishing
      • Monetization
      • SEO
      • Digital Platforms & Tools
    • Top Tools & Reviews
    • Opinion
    • Podcast
  • Education
    • Publisher SEO Course
    • Events
      • Monetization Week 2025
  • Resources
  • Community
    • Slack Channel
    • Newsletter
  • About
    • About Us
    • Contact Us
    • Editorial Policy
  • English
sodp logo
SODP logo
    Procurar
    Feche esta caixa de pesquisa.
    Conecte-se
    • Percepções
      • Podcast
      • Artigos
        • Desenvolvimento de público
        • Estratégia de Conteúdo
        • Publicação Digital
        • Monetização
        • SEO
        • Plataformas e ferramentas digitais
      • Principais ferramentas e análises
        • Artigos
        • Principais ferramentas e análises
        • Opinião
        • Podcasts
        • Desenvolvimento de público
        • Estratégia de Conteúdo
        • Publicação Digital
        • Monetização
        • SEO
        • Plataformas e ferramentas digitais
        • Plataformas CMS sem cabeça
        • Plataformas de publicação digital
        • Software de calendário editorial
        • Aplicativos de revistas
        • Plataformas de boletins informativos por e-mail
        • Mais listas de melhores ferramentas
    • Educação
      • Curso de SEO para editores
        • Curso de SEO para editores
        • Eventos
        • Semana de monetização 2025
        • Ver tudo
    • Recursos
    • Comunidade
      • Canal Slack
      • Horário comercial
      • Boletim informativo
        • Canal Slack
        • Boletim informativo
    • Sobre
      • Sobre nós
      • Contate-nos
      • Política Editorial
        • Sobre nós
        • Contate-nos
        • Política Editorial
    espaço reservado
    SODP logo
    Torne-se um parceiro de marca

    Home ▸ Plataformas e ferramentas digitais ▸ Colocando Deepseek à prova: como seu desempenho se compara a outras ferramentas de IA

    Colocando Deepseek à prova: como seu desempenho se compara a outras ferramentas de IA

    Simon ThorneSimon Thorne
    5 de fevereiro de 2025
    Fato verificado por The Conversation
    A conversa
    A conversa

    The Conversation é uma colaboração única entre acadêmicos e jornalistas que, em uma década, se tornou a principal editora mundial de notícias e análises baseadas em pesquisas. Tudo o que você lê nestas páginas é… Leia mais

    Editado por Simon Thorne
    Simon Thorne
    Simon Thorne

    Minha pesquisa é fundamentada principalmente em ciência da computação com aplicações em sistemas de informação. Penso em mim mesmo como mais um cientista natural que prefere investigar científico ao realizar pesquisas. Meu doutorado rese… leia mais

    Deepseek

    O novo Modelo de Linguagem de Grandes Linguagem (LLM) da China interrompeu o mercado dominado pelos EUA , oferecendo um modelo de chatbot relativamente de alto desempenho a um custo significativamente menor.

    O custo reduzido de desenvolvimento e os preços mais baixos de assinatura em comparação com as ferramentas de IA dos EUA contribuíram para a fabricante de chips americana Nvidia perdendo US $ 600 bilhões (£ 480 bilhões) em valor de mercado em um dia. A NVIDIA faz com que os chips de computador usados ​​para treinar a maioria dos LLMs, a tecnologia subjacente usada no ChatGPT e em outros chatbots da IA. O Deepseek usa chips NVIDIA H800 mais baratos sobre as versões de última geração mais caras.

    O desenvolvedor do ChatGPT OpenAi supostamente gastou entre US $ 100 milhões e US $ 1 bilhão no desenvolvimento de uma versão muito recente de seu produto chamado O1. Por outro lado, a DeepSeek realizou seu treinamento em apenas dois meses a um custo de US $ 5,6 milhões usando uma série de inovações inteligentes.

    Mas quão bem o AI Chatbot de Deepseek, R1, compara com outras ferramentas de AI semelhantes sobre o desempenho?

    Deepseek afirma que seus modelos têm um desempenho comparável às ofertas da OpenAI, até excedendo o modelo O1 em determinados testes de referência. No entanto, os benchmarks que usam testes maciços de entendimento de linguagem múltipla (MMLU) avaliam o conhecimento em vários assuntos usando questões de múltipla escolha. Muitos LLMs são treinados e otimizados para esses testes, tornando-os não confiáveis ​​como indicadores verdadeiros do desempenho do mundo real.

    Uma metodologia alternativa para a avaliação objetiva do LLMS usa um conjunto de testes desenvolvidos por pesquisadores nas universidades de Cardiff Metropolitan, Bristol e Cardiff - conhecidas coletivamente como Grupo de Observação do Conhecimento (KOG). Esses testes investigam a capacidade da LLMS de imitar a linguagem humana e o conhecimento por meio de perguntas que exigem um entendimento humano implícito para responder. Os principais testes são mantidos em segredo, para evitar empresas de LLM treinando seus modelos para esses testes.

    A KOG implantou testes públicos inspirados no trabalho de Colin Fraser, um cientista de dados da Meta , para avaliar o DeepSeek contra outros LLMs. Os seguintes resultados foram observados:

    Teste de desempenho de LLM.
    Teste de desempenho de LLM.

    Os testes usados ​​para produzir esta tabela são de natureza "adversária". Em outras palavras, eles são projetados para serem "difíceis" e para testar os LLMs de maneira que não simpatize com a forma como são projetados. Isso significa que o desempenho desses modelos nesse teste provavelmente será diferente do seu desempenho nos testes de benchmarking convencionais.

    O Deepseek marcou 5,5 de 6, superando o modelo O1 do OpenAI-seu raciocínio avançado (conhecido como “cadeia de pensamento”)-bem como o ChatGPT-4O, a versão gratuita do ChatGPT. Mas o Deepseek foi superado marginalmente superado pelos Mini O1 do Anthropic Claudai e do Openai, ambos, os que obtiveram 6/6 perfeitos. É interessante que o O1 tenha um desempenho inferior ao seu homólogo "menor", O1 Mini.

    DeepThink R1-uma ferramenta de IA da cadeia de pensamento feita pela Deepseek-com um desempenho inferior em comparação com a DeepSeek com uma pontuação de 3,5.

    Esse resultado mostra como o Chatbot de Deepseek já competitivo já é, vencendo os modelos principais do Openai. É provável que estimule mais desenvolvimento da Deepseek, que agora tem uma base forte para se basear. No entanto, a empresa de tecnologia chinesa tem um problema sério que os outros LLMs não têm: censura.

    Desafios de censura

    Apesar de seu forte desempenho e popularidade, a Deepseek enfrentou críticas sobre suas respostas a tópicos politicamente sensíveis na China. Por exemplo, os avisos relacionados à Praça Tiananmen, Taiwan, muçulmanos uyghur e movimentos democráticos são recebidos com a resposta: "Desculpe, isso está além do meu escopo atual".

    Mas essa questão não é necessariamente exclusiva da Venda Deeping, e o potencial de influência política e censura no LLMS é mais geralmente uma preocupação crescente. projeto Stargate LLM de US $ 500 bilhões de Donald Trump , envolvendo o Openai, Nvidia, Oracle, Microsoft e Arm, também levanta o medo de influência política.

    Além disso, a recente decisão da Meta de abandonar a verificação de fatos no Facebook e o Instagram sugere uma tendência crescente em relação ao populismo sobre a veracidade.

    Conteúdo de nossos parceiros

    Ai, a espada de criatividade de dois gumes e por que os editores devem abraçá-la

    Ai, a espada de criatividade de dois gumes e por que os editores devem abraçá-la

    Por que os editores on -line precisam de uma VPN: protegendo dados, fontes e receita

    Por que os editores on -line precisam de uma VPN: protegendo dados, fontes e receita

    Problema de Goldilocks da gestão do público (2)

    Problema de Goldilocks da gestão do público: como os editores são pegos entre a tecnologia que não funciona ou é muito complexo para usar

    A chegada de Deepseek causou grave interrupção no mercado da LLM. Empresas americanas como OpenAI e Antrópica serão forçadas a inovar seus produtos para manter a relevância e combinar seu desempenho e custo.

    O sucesso de Deepseek já está desafiando o status quo, demonstrando que os modelos LLM de alto desempenho podem ser desenvolvidos sem orçamentos de bilhões de dólares. Também destaca os riscos da censura do LLM, a disseminação de informações erradas e por que as avaliações independentes são importantes.

    À medida que os LLMs se tornam mais profundamente incorporados na política e nos negócios globais, a transparência e a responsabilidade serão essenciais para garantir que o futuro do LLMS seja seguro, útil e confiável.

    Simon Thorne, professor sênior de sistemas de computação e informação, Universidade Metropolitana de Cardiff

    Este artigo é republicado da conversa sob uma licença Creative Commons. Leia o artigo original .

    Escolhas do Editor
    O que é um criador de conteúdo O quê, por que e como da economia do criador
    Estratégia de Conteúdo

    O que é um criador de conteúdo?

    Melhores plataformas de boletins informativos por e-mail para editores
    Plataformas e ferramentas digitais

    8 melhores plataformas de boletins informativos por e-mail para editores em 2024

    SEO do Google Notícias
    SEO

    Guia de SEO do Google Notícias 2024: práticas recomendadas para editores de notícias

    Postagens relacionadas

    • Melhores ferramentas de escrita de IA
      10 melhores ferramentas de escrita de IA
    • Melhores ferramentas de transcrição de IA
      11 melhores ferramentas de transcrição de IA em 2024
    • Ferramentas de IA para criação de conteúdo
      12 melhores ferramentas de IA para criação de conteúdo
    • 17 melhores ferramentas de monitoramento de mídia em 2023
      13 melhores ferramentas de monitoramento de mídia em 2025
    SODP logo

    State of Digital Publishing está criando uma nova publicação e comunidade para mídia digital e profissionais de publicação, em novas mídias e tecnologias.

    • Principais ferramentas
    • SEO para editores
    • Política de Privacidade
    • Política editorial
    • Mapa do site
    • Pesquise por empresa
    Facebook Twitter X Folga Linkedin

    ESTADO DA PUBLICAÇÃO DIGITAL – COPYRIGHT 2025

    2º Anual

    Semana de Monetização

    A convergência de inovação e estratégia: monetização do editor em 2025.

    Um evento on-line de 5 dias explorando o futuro dos modelos de receita dos editores.

    19 a 23 de maio de 2025

    Evento On-line

    Saber mais