Principais conclusões
- Llama 2, um modelo de linguagem de código aberto, supera outros grandes modelos de código aberto, como Falcon ou MBT, tornando-o um dos mais poderosos do mercado atualmente.
- Comparado ao ChatGPT e ao Bard, o Llama 2 mostra-se promissor em habilidades de codificação, tendo um bom desempenho em tarefas funcionais, mas lutando com tarefas mais complexas, como a criação de um jogo de Tetris.
- Embora o Llama 2 fique atrás do ChatGPT em termos de criatividade, habilidades matemáticas e raciocínio de bom senso, ele mostra um potencial significativo e resolveu problemas que ChatGPT e Bard não conseguiram em suas primeiras iterações.
MUO VÍDEO DO DIA
ROLE PARA CONTINUAR COM O CONTEÚDO
Do GPT-4 da OpenAI ao PalM 2 do Google, grandes modelos de linguagem dominam as manchetes de tecnologia. Cada novo modelo promete ser melhor e mais potente que o anterior, às vezes superando qualquer concorrência existente.
No entanto, o número de modelos existentes não retardou o surgimento de novos. Agora, a empresa-mãe do Facebook, Meta, lançou o Llama 2, um novo e poderoso modelo de linguagem. Mas o que há de único no Llama 2? Como é diferente de GPT-4, PaLM 2 e Claude 2, e por que você deveria se importar?
O que é Lhama 2?

Llama 2, um grande modelo de linguagem, é produto de uma aliança incomum entre Meta e Microsoft, dois gigantes da tecnologia concorrentes na vanguarda da pesquisa em inteligência artificial. É um sucessor do modelo de linguagem Llama 1 da Meta, lançado no primeiro trimestre de 2023.
Você pode dizer que é o equivalente do Meta ao PaLM 2 do Google, OpenAIs GPT-4 e Claude 2 da Anthropic. Ele foi treinado em um vasto conjunto de dados de Internet disponíveis publicamente, aproveitando a vantagem de um conjunto de dados mais recente e mais diversificado do que isso usado para treinar o Llama 1. O Llama 2 foi treinado com 40% mais dados que seu antecessor e tem o dobro do comprimento do contexto (4k).
Se você já teve a oportunidade de interagir com o Llama 1 no passado, mas não ficou muito impressionado com seu resultado, o Llama 2 supera seu antecessor e pode ser exatamente o que você precisa. Mas como isso se sai em relação à concorrência externa?
Como o Llama 2 se compara à concorrência?

Bem, depende da concorrência que enfrenta. Em primeiro lugar, o Llama 2 é um projeto de código aberto. Isso significa que a Meta está publicando o modelo inteiro, para que qualquer pessoa possa usá-lo para construir novos modelos ou aplicativos. Se você comparar o Llama 2 com outros modelos importantes de linguagem de código aberto, como Falcon ou MBT, descobrirá que ele os supera em várias métricas. É seguro dizer que o Llama 2 é um dos modelos de linguagem grande de código aberto mais poderosos do mercado atualmente. Mas como ele se compara a gigantes como o GPT da OpenAI e a linha de modelos de IA PalM do Google?
Avaliamos ChatGPT, Bard e Llama 2 quanto ao desempenho em testes de criatividade, raciocínio matemático, julgamento prático e habilidades de codificação.
1. Criatividade
Para testar sua criatividade e senso de humor, aplicamos nosso teste característico de criatividade e sarcasmo. Pedimos ao modelo Llama 2 AI para simular uma conversa entre duas pessoas discutindo sobre os méritos de ir ao espaço, e aqui estão os resultados.

Seguido pela:

E finalmente:

A julgar pelos resultados de nossa comparação entre ChatGPT, Bing AI e Google, onde também usamos o mesmo teste, apenas a resposta do ChatGPT é visivelmente melhor do que a resposta do Llama 2. A resposta do Llama 2 parece ser bastante melhor que a do Bard do Google. Depois de submeter os chatbots a diversas tarefas criativas, fica claro que o ChatGPT ainda é o líder em termos de criatividade, mas o Llama não está muito atrás do resto do grupo.
2. Habilidades de codificação
Quando comparamos as habilidades de codificação do Llama 2 com ChatGPT e Bard, o Llama 2 mostrou-se muito promissor. Pedimos aos três chatbots de IA que gerassem um aplicativo funcional de lista de tarefas, escrevessem um jogo simples de Tetris e criassem um sistema de autenticação seguro para um site. Embora o ChatGPT tenha cumprido quase perfeitamente todas as três tarefas, Bard e Llama 2 tiveram desempenho semelhante, com ambos apenas capazes de fornecer código funcional para uma lista de tarefas e sistema de autenticação, mas falharam com o jogo Tetris. Abaixo está uma captura de tela do aplicativo de tarefas do Llama 2.

3. Habilidades matemáticas
Em habilidades matemáticas, o Llama 2 também se mostrou promissor em comparação com o Bard, mas foi muito superado pelo ChatGPT nos problemas de álgebra e lógica matemática que usamos em nosso teste. Curiosamente, o Llama 2 resolveu muitos dos problemas matemáticos que ChatGPT e Bard não conseguiram resolver em suas primeiras iterações. É seguro dizer que o Llama 2 é inferior ao ChatGPT em habilidades matemáticas, mas mostra uma promessa significativa.
4. Bom senso e raciocínio lógico
O senso comum é uma área com a qual muitos chatbots ainda estão lutando, mesmo os estabelecidos como o ChatGPT. Encarregamos ChatGPT, Bard e Llama 2 de resolver um conjunto de problemas de bom senso e raciocínio lógico. Mais uma vez, ChatGPT excedeu significativamente Bard e Llama 2. A competição foi entre Bard e Llama 2, e Bard teve uma vantagem marginal sobre Llama 2 em nosso teste.
Está claro que o Llama 2 ainda não chegou. No entanto, em sua defesa, o Llama 2 é relativamente novo, principalmente um “modelo fundamental” e não um “ajuste fino”. Os modelos fundamentais são grandes modelos de linguagem construídos com possíveis adaptações futuras em mente. Eles não estão ajustados a nenhum domínio específico, mas são construídos para lidar com uma ampla gama de tarefas, embora às vezes com habilidades limitadas.
Por outro lado, um modelo ajustado é um modelo fundamental ajustado para aumentar a sua eficiência num domínio específico. É como pegar um modelo fundamental como o GPT e ajustá-lo no ChatGPT para que o público possa usá-lo em aplicativos de bate-papo.
Como usar o Llama 2 agora mesmo
A maneira mais fácil de usar o Llama 2 é por meio da plataforma Poe AI do Quora ou de uma instância hospedada na nuvem Hugging Face. Você também pode obter o modelo baixando uma cópia dele e executando-o localmente.
Acesse Llama no Quora Poe
Para acessar o Llama na plataforma Poe AI do Quora:
- Visita poe.com e cadastre-se para uma conta gratuita.
- Faça login em sua conta para revelar a interface de seleção de modelo de IA.
- Clique no Mais ícone logo acima do campo de entrada para revelar os modelos de IA disponíveis.
Escolha qualquer um dos modelos Llama 2 disponíveis e comece a avisar.
Acesse Lhama no Abraço do Rosto
Para acessar o Llama no Hugging Face, abra o link para os modelos Llama 2 correspondentes abaixo e comece a avisar o chatbot AI.
Os modelos Llama acima e os da plataforma Poe foram ajustados para aplicativos de conversação, portanto, é o mais próximo do ChatGPT que você obterá para um modelo Llama-2. Não tem certeza de qual versão tentar? Recomendamos a opção três, a Parâmetros 70B Bate-papo Llama-2. Você ainda pode experimentar todos os três modelos para ver qual deles funciona melhor para suas necessidades específicas.
Embora recomendemos começar com o maior modelo disponível para aproveitar ao máximo o poder de computação remota ao usar HuggingFace ou Poe, para aqueles que pretendem executar o Llama 2 localmente, recomendamos começar com o modelo de parâmetros 7B, pois possui os requisitos de hardware mais baixos.
Requisitos de hardware para executar o Llama 2 localmente
Para um desempenho ideal com o modelo 7B, recomendamos uma placa gráfica com pelo menos 10 GB de VRAM, embora as pessoas tenham relatado que ela funciona com 8 GB de RAM. Ao executar localmente, a próxima escolha lógica seria o modelo de parâmetros 13B. Para isso, você pode optar por GPUs de consumo de última geração, como o RTX 3090 ou RTX 4090, para aproveitar suas habilidades. No entanto, você ainda pode configurar sua máquina Windows de nível intermediário ou um MacBook para executar isso.
Se você quiser acelerar a todo vapor, pode optar pelo modelo maior. No entanto, isso exigirá hardware de nível empresarial para um desempenho excelente. Em nível empresarial, estamos falando de hardware próximo a uma NVIDIA A100 com 80 GB de memória. O modelo de parâmetros 70B requer hardware especializado e excepcionalmente poderoso para uma execução responsiva. Mais uma vez, é importante esclarecer que você ainda pode executar este modelo em uma configuração de máquina menos potente. No entanto, o tempo de resposta pode ser terrivelmente lento, chegando a vários minutos por solicitação. Considere cuidadosamente os requisitos de GPU e memória antes de selecionar o modelo apropriado para suas necessidades. Ou use a instância HuggingFace.
Se você tiver hardware e profundidade técnica para executar o modelo Llama 2 localmente em sua máquina, poderá solicitar acesso ao modelo usando Formulário de solicitação de acesso ao Llama do Meta. Depois de fornecer um nome, e-mail, localização e o nome da sua organização, o Meta analisará sua inscrição, após o que o acesso será negado ou concedido em um período de alguns minutos a dois dias. Meu acesso foi concedido em minutos, então espero que você também tenha sorte.
Lhama 2: um primeiro passo importante
O Llama 2 pode não ser o modelo de linguagem mais sofisticado disponível, mas por ser de código aberto, representa um primeiro passo importante para o desenvolvimento transparente e progressivo da IA.
Embora empresas como OpenAI GPT atualmente tenham melhor desempenho, a abordagem de desenvolvimento murado da OpenAI significa que a empresa controla o crescimento e o ritmo de desenvolvimento do modelo. Com um modelo de código aberto como o Llama, a comunidade mais ampla de código aberto pode inovar iterativamente para construir novos produtos que talvez não fossem possíveis dentro de um sistema de jardim murado.