Até recentemente, você talvez não tivesse ouvido falar do Google Gemini, mas o chatbot Bard do Google pode ter entrado em sua atmosfera. Mas, uma mudança colocou os holofotes de volta em Gêmeos e você certamente ouvirá sobre isso cada vez mais nos próximos anos.
O modelo Gemini 1.0, que foi inicialmente apresentado no Google I/O em maio, é mais poderoso do que a tecnologia existente e potencialmente mais equipado para enfrentar o modelo ChatGPT da OpenAI usado pela Microsoft. Os testes do Google dizem que é mais poderoso.
Esse é um dos principais contextos, mas vamos entrar no básico.
O que é o Google Gêmeos?
Em 8 de fevereiro de 2024, o Google anunciou que Bard agora se tornaria Gemini, com o chatbot adotando o nome do modelo de IA que o alimenta. Como tal, o Google Gemini agora se refere tanto ao modelo quanto ao chatbot voltado ao público.
O Google afirma que o Gemini é o seu “maior e mais capaz modelo de IA” e será responsável por alimentar tudo, desde o Bard até a linha de smartphones Google Pixel.
O empresa diz a chave para Gemini e o modelo “multimodal” de IA. Isso significa que pode “generalizar e compreender, operar e combinar diferentes tipos de informação, incluindo texto, código, áudio, imagem e vídeo”. As iterações anteriores alcançaram capacidades mais limitadas ao unir modelos. Gêmeos é nativamente multimodal.
Três tamanhos diferentes para Gêmeos
O Google diz que o Gemini 1.0 é a primeira versão do modelo, como sugere a convenção de numeração. Existem camadas construídas para diferentes finalidades. Todos eles se beneficiam do design multimodal e suas finalidades são detalhadas a seguir.
O Nano, por exemplo, será ótimo para IA no dispositivo e em breve estará disponível no Pixel 8 Pro, enquanto o Ultra é voltado para casos de uso extremos, como data centers. Pro é o meio-termo feliz, que Bard usará a partir de hoje.
- Gemini Ultra — nosso maior e mais capaz modelo para tarefas altamente complexas.
- Gemini Pro — nosso melhor modelo para escalar uma ampla gama de tarefas.
- Gemini Nano — nosso modelo mais eficiente para tarefas no dispositivo.
Disponibilidade
O Gemini Pro está disponível para uso no Google Bard desde dezembro e continua sendo o padrão para uso padrão do Google Gemini, enquanto o Gemini Nano foi lançado no Pixel 8 Pro como parte do lançamento de recursos de dezembro.
Economize 23% no Google Pixel Watch 2
O Google Pixel Watch 2 acaba de atingir o preço mais baixo, caindo 23%, para um preço de £ 270.
- Amazonas
- Economize 23%
- Agora £ 270
O Google acrescenta: “Também estamos trazendo o Gemini para o Pixel. O Pixel 8 Pro é o primeiro smartphone projetado para rodar o Gemini Nano, que está potencializando novos recursos como Summaride no aplicativo Recorder e sendo lançado no Smart Reply no Gboard, começando com o WhatsApp – com mais aplicativos de mensagens chegando no próximo ano.”
No dia 8 de fevereiro, o Google lançou o Gemini Advanced, dando aos usuários acesso ao modelo Ultra 1.0. O Google diz que este é o “maior e mais capaz modelo de IA de última geração”. Advanced visa lidar com tarefas mais complexas, como codificação, raciocínio lógico, seguir instruções diferenciadas e colaborar em projetos criativos. O Ultra 1.0 também entende melhor o contexto, com base em conversas anteriores. Gemini Advanced está disponível em inglês em 150 países e territórios. Ele será expandido para mais idiomas no futuro.
Você pode obter acesso ao Google Gemini Advanced inscrevendo-se no plano Google One AI Premium. O plano custa £ 18,99/mês ($ 19,99/mês). Junto com o acesso ao Gemini Advanced, você obtém 2 TB de armazenamento no Google Drive e “acesso a outros benefícios do Google One”.
Gemini e Gemini Advanced estão sendo lançados no Android por meio do Google Assistant, permitindo escolher entre os modelos de IA e o Assistente padrão. Para iOS, o Gemini está sendo lançado no Google app.
Desempenho sobre-humano
O Google afirma que o desempenho do Gemini foi rigorosamente testado em tarefas como imagem natural, compreensão de áudio e vídeo e raciocínio matemático. Gemini Ultra supera os modelos existentes em 30 dos 32 benchmarks acadêmicos para grandes modelos de linguagem.
Agora, diz o Google, Gemini está superando especialistas humanos em 57 assuntos quando se trata de MMLU (compreensão massiva de linguagem multitarefa). Gemini pontuou 90,0% nesses testes, enquanto ChatGPT 4 pontuou 86,4%. Essa é uma conclusão importante.
Como e por que a próxima geração foi construída
O Google afirma que abordou o treinamento do Gemini de forma diferente da funcionalidade multimodal anterior. Anteriormente eles eram treinados separadamente e depois montados. Isso significava que ele era bom em descrever imagens, por exemplo, mas não tinha capacidade para raciocínio complexo e competente.
O Google diz que o Gemini foi pré-treinado desde o início para ser nativamente multimodal e isso resulta em uma atualização massiva.
“Depois, nós o ajustamos com dados multimodais adicionais para refinar ainda mais sua eficácia”, afirma a empresa na postagem do blog. “Isso ajuda a Gemini a compreender e raciocinar perfeitamente sobre todos os tipos de informações desde o início, muito melhor do que os modelos multimodais existentes – e suas capacidades são de última geração em quase todos os domínios.”