O que é o Google Gemini 1.5? O Google está entusiasmado com suas últimas melhorias na plataforma Google Gemini AI, chamada Gemini 1.5, que vem logo após o lançamento da plataforma Gemini em dezembro.
Se você não está familiarizado com o Google Gemini, o novo nome para as incursões iniciais sob o apelido de Bardo, há um explicador muito bom aqui do nosso editor de computação Adam Speight.
Existem muitas iterações diferentes do Gemini, incluindo Nano (o modelo mais eficiente para tarefas no dispositivo), Pro (o melhor modelo para escalar em uma ampla gama de tarefas) e Ultra (o modelo maior e mais capaz para tarefas altamente complexas) . Hoje, o Google está permitindo que grupos selecionados testem o Gemini 1.5 Pro antes do lançamento para o consumidor em uma data posterior.
Depois que a versão 1.0 não deixou dúvidas de que o Google estava no caminho certo para recuperar a liderança inicial assumida pela OpenAI e pela Microsoft com ferramentas alimentadas por ChatGPT, a atualização 1.5 anunciada pelo Google hoje melhora drasticamente esse desempenho.
Então é aqui que o Google está realmente entusiasmado.
O plugue inteligente Kasa (KS105) custa apenas £ 8,99
O plugue inteligente TP-Link Kasa é minúsculo em tamanho e agora minúsculo em preço. Você pode obter esses práticos plugues conectados por Wi-Fi com 55% de desconto.
- Amazonas
- Custava £ 19,99
- Agora £ 8,99
O que é o Google Gemini 1.5?
O Google afirma que o Gemini 1.5 “melhorou drasticamente o desempenho, com um avanço na compreensão de longo contexto entre modalidades”. No geral, o Gemini 1.5 Pro supera o 1.0 Pro em 87% e tem um desempenho tão bom quanto o 1.0 Ultra em testes de benchmarking.
A chave é o que o Google chama de arquitetura Mixture-of-Experts (MoE), que significa que o modelo inteiro não é consultado para cada consulta. O Google afirma que o Gemini 1.5 pode “ativar seletivamente apenas os caminhos especializados mais relevantes em sua rede neural”, o que significa um desempenho mais rápido e eficiente.
“Nossas inovações mais recentes em arquitetura de modelo permitem que o Gemini 1.5 aprenda tarefas complexas com mais rapidez e mantenha a qualidade, ao mesmo tempo que é mais eficiente para treinar e servir”, afirma o Google.
A empresa também está bastante satisfeita com a “janela de contexto” mais longa disponível no Gemini 1.5 e isso é mais evidente na quantidade de tokens (pedaços de palavras, imagens, vídeos, áudio ou código) que o modelo pode manipular por solicitação.
Enquanto o Gemini 1.0 Pro tem capacidade para 32.000 tokens, o Gemini 1.5 Pro agora pode lidar com um milhão de cada vez.
O que isto significa? Bem, grandes quantidades de informações agora podem ser processadas por prompt. O Google diz que um milhão de tokens equivale a “1 hora de vídeo, 11 horas de áudio, bases de código com mais de 30.000 linhas de código ou mais de 700.000 palavras”.
Aqui está uma demonstração dessa “longa compreensão do contexto” baseada na transcrição de 402 páginas da missão lunar Apollo 11.