O que é o Google Gemini 1.0: O Google revelou totalmente seu modelo de IA generativa Gemini 1.0 de próxima geração, que agora está disponível por meio do chatbot conversacional Bard.
O modelo Gemini 1.0, que foi inicialmente apresentado no Google I/O em maio, é mais poderoso do que a tecnologia existente e potencialmente equipado para enfrentar o modelo ChatGPT da OpenAI usado pela Microsoft.
O Google afirma que o Gemini é o seu “maior e mais capaz modelo de IA” e será responsável por alimentar tudo, desde o Bard até a linha de smartphones Google Pixel. Está disponível no Bard a partir de hoje.
O empresa diz a chave para Gemini e o modelo “multimodal” de IA. Isso significa que pode “generalizar e compreender, operar e combinar diferentes tipos de informação, incluindo texto, código, áudio, imagem e vídeo”. Os modelos anteriores alcançaram capacidades muito mais limitadas ao unir modelos. Gêmeos é nativamente multimodal.
Você pode ver os novos recursos em uma demonstração incrivelmente impressionante abaixo. É rápido, reativo, coloquial e terrivelmente inteligente.
Três tamanhos diferentes para Gêmeos
O Google diz que o Gemini 1.0 é a primeira versão do modelo, como indicaria a convenção de numeração. Existem camadas construídas para diferentes finalidades. Todos eles se beneficiam do design multimodal e suas finalidades são detalhadas a seguir.
O Nano, por exemplo, será ótimo para IA no dispositivo e em breve estará disponível no Pixel 8 Pro, enquanto o Ultra é voltado para casos de uso extremos, como data centers. Pro é o meio-termo feliz, que Bard usará a partir de hoje.
- Gemini Ultra — nosso maior e mais capaz modelo para tarefas altamente complexas.
- Gemini Pro — nosso melhor modelo para escalar uma ampla gama de tarefas.
- Gemini Nano — nosso modelo mais eficiente para tarefas no dispositivo.
Desempenho sobre-humano
O Google afirma que o desempenho do Gemini foi rigorosamente testado em tarefas como imagem natural, compreensão de áudio e vídeo e raciocínio matemático. Gemini Ultra supera os modelos existentes em 30 dos 32 benchmarks acadêmicos para grandes modelos de linguagem.
Agora, diz o Google, Gemini está superando especialistas humanos em 57 assuntos quando se trata de MMLU (compreensão massiva de linguagem multitarefa). Gemini pontuou 90,0% nesses testes, enquanto ChatGPT 4 pontuou 86,4%. Essa é uma conclusão importante.
Queda de preço do Galaxy Z Flip 5
Oferecendo 100 GB de dados e um custo total significativamente mais barato do que comprar o telefone imediatamente, este negócio do Z Flip 5 é quase bom demais para ser verdade.
- Celulares no Reino Unido
- £ 139 adiantados
- Apenas £ 26,99/mês
Como e por que a próxima geração foi construída
O Google afirma que abordou o treinamento do Gemini de forma diferente da funcionalidade multimodal anterior. Anteriormente eles eram treinados separadamente e depois montados. Isso significava que era bom para descrever imagens, por exemplo, mas não tinha a capacidade de raciocínio complexo e competente.
O Google diz que o Gemini foi pré-treinado desde o início para ser nativamente multimodal.
“Depois, nós o ajustamos com dados multimodais adicionais para refinar ainda mais sua eficácia”, afirma a empresa na postagem do blog. “Isso ajuda a Gemini a compreender e raciocinar perfeitamente sobre todos os tipos de informações desde o início, muito melhor do que os modelos multimodais existentes – e suas capacidades são de última geração em quase todos os domínios.”
Disponibilidade
Como mencionamos, o Gemini Pro está disponível para uso no Google Bard a partir de hoje, enquanto o Gemini Nano será lançado no Pixel 8 Pro no próximo ano.
O Google acrescenta: “Também estamos trazendo o Gemini para o Pixel. O Pixel 8 Pro é o primeiro smartphone projetado para rodar o Gemini Nano, que está potencializando novos recursos como Summaride no aplicativo Recorder e sendo lançado no Smart Reply no Gboard, começando com o WhatsApp – com mais aplicativos de mensagens chegando no próximo ano.”