ChatGPT, ressuscitando o alto-falante inteligente.
Os serviços de assistente de inteligência artificial têm competido em pleno vigor desde o lançamento da Alexa em 2014. A partir de 2018, foram lançados vários tipos de alto-falantes inteligentes, permitindo que os assistentes de IA fossem usados não apenas por meio de aplicativos de smartphone, mas também por meio de uma variedade de alto-falantes.
No entanto, esses alto-falantes inteligentes não demoraram muito para se tornarem um incômodo. Primeiro, os assistentes de IA não entendiam muito bem a fala. Eles frequentemente confundiam gatilhos não intencionais como comandos e acordavam, perturbando a tranquilidade.
Além disso, mesmo quando conseguiam entender a fala, suas respostas frequentemente eram inadequadas. Eles só podiam ser usados para tarefas básicas, como verificar o clima, definir um alarme, reproduzir música e ouvir rádio, e não eram muito úteis quando se tratava de responder perguntas ou encontrar informações.
Graças ao ChatGPT, esses alto-falantes inteligentes e assistentes de IA de primeira geração estão tendo a oportunidade de alçar voos de ressurreição. Em agosto de 2022, a Amazon revelou um novo modelo de linguagem de IA que pode aprimorar a Alexa. Esse modelo, chamado de Modelos de Ensino da Alexa (AlexaTM), demonstra excelente desempenho em várias traduções de idiomas e resumos de texto. Mesmo antes disso, em 2021, o Google anunciou um chatbot de domínio aberto chamado LaMDA, que é um modelo de IA capaz de conversar em várias personas sobre vários tópicos.
Uma startup chamada Gorilla Technology lançou um aplicativo chamado Super Chat, que pode conversar com figuras históricas ou personalidades mundialmente famosas em suas personas. Startups similares que oferecem serviços de personas de IA, como Poe do Quora, Character.ai e D-ID, também estão ganhando destaque.
Além disso, uma startup chamada CygniContGraVitas lançou um serviço chamado AutoGPT que utiliza o GPT-4. Após estabelecer o objetivo final para a IA, a IA estabelece um plano para realizar várias tarefas para alcançar o objetivo e se esforça para alcançá-lo. Enquanto o ChatGPT só pode responder a comandos e perguntas humanas, o AutoGPT pode se aprimorar automaticamente e realizar várias tarefas detalhadas para alcançar o objetivo após o primeiro objetivo e instrução.
Por exemplo, se você ordenar “Criar um milhão de contas do Instagram para seguir”, o AutoGPT produzirá diligentemente conteúdo e realizará várias tarefas detalhadas para alcançar esse objetivo. Se esses modelos forem aplicados a alto-falantes inteligentes, eles podem fornecer serviços de conversação além das expectativas. Talvez o assistente de IA de primeira geração agora seja capaz de realizar o ideal do Jarvis no filme Homem de Ferro.
A Josh.ai, uma desenvolvedora de sistemas de automação residencial controlados por voz fundada em 2015, revelou um protótipo que utiliza a API do ChatGPT para aplicar funcionalidades muito mais naturais e inteligentes ao seu alto-falante inteligente do que os assistentes de IA existentes. Graças ao ChatGPT, mesmo que os usuários façam perguntas incorretas ou sem sentido considerando o contexto, a Josh pode considerar a situação circundante e corrigi-los para que possam entender e responder adequadamente.
Além disso, pode operar os objetos circundantes vinculados aos assistentes de IA de maneira contextualmente relevante para fornecer uma experiência de serviço mais integrada. Por exemplo, se um usuário disser: “Estou realmente cansado hoje. Quais são algumas maneiras de relaxar?”, o alto-falante inteligente Josh vinculado ao ChatGPT pode sugerir técnicas de relaxamento, como meditação guiada ou diminuir a iluminação e mostrar vídeos relaxantes do YouTube na TV.
Estudantes de Stanford desenvolveram um protótipo de óculos chamado ‘RizzGPT’ que combina o GPT-4 com óculos para fornecer um serviço que mostra várias informações por meio dos óculos como texto durante a conversa com outras pessoas.
A conversa entre o usuário e a outra pessoa é convertida em texto por meio dos óculos de RA, que estão conectados a um smartphone e enviados para o ChatGPT. Além disso, as informações sobre a cena que o usuário está observando, como o rosto da outra pessoa, roupas, estado, objetos e ambiente ao redor, também são transmitidas para o GPT-4. Isso permite conversas mais naturais fornecendo informações não apenas por voz, mas também sobre o que está acontecendo ao redor do usuário.
Ao interpretar as informações transmitidas para o GPT-4 e exibi-las como texto por meio dos óculos, os usuários podem ter conversas mais eficazes. No futuro, também será possível fornecer informações adicionais ao usuário na forma de imagens, vídeos ou sons.
Por exemplo, os óculos podem fornecer informações oportunas e precisas durante uma palestra, uma apresentação importante ou um projeto complexo de instalação elétrica, aprimorando o valor do usuário. Isso é a realização do Jarvis, que vimos nos filmes. Graças à tecnologia de IA, como LLM (Large Language Model), que possibilita serviços de IA (Inteligência Artificial) gerais como o ChatGPT.
Dessa forma, o ChatGPT poderá fornecer novas funções que antes eram impossíveis, integrando-se a alto-falantes inteligentes, óculos de RA e vários dispositivos de IoT (Internet das Coisas) e garantindo uma melhor qualidade de serviço do que antes. É claro que esse ChatGPT também poderia ser incorporado a robôs, além de sua função como assistente virtual para nos ajudar, e até mesmo ter uma presença física.
Essa é outra dimensão do problema em que o ChatGPT entra em nossa realidade, não apenas virtualmente, e nossa sociedade deve considerar profundamente e se preparar para qual impacto social essa tecnologia terá e tomar medidas para garantir que a tecnologia não represente uma ameaça à humanidade.