O post mortem da Alexa

No mês de maio desse ano a Amazon anunciou quantos dispositivos Alexa foram vendidos em toda a sua história: mais de 500 milhões de unidades habilitadas com a IA foram comercializadas desde que o modelo “Echo”, produto inicial do segmento de assistentes de voz domésticos (ou smart speakers), foi lançado em 2014 (esse número representa todos os dispositivos da Amazon e de outras empresas que possuem a assistente Alexa instalada). Entretanto, desde a estreia inicial da assistente para facilitar o nosso dia a dia, não foi ela quem recentemente revolucionou o mercado como um todo (inclusive de outros segmentos além do doméstico). Em 2022 o ChatGPT entrou em cena para basicamente nos fazer refletir no uso de IA em todas as esferas possíveis (profissional, educacional, sentimental etc).

Mas por que a assistente virtual mais famosa do mundo não cumpriu a promessa inicialmente feita?

Como o uso de outras inteligências artificiais têm se mostrado extremamente mais úteis nas atividades do nosso cotidiano? Por que a área responsável pela Alexa na Amazon teve um prejuízo operacional de 3 bilhões de dólares só no primeiro trimestre do ano passado, totalizando aproximadamente U$ 10 bilhões ao final de 2022?

Apresentação durante o evento Amazon reMARS 2022: 30% de todas as ações de casas smart dos EUA são iniciadas por meio da Alexa.

A divisão responsável pela Alexa dentro da Amazon se chama “Worldwide Digital”, responsável pelo maior prejuízo da empresa entre todas as suas unidades de negócios durante os primeiros três meses de 2022 (considerando divisões extremamente recentes da companhia como a Amazon Store de lojas físicas ou a mercearia Amazon Fresh). Esse desempenho tornou os colaboradores da divisão como os primeiros alvos de layoffs da organização.

Além disso a Alexa vem perdendo espaço dentro do próprio segmento de assistentes de voz nos EUA: o Google Assistant liderou o ano passado com mais de 81,5 milhões de usuários, enquanto a assistente da Apple, Siri, ficou em segundo lugar com 77,6 milhões.

Projeção de usuários por assistente de voz nos EUA em 2024 feita pela Insider.

Histórico
A Amazon basicamente criou o segmento de assistentes de voz domésticos: se compararmos as vendas de dispositivos Alexa e iPhones em seus três primeiros anos desde os respectivos lançamentos é possível notar que, durante o segundo ano, a Amazon vendeu mais dispositivos que a Apple. Durante os anos 2010 a própria Apple e o Google tiveram que correr atrás do prejuízo, lançando seus próprios devices para concorrer a esse recém-criado mercado. Tudo isso porque aparentemente iríamos passar por uma revolução IoT (internet of things) com diversos equipamentos espalhados pelas nossas casas trazendo diferentes informações, automatizando algumas atividades e nos conectando constantemente com a internet. A Alexa seria o ponto comum entre todos esses dispositivos: seria por meio dela que poderíamos acioná-los e controlá-los. Entretanto, essa revolução nunca chegou de fato e, ao invés disso, agora existe uma nova inteligência artificial que vem gerando visibilidade a nível global sobre o tema. Como todas essas empresas superaram a Amazon em relação a essa tecnologia?

Vendas desde seus respectivos lançamentos nos três primeiros anos dos dispositivos Alexa e iPhones via Slidebean.

Modelo de negócio
É muito provável que você tenha um dispositivo Alexa ou algum outro em sua casa, que foi comprado durante a Black Friday, Prime Day ou outro evento oferecendo grande desconto, a ponto de ter feito você se questionar como um device como aquele seria tão barato na época. Isso porque o modelo de negócio da Amazon no segmento não é de lucrar com a venda de seus aparelhos, e sim com sua utilização (um conceito bem relevante considerando a cadeia de distribuição da própria organização).
A empresa queria que os usuários realizassem compras por meio dos seus dispositivos, fazendo pedidos por meio do assistente de voz. Todavia, você já realizou alguma compra através dele? Se sim, quantas vezes? Por uma série de razões (vamos chegar nelas) o objetivo inicial de utilização desse produto não se consolidou, e hoje em dia é bem mais plausível que você utilize seu dispositivo para tocar músicas, acender e pagar luzes ou solicitar a previsão do tempo do que outras atividades mais complexas (como a realização de compras em sites, normalmente realizadas através de smartphones).

“Queremos ganhar dinheiro quando as pessoas usarem nossos dispositivos, não quando os comprarem.”

– Frase extráida de documentos internos da Amazon.

Interface audível
E por que utilizamos nossos smartphones ou notebooks para realização de compras? Por se tratarem de plataformas visuais e oferecem informações de forma ágil. Pensando em um exemplo prático: quando realizamos a compra de uma roupa, um tênis, queremos visualizá-lo: queremos entender suas características físicas, em quais cores está disponível, tamanhos, compará-lo com outros modelos entre diversos outros aspectos a serem analisados. Só nessa situação já é possível identificarmos uma grande discrepância entre a utilização de um dispositivo Alexa do celular. O nível de detalhamento seria insuficiente em relação ao apresentado por uma assistente virtual, uma vez que a descrição verbal abre margem para interpretação.

Outro aspecto é a questão do tempo: vamos considerar todos os exemplos acima citados, visualmente bastaria olharmos para uma tela para distingui-los. Agora, imagine a Alexa descrevendo todas essas características, item a item: levaria vários minutos ao invés de meros segundos para checarmos informações básicas sobre o que queremos comprar.

Limitação de funcionalidades exibíveis
Continuando a linha de raciocínio acima, outro problema com interfaces audíveis é que muitas vezes não sabemos qual o potencial dela por completo. Por exemplo, você sabia que é possível jogar xadrez ou até mesmo imagem e ação com sua Alexa? Treinar o simulado do exame de habilitação de condução para dirigir? Acompanhar o andamento das solicitações feitas via iFood? Encontrar seu smartphone caso o tenha perdido? Muito provavelmente não, porque é difícil repassar todas essas possibilidades quando somos orientados majoritariamente por meio de áudio.

Vamos comparar a experiência com a primeira vez que acessamos a Netflix, por exemplo: só de observarmos todas as opções na tela (como ‘Minha lista’, ‘Jogos’, ‘Downloads’ etc.), por mais que não estejamos familiarizados com o que cada uma dela faz, temos ciência de sua existência. Por consequência, podemos passar a explorá-las quando quisermos. Com o áudio não é tão simples: quando teremos interesse em solicitar a Alexa uma listagem de todas as suas funcionalidades? É mais fácil procurar por elas via nosso bom e velho celular.

Falta de apps/desenvolvedores atuando junto a Alexa
Um ponto importante a ser analisado é a questão da adesão não somente por usuários, mas também por desenvolvedores que criarão apps e features (ou skills) a partir da Alexa.

Venda de dispositivos e apps desenvolvidos por ecossistema nos quatro primeiros anos dos dispositivos Alexa e iPhones via Slidebean.

O gráfico mostra que, apensar de um número representativo de vendas de ambos, poucos desenvolvedores acreditaram na Alexa a ponto de criarem habilidades específicas para ela. Em contrapartida, a quantidade de empresas e startups que passaram a desenvolver aplicativos e novas funcionalidades para o iPhone foi gritante. Isso porque desde o seu lançamento o smartphone ele possuía giroscópios, câmeras, armazenamento, GPUs, CPU mais robusta entre diversos outros atributos: todos eles foram insumos a serem utilizados pelos desenvolvedores para criação de apps. Em paralelo, dispositivos Echo ou Dot, por exemplo, são muito mais limitados nesse sentido.

E o problema não está apenas nos novos apps, mas na manutenção dos já desenvolvidos para a Alexa: muitos dos desenvolvedores pararam de dar o devido suporte por conta da falta de usabilidade por parte dos clientes.

A virada de jogo com o ChatGPT
Quais as diferenças e similaridades entre Alexa e ChatGPT? Enquanto ambas utilizam de tecnologia de inteligência artificial, a primeira tem majoritariamente uma interface audível, enquanto o ChatGPT é visual. Outra evidente diferença é o nível de compreensão: O ChatGPT tem um conhecimento muito mais diversificado em comparação com a Alexa, por possuir vastos bancos de dados atrelados a ele. Isso o permite compreender consultas mais complexas e a fornecer respostas mais precisas e elaboradas aos seus usuários (a interação com a Alexa precisa ser mais ‘direta’ pela comunicação ser via áudio).

Quando falamos sobre a Alexa e seu entendimento, fica claro que ele é limitado em comparação ao ChatGPT. Para diminuir esse gap, a Amazon poderia, por exemplo, atualizar os dispositivos ou a inteligência que atua no background em seus servidores: entretanto seria um investimento considerável (projeções apontam que o ChatGPT pode custar mais de U$ 700.000 por dia para operar) em um departamento que vem apresentando perdas cada vez mais representativas nos últimos anos (e com o ônus de uma interface audível conforme destacado).

Enquanto a Amazon enfrenta um dilema em relação aos possíveis caminhos do futuro da Alexa (incluí-la em um robô doméstico talvez não seja o mais assertivo deles), o ChatGPT e o Google Bard se firmam como inteligências artificiais efetivamente úteis e presentes no nosso dia a dia.

1 comments

Deixe um comentário

Keep Up to Date with the Most Important News

By pressing the Subscribe button, you confirm that you have read and are agreeing to our Privacy Policy and Terms of Use
Advertisement