IA para Fala e Tradução
Crie e implante IA para fala e tradução multi-idiomas totalmente personalizável para seu grande modelo de linguagem e aplicações baseadas em geração aumentada de recuperação.
Video | Resumo da Solução | Para Desenvolvedores
NVIDIA® Riva é um conjunto de microsserviços de fala e tradução multi-idiomas acelerados por GPU para a construção de pipelines de IA conversacionais totalmente personalizáveis e em tempo real. Riva inclui reconhecimento automático de fala (ASR), conversão de texto em fala (TTS) e tradução automática neural (NMT) e pode ser implementado em todas as nuvens, em data centers, no edge ou em dispositivos incorporados. Com o Riva, as empresas podem adicionar interfaces de fala e tradução com grandes modelos de linguagem (LLMs) e geração aumentada de recuperação (RAG) para transformar chatbots em assistentes e avatares multi-idiomas envolventes e expressivos.
Ofereça chatbots de IA com transcrição, tradução e vozes multi-idiomas de última geração.
Selecione o idioma e veja como o Riva ASR oferece transcrição altamente precisa em tempo real, fornecendo uma entrada através do seu microfone ou carregando um arquivo .wav do seu dispositivo.
Nota: A duração de cada amostra é limitada a 30 segundos.
Selecione uma voz e digite uma frase de teste para ouvir a voz feminina ou masculina em inglês pronta para uso de Riva.
Nota: O texto de entrada está limitado a 400 caracteres.
0 / 400
O uso das habilidades do Riva está sujeito aos termos de uso do NVIDIA Riva. Seus dados serão usados para melhorar os produtos e serviços da NVIDIA.
Obtenha alta precisão de transcrição para traduções bilíngues e multi-idiomas e implemente vozes femininas e masculinas profissionais expressivas e prontas para uso com modelos de última geração pré-treinados em milhares de horas de áudio em supercomputadores NVIDIA.
Personalize pipelines ASR para diferentes idiomas, sotaques, domínios, vocabulário e contexto para obter a melhor precisão possível para seu caso de uso e pipelines TTS para a voz e entonação desejadas.
Forneça experiências consistentes aos seus clientes para centenas de milhares de fluxos de entrada com maior desempenho de inferência em comparação com a tecnologia existente e na implantação de sua escolha: em data centers, no local, na nuvem, no edge ou em dispositivos incorporados.
As empresas estão implantando assistentes de perguntas e respostas para responder automaticamente às dúvidas de milhões de clientes e funcionários, 24 horas por dia. Com os microsserviços de IA de fala e tradução da Riva, esses assistentes fornecem respostas úteis e naturais em cada etapa da conversa, apesar do ruído de fundo, da baixa qualidade do som e dos diversos dialetos e sotaques dos falantes.
Os consumidores esperam que os atendentes do contact center resolvam seus problemas de forma rápida e eficiente. Para apoiar os atendentes a oferecer as melhores experiências possíveis, empresas de todos os setores estão implantando tecnologia de assistência a atendentes baseada na IA de fala e tradução da Riva, que pode fornecer fatos e sugestões em tempo real.
Para melhorar as experiências de atendimento ao cliente e construir relacionamentos com seus clientes, as empresas estão construindo avatares com vozes de marca reconhecíveis. Com o Riva, eles podem criar uma voz única, personalizada e de alta qualidade com apenas três segundos de dados de fala.
Com centenas de milhões de reuniões online realizadas diariamente, a videoconferência tornou-se uma ferramenta indispensável para as empresas. Através da transcrição em tempo real da Riva, as aplicações de videoconferência alcançam uma precisão impressionante em legendas ao vivo e resumos de reuniões, acomodando usuários com sotaques mundiais e diversos vocabulários específicos de domínio.
Na economia global, as empresas operam em vários países e atendem clientes com diversas origens linguísticas e culturais. Esta diversidade de idiomas globais representa um desafio único, uma vez que contratar falantes nativos e treinar funcionários em vários idiomas não é escalonável, econômico ou eficiente. A tradução do Riva permite aplicações de comunicação precisas e eficazes, facilitando interações globais tranquilas.
Os robôs de serviço são cada vez mais encontrados em hospitais, aeroportos e lojas de varejo em todo o mundo. Eles auxiliam os trabalhadores da linha de frente realizando tarefas repetitivas diárias em restaurantes e instalações de manufatura, auxiliam os clientes na localização de itens nas lojas e apoiam médicos e enfermeiros no atendimento aos pacientes. Com o Riva, é fácil adicionar IA de fala e tradução a robôs de serviço.
Use as ferramentas certas para criar e implantar aplicações de IA para fala e tradução totalmente personalizáveis e multi-idiomas.
Para quem deseja experimentar o Riva, o catálogo de APIs oferece um playground baseado em UI e acesso gratuito a endpoints de API gerenciados pela NVIDIA como um excelente ponto de partida.
Para empresas que desejam experimentar o Riva antes de adquirir o NVIDIA AI Enterprise para produção, há duas opções para começar gratuitamente:
Sem Infraestrutura: Para quem não tem infraestrutura existente, a NVIDIA oferece laboratórios práticos gratuitos por meio do NVIDIA LaunchPad.
Com Infraestrutura: Para aqueles com infraestrutura existente, a NVIDIA oferece uma licença de avaliação gratuita para testar o NVIDIA AI Enterprise por 90 dias.
T-Mobile uses NVIDIA Riva ASR in their call center to accurately transcribe customer conversations and provide real-time recommendations to help agents quickly resolve customer queries.
A T-Mobile usa NVIDIA Riva ASR em seu call center para transcrever com precisão as conversas dos clientes e fornecer recomendações em tempo real para ajudar os agentes a resolver rapidamente as dúvidas dos clientes.
A NCS usou o NVIDIA Riva TTS para personalizar uma voz de Singapura com pronúncia, tom e sotaque locais para milhares de usuários ativos mensais do Breeze, uma aplicação complementar para motoristas.
Tarteel usa NVIDIA Riva e NVIDIA NeMo™ para fornecer feedback em tempo real sobre a recitação do Alcorão em grande escala, permitindo que muçulmanos, instrutores, criadores de conteúdo e pesquisadores se envolvam com o Alcorão.
Com o NVIDIA Riva, o RingCentral alcançou uma precisão de transcrição em tempo real incomparável para videoconferências, atendendo milhões de usuários com diversos sotaques e jargões específicos de domínio.
A Data Monsters adicionou um pipeline de fala à sua aplicação Plabook usando NVIDIA Riva para ajudar os alunos a ler, avaliar a precisão do nível do fonema e fornecer feedback individualizado.
A Artisight desenvolveu soluções hospitalares inteligentes que automatizam check-ins e notificam pacientes em espera por meio de quiosques habilitados por voz. Essas soluções integram uma aplicação de IA para fala personalizado e oferecem desempenho em tempo real usando habilidades de conversão de texto em fala NVIDIA Riva aceleradas por GPU.
Crie aplicações de IA de fala de classe mundial e totalmente personalizáveis, como assistentes virtuais inteligentes, serviços de transcrição de áudio, avatares digitais e muito mais.
Ao gerar uma transcrição precisa das interações com os clientes em tempo real, o Riva permite que a IA forneça insights contextuais, meça o sentimento e recomende a próxima melhor ação a um agente, garantindo uma excelente experiência personalizada.
Veja como o Spot usa IA e GPS superpreciso para pedir e pegar lanches.
Você já possui um projeto de IA de fala? Inscreva-se para obter experiência prática em testes e prototipagem de suas soluções baseadas em conversação com habilidades de fala no stack de software Riva de alto desempenho que pode ser implantada hoje.
Aprenda a criar, treinar, ajustar e implantar um serviço de reconhecimento automático de fala (ASR) acelerado por GPU com Riva que inclui recursos personalizados.
Junte-se a especialistas em IA para aprender como criar, ajustar e implantar IA multilíngue de fala e tradução pronta para produção em aplicações baseadas em LLM para ativar o som de seus chatbots, permitir que falem no idioma de sua escolha e fornecer melhores serviços.
Leia como uma equipe de NVIDIANs venceu o desafio LIMMITS ’24, que pedia aos competidores que recriassem em tempo real a voz de um locutor em inglês ou em qualquer um dos seis idiomas falados na Índia com o sotaque apropriado.
Saiba mais sobre a arquitetura, os principais recursos e os componentes da Riva para a construção de serviços de IA de fala e tradução.
Explore como começar a integrar e implantar modelos Riva ASR e TTS em produção com inferência de alto desempenho e esforço mínimo.
Mergulhe no conteúdo mais recente e veja como as empresas estão tornando possíveis tecnologias poderosas, como assistentes virtuais, transcrições em tempo real, pesquisas por voz e sistemas de resposta a perguntas.
O Speech AI Day oferece a oportunidade de ouvir líderes e especialistas renomados em IA de fala e tradução enquanto eles compartilham suas pesquisas inovadoras, exploram aplicações do mundo real e discutem contribuições de código aberto.
Explore como iniciar sua jornada com a IA de fala e tradução de ponta da Riva e personalize-a totalmente para obter a solução de assistência ao agente da mais alta precisão. São apresentadas demonstrações de especialistas em IA conversacional da Infosys, Quantiphi e NVIDIA.
A T-Mobile usa Riva ASR em seu call center para transcrever com precisão as conversas dos clientes e fornecer recomendações em tempo real para ajudar os agentes a resolver rapidamente as dúvidas dos clientes.
A NCS usou o Riva TTS para personalizar uma voz de Singapura com pronúncia, tom e sotaque locais para milhares de usuários ativos mensais do Breeze, uma aplicação complementar para o motorista.
A Tarteel usa Riva e NVIDIA NeMo™ para fornecer feedback em tempo real sobre a recitação do Alcorão em grande escala, permitindo que muçulmanos, instrutores, criadores de conteúdo e pesquisadores se envolvam com o Alcorão.
Explore a comunidade on-line do Riva, onde você pode navegar por perguntas de instruções, aprender práticas recomendadas, interagir com outros desenvolvedores e relatar bugs.
Conecte-se com milhões de desenvolvedores com ideias semelhantes e acesse centenas de contêineres, modelos e SDKs acelerados por GPU, todas as ferramentas necessárias para criar aplicações com sucesso com a tecnologia NVIDIA, por meio do Programa de Desenvolvedor da NVIDIA.
NVIDIA Inception é um programa gratuito para startups de ponta que oferece acesso crítico a suporte de entrada no mercado, conhecimento técnico, treinamento e oportunidades de financiamento.
Explore como AT&T, Kore.ai, Deloitte e Sutherland se beneficiam do uso de ASR, tradução e TTS multilíngue para fornecer autoatendimento ao cliente mais rápido e preciso, aumentar a produtividade dos agentes ao vivo e aumentar a eficiência operacional para empresas.
Aprenda com especialistas em ciência de dados e tecnologia de IA sobre as soluções de IA para fala e tradução NVIDIA Riva de ponta que estão revolucionando o setor, desde assistentes virtuais e avatares digitais para melhor alcance, gerenciamento de sinistros, pedidos e provisionamento até sistemas de detecção de fraude para mitigação de riscos.
Assista a este webinar on demand para saber como criar assistentes virtuais inteligentes na forma de agentes digitais habilitados por voz. Mostraremos como implantar soluções flexíveis e totalmente personalizáveis para melhorar a satisfação do cliente.
Veja como a Motorola e a SoftServe oferecem transcrição, tradução e vozes envolventes mais precisas na velocidade e escala que as experiências de IA conversacional exigem.
Watch this on-demand webinar to learn how speech AI is revolutionizing customer experiences in finance, broadcasting, and retail by removing barriers across languages and dialects, driving operational efficiency, and helping businesses stay ahead by improving accuracy and enhancing performance.
Watch Infosys, Quantiphi, Talkmap, and NVIDIA on-demand to learn how telecommunications companies are using AI to improve operational efficiency and enhance customer engagement.
Learn best practices from Infosys and Quantiphi for seamlessly integrating speech and translation AI into agent-assist solutions, ensuring smooth and effective customer-agent communication.
Watch T-Mobile as they walk through their model development with NVIDIA NeMo, cloud deployment with NVIDIA Riva, their efforts to identify and remove bias in their models, and the future of speech-to-text at T-Mobile.
Entenda os principais recursos do Riva que ajudam você a criar serviços de IA para fala e tradução.
Obtenha tudo o que você precisa para começar a criar pipelines de IA para fala e tradução com NVIDIA Riva, incluindo tutoriais, Notebooks Jupyter e documentação.
Leia um passo a passo técnico sobre como criar e implantar aplicações de IA para fala e tradução usando Riva.
Encontre a licença certa para criar e implantar aplicações de IA para fala e tradução totalmente personalizáveis e multi-idiomas ou explore mais recursos de desenvolvimento.
Fale com um especialista em produtos da NVIDIA sobre como passar da fase de testes para a produção com a segurança, a estabilidade da API e o suporte do NVIDIA AI Enterprise.
Inscreva-se para receber as últimas notícias, atualizações e muito mais da NVIDIA.
Em 2021, a AI2Labs se separou da Yoozoo Games como uma startup de tecnologia local em Cingapura. AI2Labs inova, experimenta e desenvolve produtos e aplicações de IA permitindo processos eficientes e melhorando a sustentabilidade e os resultados de negócios.
AI2Labs integrou Riva em sua API de reconhecimento de fala Speakr, IA para fala específica de domínio, para acomodar as complexidades da fala asiática e dos domínios de negócios e alcançou precisão de tradução de Singlish de última geração.
A Avaya é especializada em comunicações em nuvem e soluções de colaboração de workflows, fornecendo comunicações unificadas, contact center, plataforma de comunicações como serviço (CPaaS) e serviços com sua plataforma OneCloud.
A Avaya integrou o mecanismo de fala para texto NVIDIA Riva para legendas em tempo real em grande escala. Riva permite melhor qualidade de transcrição, menor taxa de erros de palavras e entrega econômica.
Por mais de 10 anos, o Grupo de IA Aplicada da C-DAC em Pune, Índia, concentrou-se na pesquisa e desenvolvimento de tecnologia de fala. Eles criaram com sucesso um sistema avançado de conversão de fala em texto (STT) para idiomas índicos, como hindi e marata. O grupo continua a avançar seu trabalho explorando frameworks, bibliotecas e ferramentas de deep learning de código aberto e habilitadas para IA para criar STT e aplicações habilitadas para fala para outras línguas índicas e de poucos recursos. Os experimentos foram conduzidos usando várias arquiteturas e topologias de rede neural do framework NeMo de código aberto da NVIDIA, com topologias de rede Citrinet e Conformer-CTC provando ser eficazes na construção e treinamento de modelos acústicos neurais para reconhecimento de fala. Esses modelos foram treinados em sistemas Param Siddhi AI de nó único e múltiplos, otimizando o tempo de treinamento e o desempenho. Finalmente, os modelos foram implantados para inferência em tempo real e em lote usando o pipeline de produção acelerado por GPU Riva.
A NCS, uma subsidiária do Singtel Group, é uma empresa líder em serviços de tecnologia com presença na Ásia-Pacífico e faz parceria com governos e empresas para promover comunidades através da tecnologia. Combinando a experiência e o conhecimento de sua equipe de 12.000 pessoas em 61 especializações, a NCS fornece serviços de tecnologia diferenciados e de ponta a ponta aos clientes com seus recursos NEXT em digital, dados, nuvem e plataformas, bem como ofertas principais em aplicações, infraestrutura, engenharia e cibersegurança. A NCS também acredita na construção de um forte
A NCS usa NVIDIA Riva TTS no Breeze, a aplicação complementar do motorista, para navegação guiada por voz, atualizações ao vivo sobre o trânsito e as condições das estradas, taxas de estacionamento em tempo real e tarifas eletrônicas de estradas e horários de operação, para ajudar os motoristas de Cingapura a ter viagens tranquilas.
breeze.com.sg/
www.ncs.co
História do Cliente
A RingCentral, fornecedora líder de soluções globais de comunicação empresarial em nuvem, colaboração e contact center, atende milhões de usuários. A plataforma RingCentral permite a colaboração a partir de qualquer local e dispositivo, melhorando a eficiência empresarial e a satisfação do cliente.
RingCentral usa NVIDIA Riva para transcrição de videoconferência para 200.000 usuários simultâneos em sua plataforma.
www.ringcentral.com
Sessão GTC
Snap é uma empresa de câmeras e mídia social que permite a criação de mensagens multimídia com filtros e efeitos. Para criar experiências mais interativas, os usuários do Snapchat brincam com o Lenses, um recurso que adiciona efeitos em tempo real aos instantâneos, mais de 6 bilhões de vezes por dia.
O serviço de IA para fala otimizado para ruído e linguagem do NVIDIA Riva está integrado ao Snap AR Lens Studio, permitindo que criadores (artistas e desenvolvedores) criem experiências emocionantes de realidade aumentada (AR).
A T-Mobile, uma operadora Un-carrier superimpulsionada, oferece uma rede 4G LTE avançada e uma rede 5G transformadora para a melhor experiência do cliente. Para capacitar os agentes do contact center, a T-Mobile implementa o Expert Assist. Este software baseado em IA usa NVIDIA Riva para transcrever conversas de clientes em tempo real que impulsionam recomendadores e auxiliam milhares de agentes.
Com o Riva, a T-Mobile ajusta modelos de reconhecimento automático de fala em conjuntos de dados personalizados e interpreta o jargão do cliente com precisão em ambientes barulhentos.
www.t-mobile.com
Responderemos às suas perguntas e ajudaremos com as necessidades da sua empresa.
Política de Privacidade da NVIDIA