Oleg | |
---|---|
Tipo de | asistente virtual |
Desarrollador | "Tinkoff" |
Escrito en | Pitón |
Sistema operativo | iOS, Android |
Sitio web | oleg.tinkoff.ru |
Oleg es un asistente de voz virtual en el campo de los servicios financieros y de estilo de vida desarrollado por el grupo Tinkoff . Funciona en la aplicación móvil Tinkoff. Puedes comunicarte con él usando tu voz o usando un teclado móvil. Para iniciar el asistente de voz, debe decir: "Hola, Oleg" o "Escucha, Oleg" [1] .
El asistente de voz puede transferir dinero, reservar mesas en restaurantes, comprar boletos de cine, buscar descuentos en bienes y servicios y brindar asesoramiento financiero [2] [3] [4] . Se integra en varios servicios del grupo Tinkoff. El asistente de voz puede registrar un evento asegurado para propietarios de pólizas de seguro de casco y OSAGO de Tinkoff Insurance o actuar como un conserje de voz personal en Tinkoff Mobile: recibir llamadas, traducirlas a texto, hablar con un interlocutor o bromear [5] .
El objetivo de un asistente de voz es ahorrar tiempo y dinero a una persona [6] .
El periódico Vedomosti informó en diciembre de 2018 que Tinkoff desarrolló un asistente de voz llamado Oleg, en referencia al discurso del fundador y presidente de la junta directiva de Tinkoff, Oleg Tinkov, en la fiesta corporativa de Año Nuevo de la compañía [7] . El asistente comenzó a trabajar en junio de 2019. Para los clientes, aparece por etapas. En el momento del lanzamiento, podría compartirse con otro usuario transfiriendo dinero usándolo en una aplicación móvil. En el momento del lanzamiento de Oleg, las grandes empresas de tecnología ya tenían asistentes de voz en el mercado: Siri de Apple , Google Assistant , Alexa de Amazon , Alice de Yandex . Mail.ru Group [8] trabajó en su asistente virtual .
"Oleg" es el homónimo del fundador de "Tinkoff" Oleg Tinkov . El nombre fue elegido entre varias opciones por votación general entre los empleados de Tinkoff. Otras opciones incluían a Leo, Max, Watson.
El prototipo de "Oleg" es un hombre de 25 a 40 años. Es educado, no le gusta la familiaridad y, si es necesario, puede ser persistente. Tiene sentido del humor y no le enseña la vida al usuario hasta que lo pide, explica la compañía. En situaciones irracionales, puede expresar desacuerdo o incluso desaprobación [9] . Los desarrolladores querían que fuera interesante comunicarse con Oleg. [diez]
En el momento del lanzamiento, los usuarios notaron la naturaleza caprichosa de "Oleg" y su estilo de comunicación no trivial. En las primeras etapas de uso, hubo casos en que "Oleg" usó expresiones groseras [11] . Sus bromas y respuestas no triviales han sido ampliamente discutidas en las redes sociales y en los medios. La compañía explicó esto diciendo que el asistente aprende de los datos abiertos.
En noviembre de 2019, la broma de Oleg volvió a ser tema de amplia discusión en los medios y redes sociales: aconsejó a uno de los clientes que se “cortara los dedos” en respuesta a una denuncia de que el banco no aceptaba la identificación con huella dactilar. La empresa informó que había hecho un trabajo explicativo con el asistente de voz y prometió no volver a hacerlo [12] . Oleg fue expresado por el actor Nikita Prozorovsky , quien registró 30 horas de réplicas, sobre la base de las cuales se sintetizan todas las declaraciones del asistente [13] .
El asistente de voz consta de varios componentes principales: tecnología de reconocimiento y síntesis de voz, así como un motor basado en una red neuronal entrenada en datos abiertos de comunicación de usuario en Runet.
El asistente de voz puede reconocer e interpretar las solicitudes de los usuarios, hacer preguntas aclaratorias y hablar sobre diversos temas.
Oleg puede realizar las siguientes funciones:
Oleg está integrado en el servicio Tinkoff Mobile. Como parte del servicio, puede responder llamadas a suscriptores de Tinkoff Mobile si están ocupados o desconectados. Si el suscriptor no quiere responder, puede restablecer la llamada; Oleg responderá por él. El asistente traducirá el mensaje de audio de la persona que llama a texto y lo enviará al suscriptor a través de SMS [14] .
El asistente de voz también puede registrar el hecho de un evento asegurado para los clientes de Tinkoff Insurance. Para ello, hará varias preguntas: cuándo, a qué hora y dónde ocurrió el accidente, si el cliente necesita asistencia médica, si hay víctimas del accidente, quién es el responsable de la colisión. También lo guiará sobre cómo tomar correctamente una foto del daño del automóvil y qué documentos debe cargar en el chat. En las próximas versiones del servicio, podrá asesorar al cliente sobre el estado del evento asegurado y emitir una referencia para un examen o reparación del automóvil en una estación técnica [15] .
Oleg se integrará en otros servicios del ecosistema Tinkoff , como Tinkoff Investments, Tinkoff Travel, etc. [16]
En el momento de una solicitud de voz, el sistema de reconocimiento de voz convierte la señal de audio en texto. Esto sucede en varias etapas. Primero, la señal se filtra, luego se digitaliza, se analiza la señal y se identifican los patrones de datos [17] . El asistente de voz se basa en la tecnología de síntesis y reconocimiento de voz Tinkoff VoiceKit, que ha sido desarrollada por Tinkoff Group desde 2016. Durante su desarrollo se utilizaron más de 15 mil horas de audio de fuentes libres y decenas de miles de horas de llamadas de call center. La tecnología identifica correctamente hasta el 95 % de las palabras habladas y utiliza terabytes de datos y decenas de miles de horas de habla humana para entrenar. Puede entender tanto el habla ruidosa como el habla clara recibida de fuentes de alta calidad. La tecnología se puede utilizar para crear asistentes de voz, robots de software para automatizar el trabajo de un centro de llamadas, grabar libros de audio y voces en off para videos, traducir grabaciones de audio de hablar en público a formato de texto [18] .
En 2019, Tinkoff comenzó a vender la tecnología Tinkoff VoiceKit a otras empresas. Para las instituciones educativas y los estudiantes, la tecnología se proporciona de forma gratuita. Para las empresas comerciales, la tarifa es de 40-45 kopeks por reconocer un minuto de audio de dos canales [19] [20] . La tecnología para uso externo solo está disponible como API .
La síntesis de voz, que se utiliza en el asistente de voz, se desarrolló sobre la base de los modelos de redes neuronales WaveNet, Tacotron y Deep Voice. Todo el trabajo en la creación de la síntesis de voz llevó alrededor de nueve meses, pero esto requirió el conocimiento y la experiencia acumulada por los especialistas de la empresa durante dos años [21] .
Para entrenar al asistente de voz, Tinkoff utiliza la supercomputadora Kolmogorov , llamada así por el matemático ruso Andrey Kolmogorov . La supercomputadora consta de 10 servidores de cómputo y dos para almacenamiento de datos. Todo el sistema se coloca en una nueva habitación alquilada. Con su ayuda, el equipo de desarrollo entrena modelos de redes neuronales recopilados durante 14 años de trabajo de la empresa para reconocimiento de voz, síntesis de voz, procesamiento de lenguaje natural y comunicación sobre temas libres. El rendimiento máximo de la máquina es de 0,65 petaflops, el alcanzado es de 0,42 petaflops. Se encuentra entre las diez computadoras más productivas en el ranking de supercomputadoras rusas elaborado por la Universidad Estatal de Moscú y la Academia Rusa de Ciencias. La empresa gastó alrededor de $ 1 millón en hardware informático [22] [23] .
Con la ayuda de una supercomputadora, la compañía planea desarrollar no solo un asistente de voz, sino también análisis predictivo (predicción del comportamiento del cliente). En particular, la supercomputadora se usa para volver a entrenar un modelo que calcula la probabilidad de vender servicios de Tinkoff. A capacidades estándar, este proceso puede llevar desde seis meses, en una supercomputadora, varios días [24] .