Gigantes de la tecnología como Tesla y Google han hecho de los vehículos autónomos el tema del que tanto se habla entre los entusiastas de la tecnología. Varias empresas de todo el mundo están trabajando para desarrollar vehículos de conducción autónoma para diversos terrenos.
Para hacer que la tecnología de conducción autónoma conectada sea accesible, asequible y disponible para todos, Swaayatt Robots, con sede en Bhopal, se unió al tren. Sin embargo, con un inmenso conocimiento de toda la tecnología involucrada en Autonomous Robotics, el CEO de la empresa, el Sr. Sanjeev Sharma, dejó muchas empresas de tecnología atrás en la carrera. Desde 2009, ha estado investigando mucho y realizando cálculos matemáticos relacionados con la creación de soluciones inteligentes para automóviles autónomos.
Tuvimos la oportunidad de hablar con el Sr. Sanjeev y conocer cada parte de la tecnología detrás de los vehículos autónomos y la robótica en la que Swaayatt Robots está trabajando y sus planes futuros. Da un salto para leer toda la conversación que tuvimos con él. Alternativamente, también puede ver el video a continuación para escuchar la conversación entre nuestro editor y el propio Sanjeev
P. Hacer que la tecnología de conducción autónoma sea accesible y asequible para todos es la misión principal de Swaayatt Robots. ¿Cómo empezó el viaje?
He estado investigando en el área de la navegación autónoma durante los últimos 11 años. En 2009, me inspiré en los Grandes Desafíos de DARPAeso sucedió en los Estados Unidos. La conducción autónoma se convirtió en mi objetivo durante esos años. Durante muchos años, seguí investigando e hice autoestudios específicamente sobre planificación de movimientos y toma de decisiones en situaciones de incertidumbre. La atención se centró en hacer un uso óptimo del aprendizaje automático, el aprendizaje por refuerzo y diversas técnicas. Comencé Swaayatt Robots en 2014, pero no se trataba simplemente de aplicar la investigación y los estudios que había realizado durante los últimos años. Aplicando algunas ideas en movimiento y toma de decisiones, tuve que resolver también el problema de planificación y localización de la percepción. Tenía experiencia en investigación solo en el área de toma de decisiones y planificación de movimientos. Pero las áreas de percepción y localización eran bastante nuevas para mí. Mi tremenda formación matemática me ayudó mucho.
Una vez que comencé a desarrollar los marcos algorítmicos para permitir la conducción autónoma alrededor de 2015, me di cuenta de que esto puede ser algo muy grande y que realmente podemos resolver el problema de la conducción autónoma en escenarios de tráfico de adversarios muy estocásticos. Y desde 2014, trabajo a tiempo completo en esta startup. Mi investigación en particular cubre varias ramas pero, en particular, la mayor parte del enfoque de nuestra empresa es desarrollar algoritmos de planificación de movimiento y toma de decisiones que permitan a los vehículos autónomos lidiar con niveles muy altos de estocasticidad en la dinámica del tráfico. Eso equivale aproximadamente al 65% al 70% de la investigación que se realiza en Swaayatt Robots. Alrededor del 25% al 27% de la investigación se dirige al área de percepción, que abarca todo tipo de algoritmos que procesan los datos de los sensores de un sistema robótico vehicular.y construir una representación en 3D del mundo que lo rodea.
En percepción, somos una de las pocas empresas del mundo que puede permitir que los vehículos autónomos perciban el entorno utilizando solo cámaras estándar que funcionan durante el día y la noche. Así es aproximadamente como ha sido el viaje hasta ahora.
P. Comenzó en 2014 para validar sus ideas y luego tomó el camino por completo en 2015. Entonces, ¿qué debemos hacer en este año? ¿Cómo probó que se puede conducir sin conductor en la India?
La conducción autónoma es la combinación de tres canales algorítmicos juntos, a saber. percepción, planificación y localización. Los algoritmos toman los datos sensoriales, los procesan y construyen una representación en 3D alrededor de un vehículo. Los llamamos algoritmos de percepción. Los algoritmos de localización intentan determinar con precisión global la posición del vehículo en la carretera. Así es como solían trabajar los robots en entornos académicos. En 2009, este modelo de conducción autónoma fue pionero en Google. Antes de que un vehículo autónomo navegue por una determinada carretera, toda la carretera debe mapearse con gran detalle en 3D. A estos mapas los llamamos mapas de alta fidelidad. Estos mapas de alta fidelidad almacenan información muy importante sobre el medio ambiente. Por lo general, almacenan todos los diferentes tipos de delimitadores en el entorno.
Antes de que el vehículo autónomo navegue en un entorno, todo el entorno se mapea de manera muy precisa. Todos los marcadores de carril, los límites de las carreteras y cualquier tipo de delimitador del entorno se almacenan en este tipo de mapas de alta fidelidad.
Cuando el vehículo navega a través de un entorno para el que ya tiene mapas de alta fidelidad, vuelve a capturar los datos de varios sensores en el vehículo e intenta hacer coincidir los datos con un mapa de referencia que ha creado. Este proceso de emparejamiento le proporciona un vector de pose que le indica dónde está el vehículo en el planeta tierra y cuál es la configuración del vehículo. Una vez que conozca la posición y la configuración del vehículo en la carretera, toda la información que tenía almacenada en los mapas de alta fidelidad se proyecta sobre la configuración actual del vehículo. Cuando proyecta esta información, como marcadores viales, marcadores de carril y cualquier tipo de delimitador de camino o delimitador de entorno; el vehículo autónomo sabe dónde está ahora con respecto a un delimitador en particular o desde un marcador de carril en particular. Entonces,esto es lo que hacen los algoritmos de localización.
El área final de la conducción autónoma es la planificación y la toma de decisiones. Cuanto más sofisticados y mejores sean los algoritmos de planificación y toma de decisiones que tenga, más capaz será su vehículo autónomo. Por ejemplo, los algoritmos de planificación y toma de decisiones diferenciarán a las empresas de estar en el nivel dos, el nivel tres, el nivel cuatro y el nivel cinco de autonomía. Cualquier algoritmo responsable de la toma de decisiones o la planificación del movimiento y comportamiento del vehículo es un algoritmo de planificación.
Cuanto más sofisticado tenga en los algoritmos de planificación, mejor será su vehículo. Varios planificadores de movimiento y tomadores de decisiones ayudan a evaluar la seguridad del vehículo y el medio ambiente, la velocidad a la que está navegando, el entorno del vehículo y todos los parámetros que puede calcular de su entorno. Esto es lo que hacen los algoritmos de planificación.
He estado investigando en el área de planificación. Si tiene el tipo de algoritmos que pueden lidiar con la estocasticidad en la dinámica del tráfico en la India. Si puede lidiar con eso y si tiene algoritmos, entonces ha demostrado que si puede construir una pila de percepción y localización, tiene una tecnología de conducción autónoma completa.
No es necesario desarrollar todos los algoritmos diferentes para verificar qué funciona mejor. Solo necesita crear tres o cuatro algoritmos diferentes que sepa que van a resolver el problema clave de la conducción autónoma. La seguridad es el problema principal por el que no ve vehículos comerciales autónomos en la carretera. El costo y todos los demás problemas son secundarios. Podría haber construido toda la puesta en marcha con solo uno o dos algoritmos, como el aspecto de localización y mapeo de la conducción autónoma. Pero mi objetivo era desarrollar un vehículo autónomo en toda regla y no uno o dos algoritmos aquí y allá. Haber probado el aspecto clave en el área de planificación y toma de decisiones me dio la confianza para abordar todo el problema de la conducción autónoma en general.
P. ¿En qué nivel de conducción autónoma está trabajando Swaayatt Robots? ¿Y qué nivel crees que es posible en India?
Nuestro objetivo es alcanzar el nivel 5 de autonomía y garantizar que la tecnología sea segura en este tipo de entornos. Estamos en algún lugar entre el nivel tres y el nivel cuatro. Algunas de las investigaciones algorítmicas que estamos haciendo son la planificación en movimiento y la toma de decisiones que están dirigidas al nivel cinco.
También estamos trabajando para permitir que los vehículos autónomos puedan cruzar la intersección en las horas pico de tráfico sin los semáforos. Nuestro objetivo es lograr una autonomía de nivel cinco al permitir que los vehículos autónomos se enfrenten a espacios reducidos con tráfico altamente estocástico. Hemos realizado la conducción autónoma en un entorno muy estrecho cuando un vehículo o una bicicleta también venían del extremo opuesto. A nivel POC, hemos alcanzado entre tres y cuatro niveles. Ya hemos convertido los POC en el nivel cuatro de autonomía al realizar experimentos en tráfico altamente estocástico con espacios reducidos. Nuestro objetivo actual es lograr una conducción autónoma de 101 kilómetros por hora en las carreteras de la India.
Una vez que haya demostrado la seguridad del vehículo en este tipo de entornos, puede tomar su tecnología y aplicarla en cualquier otro lugar, como en América del Norte y Europa, donde el tráfico está mucho más estructurado, donde los entornos también son mucho más estrictos en comparación con la India. Ambientes. Entonces, la India a partir de ahora es un campo de pruebas para que demostremos que tenemos algo que nadie más ha hecho en este momento.
P. ¿Cuánto ha progresado Swaayatt Robots en el desarrollo de una solución de conducción autónoma? ¿En qué nivel de conducción estás trabajando actualmente?
Actualmente, tenemos el algoritmo de planificación de movimiento más rápido del mundo que puede planificar trayectorias con parámetros de tiempo casi óptimas para un vehículo autónomo en 500 microsegundos. Entonces, el algoritmo funciona aproximadamente a 2000 hercios. Contamos con la tecnología para permitir una conducción autónoma de hasta 80 kilómetros por hora en las carreteras de la India. Lograr ese tipo de velocidad en las carreteras de la India es un gran desafío. Normalmente, si puede hacerlo, también puede llevarlo a otro lugar. Puedes aplicarlo en tráfico extranjero y básicamente estás muy cerca del nivel cuatro. Para darle una idea, hemos estado trabajando en lo que llamamos análisis y negociación de intenciones de múltiples agentes. Este marco permite que nuestro vehículo no solo calcule la probabilidad de las intenciones de otros vehículos o agentes en la carretera.Puede calcular las probabilidades de todo el conjunto de rutas que otros agentes, vehículos u obstáculos del entorno no pueden. Sin embargo, esta capacidad por sí sola no es suficiente. Por ejemplo, puede construir un sistema computacionalmente exigente que pueda predecir las trayectorias de movimiento futuras y quizás calcular las probabilidades de todos los conjuntos de rutas de diferentes vehículos. Aquí es donde debe concentrarse, es decir, también en los requisitos computacionales. La demanda computacional en este problema de análisis y negociaciones de intenciones de múltiples agentes crecerá exponencialmente si no ha realizado ninguna investigación, no ha utilizado las matemáticas correctamente o si no las ha diseñado correctamente. Estoy investigando algunos de los conceptos de las matemáticas aplicadas, específicamente en el área de la teoría topológica. Estoy usando algunos de los conceptos como mapas de homotopía,que permiten a nuestra tecnología escalar los cálculos. Al menos a partir de ahora, es superlineal en términos de la cantidad de agentes en contraposición a la explosión exponencial que encontraría si no hubiera resuelto correctamente las matemáticas detrás de los algoritmos.
El marco de negociación de análisis de intención de múltiples agentes se subdivide en dos ramas diferentes en las que estamos trabajando actualmente. Uno es el TSN (Tight Space Negotiator Framework) y el otro es el modelo de adelantamiento. TSN permite a los vehículos autónomos sortear tanto los entornos estrechos como el tráfico estocástico, tanto a baja como a alta velocidad. Por lo tanto, la alta velocidad sería muy útil para escenarios de tráfico estocástico abarrotado de carreteras y la baja velocidad sería muy útil cuando el vehículo está navegando en un escenario urbano, donde a menudo se encuentran las calles más estrechas con demasiado tráfico y ruido en el tráfico, lo que significa que hay Hay demasiada incertidumbre en la dinámica del tráfico.
Ya hemos estado trabajando en esto durante los últimos dos años y medio, y ya lo hemos desarrollado en forma de POC. Algunos de los fragmentos de estos marcos de los que estoy hablando podrían mostrarse en la demostración de nuestro próximo experimento, que tendrá como objetivo lograr 101 kilómetros por hora de funcionamiento en las carreteras de la India.
Además, también hemos estado investigando en diferentes ramas de la IA. Usamos mucho el aprendizaje de aprendizaje, el aprendizaje por refuerzo inverso. Por lo tanto, actualmente estamos trabajando para permitir a los vehículos autónomos adelantar en las carreteras típicas de dos carriles, como lo hacen los conductores indios. Estamos probando tanto en simulación como en el mundo real en la mayor medida posible con una financiación limitada. Estas son algunas de las áreas de investigación que ya hemos probado sobre el terreno, y algunas de ellas se probarán en los próximos meses.
Aparte de eso, somos una de las únicas empresas del mundo que pueden permitir la conducción autónoma en entornos completamente desconocidos e invisibles para los que no existen mapas de alta fidelidad. Podemos habilitar la conducción autónoma sin el uso de mapas de alta fidelidad. Estamos en el negocio de erradicar por completo la necesidad de mapas de alta fidelidad y esta erradicación es posible gracias a dos de nuestras tecnologías clave. Nuestro marco TSN está diseñado para establecer un nuevo punto de referencia regulatorio.
P. Hablando de la arquitectura de hardware, ¿qué tipo de hardware utiliza para su propósito computacional? Además, ¿qué tipo de sensores y cámaras utiliza para mapear el mundo real en sus vehículos autónomos?
A partir de ahora, solo usamos cámaras estándar. Si ve nuestra demostración de un vehículo autónomo, notará que no usamos más que una cámara de 3000 Rs. Si observa la investigación de percepción que se está realizando en todo el mundo con las empresas autónomas o las empresas de robótica, están utilizando los tres sensores diferentes, como cámaras, LiDAR y radares. Actualmente, todos nuestros experimentos de conducción autónoma se han realizado solo con cámaras. Cuando comencé la empresa, solo tenía experiencia en planificación, pero desde 2016, me di cuenta de que los artículos de investigación de vanguardia en los que estén trabajando los laboratorios de todo el mundo; simplemente no funciona en el mundo real. Si funcionan, son demasiado intensivos en computación y simplemente no funcionan. Entonces,También tomé la percepción como mi área de investigación principal y dediqué entre el 25% y el 27% de mi tiempo a la investigación de la percepción. Ahora, el objetivo de la investigación de nuestra empresa es permitir que los vehículos autónomos puedan percibir utilizando solo las cámaras sin necesidad de LiDAR ni radares. Esta es una ambición de investigación que queremos lograr. Al lograr eso, también nos hemos asegurado de tener el algoritmo más rápido del mundo para cualquier tarea común.
Tenemos dos metas en percepción. Uno, el algoritmo debería ser tan capaz que permita a los vehículos autónomos percibir usando solo cámaras tanto de día como de noche. Hemos ampliado esta capacidad de percepción no solo durante el día, sino también por la noche usando nada más que los faros del vehículo y cámaras RGB y NIR estándar disponibles en el mercado, el tipo de cámaras que puede comprar por 3000 Rs en el mercado. mercado.
Nos enfocamos