Por qué Tesla va por delante en la carrera por el coche autónomo

No, este no es otro aburrido artículo lleno de tecnicismos y vaguedades. Aquí explico de qué va eso del machine learning de modo que, cuando termines de leerlo, seas capaz de explicarle a tu abuela cómo estamos enseñando a los coches a conducir solos. Bueno, igual no, pero andará cerca la cosa.

Lo primero que debes tener claro es cuáles son y en qué consisten las distintas formas de enseñar cosas a las máquinas. De eso va la parte uno. Una vez sepas eso, entender los varios retos que nos separan de construir robotaxis será pan comido. Esa es la verdadera gallina de los huevos de oro:

El optimismo de ARK es controvertido, pero sirve para que te hagas una idea de por qué uso "coche autónomo" y "robotaxi" como sinónimos. Sí, trillions con T. Casi 10 veces el PIB español en 2030. UBS y McKinsey lo ponen en 2 y 5, respectivamente. Fuente: ARK.

El punto dos te ayudará a formarte una opinión propia sobre la estrategia de Tesla y otras compañías al respecto. Como en el primero, intentaré ser lo más imparcial posible, pero soy fan de Musk y tengo acciones suyas. Quien avisa no es traidor, la verdad por delante.

Además, explico varias ideas de Trent Eady, un analista especializado en el tema. A mí me daría mil vueltas aunque fuese un experto en conducción autónoma, cosa que no soy: esto es un resumen amateur. Vale la pena comprobarlo ahora mismo y seguir leyendo luego. En serio, id.

Uno: Cómo enseñar a conducir a un robot

Grosso modo, nuestro robotaxi debe poder (1) entender su entorno, (2) predecir al resto de conductores y (3) conducir en general (frenar, acelerar, girar, etc.). Hay varias formas de enseñarle a hacer esto; todas en inglés. Aquí explico las dos más importantes. Empieza pensando en el ajedrez.

Imitation learning: pues eso, imitar a los humanos. Como la única regla a seguir es copiar nuestra forma de jugar, al robot no le hace falta deducir las normas: con copiar a los mejores ya nos machaca. Sin embargo, le costará llegar a un nivel sobrehumano (problemilla) y ser creativo (problemón).

Reinforcement learning: prueba y error. Si fallas, palo; si aciertas, zanahoria. Como a R2D2 le gustan las zanahorias y odia los palos, tenderá a buscar aquéllas y huir de éstos. Deducirá las reglas, inventando su propia forma de jugar por el camino. Tendrá más fácil ser sobrehumano, pero seguirá sin saber improvisar ante una situación inesperada.

Bien, ya tienes las dos herramientas conceptuales básicas para enseñar a tu robot juegos simples y con normas fijas. Vayamos con las dos grandes particularidades que impiden meter a los robotaxis en tal categoría.

Problema 1: complejidad. Conducir no es tan simple como un juego de mesa. Videojuegos como StarCraft ilustran mejor cómo la fuerza bruta se pierde si hay demasiadas opciones: usa trabajadores para minar recursos con los que construir los edificios que los entrenan para ser soldados. El ajedrez tiene cientos de posibles movimientos por turno. El Go, cientos de miles. StarCraft, 100 cuatrillones. Para, coge un papel y escribe 26 ceros.

Solución: enfoque mixto. Prueba y error partiendo del nivel humano. Bastante de cajón: ¿empezar sin ningún criterio o al nivel de Kaspárov? Construir sobre lo aprendido por humanos acota increíblemente el reto de superarlos: evita partir de cero, disparar -literalmente- a voleo, permitiendo que nos centremos en mejorar lo que ya sabemos hacer.

Cuesta exagerar el brutal reto que ha supuesto StarCraft. Más allá de los posibles movimientos, sufre información imperfecta (sin exploradores, no ves a los demás actores), gran horizonte temporal (al conducir es cosa de segundos, pero aquí todo tiene consecuencias a largo plazo) o causalidad difusa (¿cuáles de las miles de decisiones tomadas tienen el mérito (o la culpa) de ganar o perder?).

Problema 2: extrapolación. Nuestra solución mixta no improvisa, sólo repite lo que le funcionó en situaciones parecidas, así que requerirá mucha práctica para dominar la curva de situaciones posibles. El 99% de casos habituales es pan comido, el quid son las colas largas, el 1%, lo que pasa una vez por millón kilómetros. Un incendio, un centauro, cosas raras.

Solución: Big Data. Cuanto más practiques, menos situaciones inesperadas podrán sorprender a tu robotaxi. Dominar Dota, otro videojuego del estilo, llevo a OpenAI 675 millones de partidas. Google necesitó dos mil millones con StarCraft. 45.000 y 60.000 años de juego, respectivamente. Sin pausa alguna: 24 horas al día, 7 días por semana.

Centro izquierda: un coche carga una bici. ¿Cómo enseñar al robotaxi que, a diferencia de todas las que ha visto hasta ahora, esa bici no va a moverse de ahí? Con más ejemplos como este. Como es poco común, necesitará millones de km para tener bastantes ejemplos. Más datos son menos sorpresas.

El mundo digital acelera mucho el proceso: un mismo programa puede practicar entrenando en varios ordenadores a la vez (Google utilizó hasta 300). Pero conducir es cosa del mundo real. Y no queremos pasar decenas de miles de años entrenando a nuestro robot conductor, ¿verdad?

No me malinterpretes: lo digital puede echar un cable. Entrenamos a los robots en simulaciones antes de lanzarlos a la carretera (los experimentos, con gaseosa). Útil para dominar el centro de la curva, no las colas largas. De poder simular todas las situaciones posibles seríamos un Demiurgo. Luego... ¿cómo poner en práctica nuestras soluciones sin ser Dios?

Dos: La moto que vende Elon Musk

Todo el mundo cree en el enfoque mixto y en perfeccionarlo con Big Data. No se debate el qué, sino el cómo. Vayamos ahora con el plan, el cómo, de Tesla; ya decidirás luego si crees que venden crecepelo o penicilina. Aquí también tenemos un montón de anglicismos extraños y a ti vuelven a interesarte sólo dos. A saber: mente enjambre y modo sombra.

Sobra decir que, de ser la conducción autónoma puro humo -y puede serlo- o algo muy lejano, tendrán que conformarse con sus coches, baterías y paneles solares. Pero, si hubiera una pizca de acierto en sus ambiciones, Elon Musk lideraría una de las mayores disrupciones de la historia. Y forrándose, que nunca está de más. Por mal que te caiga, sonar, suena bien.

Otra fuente de eterna controversia es el encaje legal que tendría algo así (no solamente por cuestiones éticas, vista la violencia contra Uber de esa mafia gremial que es el taxi). Pero esto va de tecnología: veníamos a explicar cómo funciona la bombilla, no qué opina la vela. Vamos al grano.

Cómo recoger datos: compra un coche, ponle sensores y contrata a dos informáticos que lo vigilen mientras conduce. Suena caro, ¿eh? Lo es. Por eso Google sólo tiene 600. Pero Tesla se lo ahorra: el cliente paga coche y sensores y no cobra por horas. Por eso es la única con datos suficientes para resolver el 1%: tiene 643.095 coches. 27.000 años de conducción 24/7 cada 12 meses. Y suma 100.000 coches por trimestre.

Tesla Autopilot Estimated Miles 1024x570

Tesla vende cada vez más coches. En los últimos 3 meses, casi tantos como en 2017. En 2019 podría casi duplicar su flota, para hacerlo de nuevo en 2020. Fuente: MIT - Lex Fridman.

Qué datos recoger: hay debate. Tesla cree que cámaras, radares y ultrasonidos bastan. Casi todos los demás creen que esos tres necesitan la redundancia de un láser (LiDAR). Sea así o no, su prohibitivo precio actual hace imposible ponerlo en coches de particulares, relegándolo a flotas como la de Google... Demasiado pequeñas para lidiar con el 1%.

Combinarlos ya abarca lo que LiDAR y más (luces, colores, gestos faciales). No es que Tesla les dé más importancia que el resto, sino que nadie más tiene una flota lo bastante grande para entrenar esos sensores con Big Data.

Como combinar otros sensores ya cubre todos los frentes, se duda que LiDAR sea necesario. Tesla quiere dominar el resto de retos sin él. Si termina resultando crucial, sólo les quedaría añadirlo cuando tenga un tamaño y precio adecuados para instalarlo en masa. La idea, claro, es que para entonces los demás seguirán estancados por la falta de datos inherente a las flotas pequeñas. Fuente: UnitedLex.

Cómo aplicar la solución mixta. Modo sombra: un Tesla contrasta cada decisión del conductor con la que habría tomado el piloto automático. Cada diferencia se analiza como posible error (puede no serlo, al fin y al cabo, el objetivo no es la mera imitación, sino llegar a ser sobrehumano); cada segundo sin ella computa como acierto. He ahí la preciada prueba y error partiendo de la experiencia humana. Ahora súmale esteroides: su flota se actualiza subiendo a la nube lo vivido por cada coche, una mente enjambre que aprende del mundo físico a ritmo digital.

Entrenar a cada robotaxi durante miles de millones de kilómetros es demasiado caro, pero Tesla es una colmena: todo coche aprende de los demás en la nube. Ante un caso raro, piden ayuda al enjambre: '¡mandadme más imágenes como esta!'. Inmediatamente, la colmena entera asume que esas bicis no eran vehículos en movimiento, sino parte del coche. Así conquistan el 1%: poco a poco, caso a caso.

Empezábamos con tres retos: "ver", anticiparse al resto de vehículos y conducir. Con el machine learning actual, dependen del Big Data por los problemas de la complejidad y de la extrapolación. En ese terreno de juego, por cada caso que sólo ocurre cada 10 millones de millas, Tesla tiene 650 ejemplos. Google sólo tiene 1 (y, en casos más raros, ninguno).

Ese es el argumento de Tesla: somos los únicos con los ingredientes de la receta existente. Todos los demás necesitan inventar una receta nueva, un machine learning capaz de funcionar con datos escasos. Una revolución así afectaría a todos los sectores de la economía. No es imposible, y si tuviera que apostar por alguien para liderarla sería Google (que ya se ha resignado a poner manos a la obra), pero vaya hándicap.

En román paladino: todos menos Tesla andan faltos de datos, con o sin LiDAR (aun ahorrándoselo seguirían sin poder pagarse una flota decente). Es decir, tienen que reinventar la rueda. Los que no son Google, además, tienen el reto extra de, bueno, no ser Google; menos talento y recursos.

Todo se entiende mejor con memes.

¿Hay Plan B? Sí, usar ayuda humana: machine learning híbrido (27:00). El ojo humano puede distinguir objetos y patrones con un solo ejemplo, pero supone tal cuello de botella que impide aprender a ritmo digital. Además, mientras haya situaciones que aún no has visto ni una mísera vez, a lo mejor puedes gatear sin Big Data, pero no llegar a la meta.

Ni siquiera Google es optimista al respecto: creen que con su alternativa quedan años para tener vehículos autónomos a gran escala (59:00). En el minuto 50:00 profundiza en cómo el 1% se vuelve aún más infranqueable a gran escala. Este hilo de Trent resume sus problemas con las colas largas.

Por su parte, Wall Street hace oídos sordos a la complejidad del sector. Mientras el CEO de Waymo, la división que Google está dedicando al tema, cree que jamás podrá automatizarse por completo la conducción, se ha valorado su tecnología en 175.000 y hasta 250.000 millones de dólares (!). Toda Tesla, incluyendo coches, baterías y paneles, se valora hoy en 42.000. Aquí expliqué por qué vale mucho más, pero miremos al resto de actores:

Primero hay las startups que no aspiran a crear un coche autónomo, sino a mejorar una tecnología concreta para vendérsela a alguien. Sus valoraciones no son moco de pavo, sin embargo: 15.000 millones por Mobileye (cámaras) o 29.000 por NavInfo (mapas), por ejemplo.

Para las plataformas de movilidad, esto es cosa de vida o muerte. SoftBank ha comprado todas (en serio, todas) y quiere a Uber de líder. Problema: miles de conductores no son miles de robotaxis con sensores. De esos sólo tienen 250, y ni ahorrándose LiDAR podrían comprar más. Por 7.000 millones te venden su división autónoma, que necesitan cash.

Finalmente, GM parece el único candidato serio del sector automotriz. Problema: Detroit no puede competir en software con Silicon Valley. Vende 40 veces más coches que Tesla, pero no les pone sensor alguno. Su estrategia es idéntica a la de Googl...Uber, pero con 130 coches. Tal cual. Esta monada de proyecto se valora en 19.000 millones de dólares.

Su modelo de negocio no permite instalar tal oneroso hardware, y van tremendamente retrasados en tecnología, dependen demasiado de sus proveedores y son incapaces de integrar hardware y software. En consecuencia, Tesla sienta el listón de la conducción autónoma para masas.

Pierre Ferragu, analista de New Street

Resumiendo: no sabemos qué caminos llevan a la conducción autónoma. Sumar Big Data al enfoque mixto funcionó con otros retos parecidos, y Tesla es la única con ejemplos bastantes para aplicarlo aquí, pero todo depende de cuál es el número de situaciones fundamentalmente nuevas. Si resulta haber un 10% de casos raros y no un 1%, la cosa se eterniza.

Tal incertidumbre se plasma en que todos, incluida Tesla, llevan años retrasando sus metas. Pero cabe destacar que el resto aún no sabe cómo solucionar su falta de datos, desventaja estructural que el mercado ignora. Pone al resto por las nubes mientras parece dar valor cero a su división. Hasta Morgan Stanley o UBS, grandes Tesla-escépticos, lo han denunciado.

Ni siquiera sabemos si es imposible o no automatizar la conducción, vaya. Pero los próximos 12 meses pintan bien: si Tesla está en lo cierto, su ventaja debería hacerse exponencial; si no, tocará repensar su estrategia. Eso no significa que en 2020 habrá robotaxis, claro. Hay tareas pendientes.

En cualquier caso, vista la dificultad de igualar siquiera el actual asistente de conducción de Tesla, la conducción semi-autónoma ya es un foso defensivo creciente frente a competidores como BMW o Audi. Ese es el tipo de ventajas competitivas que buscan los buenos inversores.

Y tú, ¿apostarías por datos y fuerza bruta o por que Google creará antes una receta nueva? ¡Déjanoslo aquí debajo! La información es poder, Cersei.

Imagen | Bilder fra Stortinget

Fecha: 27-08-19
Categoría: Motor

Leer Más Todas las noticias