Episode Transcript
Available transcripts are automatically generated. Complete accuracy is not guaranteed.
(00:03):
.1739130435Bienvenidos nuevamente a teo sapiens, Y hoy, Jorge, tenemos algo muy interesante.
2
00:00:07,556.5217391304 --> 00:00:14,582.691122342
Google creó una inteligencia artificial que en muchos ámbitos o escenarios, podría estar superando a lo que son los motores de videojuegos.
3
00:00:14,582.691122342 --> 00:00:21,455.009962921
Jorge Esto me hace preguntar si estamos a punto de crear una matrix o es puro high de silicon Valley, hoy vamos a estar hablando de Ginny.
4
00:00:21,481.096919443 --> 00:00:25,315.879528139
Tres, tal es un poco aparcado por el famoso gt v.
5
00:00:25,889.792571617 --> 00:00:28,289.792571617
Pero la verdad es que es un tema sumamente importante.
6
00:00:28,289.792571617 --> 00:00:31,898.488223791
Todo este tema de los modelos del mundo, Y por entrar de materia Jorge.
7
00:00:32,485.44474553 --> 00:00:33,868.053441182
Es un modelo del mundo.
8
00:00:34,102.836049878 --> 00:00:39,555.009962921
Por qué se está hablando tanto de esto? Porque los científicos de ella están muy emocionados de lo que acaban de ver.
9
00:00:40,50.662136834 --> 00:00:43,268.053441182
Tú que estás más metido en lo técnico, explícame un poco que es un modelo del mundo.
10
00:00:44,211.559502324 --> 00:00:45,124.602980584
Si efectivamente fer.
11
00:00:45,176.776893628 --> 00:00:46,533.298632758
Yo en lo particular.
12
00:00:46,533.298632758 --> 00:00:52,386.342111019
Está muy, muy impresionado y muy emocionado incluso más que que el reciente lanzamiento de jefe v.
13
00:00:52,386.342111019 --> 00:00:57,812.429067541
Y no porque esto si está es un hito importante, no que de mind avanzado no el modelo.
14
00:00:57,812.429067541 --> 00:01:06,395.037763193
El mundo es básicamente un modelo inteligencia artificial que entiende como funciona el mundo real en cuanto a lo a como se ve.
15
00:01:06,812.429067541 --> 00:01:19,699.38558928
Encuentra la percepción, cómo se ve? Cómo se cómo interaccionan las cosas en el mundo, sea sus físicas, no este y todo a través de ver y consumir muchos, muchos, muchos, mucha seguramente vídeos.
16
00:01:20,38.516024063 --> 00:01:20,90.689937106
Ok.
17
00:01:20,90.689937106 --> 00:01:24,525.472545802
Yo creo que si alguien podía hacerlo, es Google porque es dueño de youtube.
18
00:01:24,734.168197976 --> 00:01:33,186.342111019
Entonces, en youtube hay cientos de millones de horas de video Jorge que nos lo ponen en una ventaja para crear este tipo de.
19
00:01:34,621.124719715 --> 00:01:35,168.950806671
modelos.
20
00:01:35,351.559502323 --> 00:01:51,912.42906754
Pero la pregunta, y hace rato hablábamos del tema de motor de videojuegos jean y tres es un videojuego que se crea solo o qué es en realidad o por qué? Esta es Bueno, de que par en todas las demos pareciera que están mostrando temas de videojuegos.
21
00:01:52,923.29863276 --> 00:01:56,705.90732841
bueno, de hecho, tiene como diferentes modalidades, digamos, visuales.
22
00:01:56,731.99428493 --> 00:02:06,601.55950232
No es como, es como los generadores estos de video, como so o como el propio veo tres o los de imágenes no? Entonces, por eso, a veces en ciertas demos, se ve muy realista y no te se ve como.
23
00:02:07,1.55950232 --> 00:02:08,618.95080667
Tri, por ejemplo, no yo.
24
00:02:08,618.95080667 --> 00:02:18,740.68993711
Y eso pienso que es porque una de las aplicaciones más obvias de estos o nos van a hacer los videojuegos en streaming y realistas y osea, imagínate, no ahora yendo al medio del asunto.
25
00:02:19,931.99428493 --> 00:02:41,288.51602406
de de o sea, cómo le hacen? Cómo funciona esto de cómo le hicieron para que aprenda estas físicas complejas y el mundo real? Deep mind destacó que por ejemplo, que esta coherencia fíjate, es fue fue una propiedad emergente la coherencia en en o sea, no hay no entrenan con un motor de físicas integrado ni lo entrenaron con datos de física, sino que todo lo aprendió.
26
00:02:42,184.16819798 --> 00:02:53,143.29863276
A través de grandes colecciones, enormes colecciones de video, Entonces el modelo aprendió las reglas del mundo real similar a como lo hacemos nosotros Okey, estás sumamente interesante que pueda inferir.
27
00:02:53,169.38558928 --> 00:03:21,34.74293111
Como muchas de veces nosotros, como se sus manos, lo hacemos a partir de ver cierto comportamiento, no ahora este tipo de modelos, los modelos del mundo, cómo los podría estar usando una empresa normal que tal vez no sea percent tecnológica? Bueno hoy por hoy, yo, lo que, como me lo imagino, una de las aplicaciones más obvias es, por ejemplo, en el campo del diseño, la construcción, o sea, el diseño hablando de espacios de simulaciones, por ejemplo, imagínate que eres un constructor, un director de obra.
28
00:03:21,34.74293111 --> 00:03:25,408.65597459
Y entonces, Yo pienso que en un futuro, las los inputs de estos modelos van a ser visuales.
29
00:03:26,191.26467024 --> 00:03:29,791.26467024
Imagínate que lo alimentas con los planos de tu proyecto con dos, tres, rendering ahí.
30
00:03:29,843.43858329 --> 00:03:34,121.69945285
Algunas imágenes que hagas artificiales, no como se hace hoy en día a lo alimentes.
31
00:03:34,173.8733659 --> 00:03:42,530.39510503
Y a partir de ahí, puedes navegar de manera hiper realista el el proyecto no con ya con lentes de Ray virtual o en pantalla.
32
00:03:43,617.35162676 --> 00:03:57,626.04727894
Y que pudiera ir como en película de de ciencia ficción, como en black mirror, pudiera ir editando así como le voy a cambiar aquí esta pared y a ver como se vería si le pongo cristales o si le pongo un ventana y todo esto, este de manera hiper realista, esa es una de las aplicaciones.
33
00:03:57,652.13423546 --> 00:04:02,773.8733659
La otra es el entretenimiento, decir pues video bajo demanda y personalizado.
34
00:04:03,386.91684416 --> 00:04:04,717.35162676
Y, por supuesto, videojuegos en streaming.
35
00:04:04,717.35162676 --> 00:04:23,934.74293111
Osea, creo que una de las de los fuertes o de los demos que vimos en los todos los demos que vimos, hay mucho de interacción ose de que incluso por unas flitas ose como videojuego, hay unos ejemplos que son como un monito brincando en una especie de videojuego, donde te dan a entender que una de las aplicaciones más grandes de esto van a ser los video juegos y per realistas.
36
00:04:23,934.74293111 --> 00:04:24,91.26467024
Y así.
37
00:04:24,469.52553981 --> 00:04:29,869.52553981
Que se vayan desarrollando de acuerdo a tus decisiones o con escenarios que tal vez no estén predefinidos.
38
00:04:29,999.96032242 --> 00:04:52,284.38067591
La verdad es muy, muy interesante, pero esto me lleva a preguntar, okey, realmente es el son los primeros pasos de un skynet? Estamos en peligro o simplemente es un anuncio más que genera más marketing y más emoción en el mercado, donde realmente estamos parados? Puro marketing, no? Porque la verdad es que de mine, pues es un un laboratorio serio.
39
00:04:52,623.5111107 --> 00:04:54,945.25024113
O sea, Google pone el componente de hi.
40
00:04:54,945.25024113 --> 00:04:57,788.728502
Eso no, pero el equipo de mis hases.
41
00:04:58,580.03284983 --> 00:05:02,858.29371939
Son la verdad, no de las más de las equipos más brillantes que hay en el campo, el artificial.
42
00:05:03,484.38067591 --> 00:05:17,327.85893678
Entonces, puro marketing, el peligro realmente que yo le veo es más como lo que habíamos platicado de esta ruptura de la realidad, no? O sea como, como imagino yo, que por ejemplo, uno de las aplicaciones que pudiera ser como mainstream que lo integran, por ejemplo, a Google maps Street view.
43
00:05:17,614.81545852 --> 00:05:18,632.20676287
Entonces, obviamente.
44
00:05:18,906.11980635 --> 00:05:26,888.728502
Una de las cosas más obvias es que tu navegando por alguna calle, por ejemplo, utilicen esto para reconstruir la navegación.
45
00:05:26,914.81545852 --> 00:05:47,145.25024113
Entonces tú ya no vas a saber si lo que estás viendo es realmente esa calle o o estás haciendo llenada los huecos por por reconstrucciones, no de a lo mejor, si vas a personas en el lugar, vas a ver que oye estos arbolitos que me puso el no existen no? Yo creo que el peligro más bien va por allá, no como que se empieza a volver normal.
46
00:05:47,745.25024113 --> 00:05:51,423.5111107
El vamos a llenar espacios vacíos con reconstrucción.
47
00:05:51,449.59806722 --> 00:05:56,549.59806722
Pues porque no va saber la gente si cierre al o no, pero se se va a sentir Claro.
48
00:05:56,575.68502374 --> 00:05:58,714.81545852
La la verdad es que tienes tienen mucha razón.
49
00:05:58,714.81545852 --> 00:06:01,297.42415417
Cada vez es más complicado decirse un video es real o no.
50
00:06:01,610.46763243 --> 00:06:08,680.03284983
Sin embargo, ahorita que hablabas del tema de reconstrucción, yo lo pensaba más desde la óptica, por ejemplo, educativa Jorge, donde puedas tu recrear.
51
00:06:09,645.25024113 --> 00:06:29,801.77198026
Ciudades del pasado espacios del pasado épocas o poblados del pasado, en donde no necesariamente se tenga que hacer un gran esfuerzo de diseño, sino que estos modelos de el mundo sean capaces de generarte, por ejemplo, una roma antigua, una época medieval.
52
00:06:30,453.9458933 --> 00:06:33,10.46763243
En fin, temas que tal vez estén viendo en la escuela.
53
00:06:33,414.81545852 --> 00:06:40,875.68502374
Y por qué no? También es situaciones de turismo Jorge este combinadas con otras tecnologías como la realidad virtual aumentada.
54
00:06:41,188.728502 --> 00:06:54,49.59806722
Creo que da muchísimo muchísimo posibilidad, no nada más de entretenimiento, sino educación esparcimiento, turismo virtual, Regresando a uno de los temas que siempre tratamos de abordar en el programa Jorge que aplicaciones.
55
00:06:54,323.5111107 --> 00:07:00,271.33719765
Puede tener este tipo de herramientas para empresas pequeñas, no como les puede hacer más eficientes su día a día.
56
00:07:03,440.90241504 --> 00:07:06,440.90241504
Y digo no más para recalcar ahí lo que acabas de mencionar.
57
00:07:06,484.38067591 --> 00:07:16,136.55458896
Hay justamente unos de Egipto, por ejemplo, donde se ve como navegan las tumbas del faraón y que, y ahora las aplicaciones de empresas pequeñas, francamente, no, no veo en estos momentos como una empresa pequeña pudiera.
58
00:07:16,710.46763243 --> 00:07:17,675.68502374
A utilizar algo así.
59
00:07:17,910.46763243 --> 00:07:19,345.25024113
No es más que esto de la construcción.
60
00:07:19,345.25024113 --> 00:07:20,75.68502374
Creo que eso es uno.
61
00:07:20,75.68502374 --> 00:07:36,658.29371939
O sea, el diseño arquitectónico y tipo cosas, Yo creo que la más bien, las industrias como el bfx, el CGI, sabes que van a ser impactadas y movidas desde sus cimientos, pero enormemente con esto, no más que algo que ha pasa aplicar en una tienda de retail o en un pequeño comercio.
62
00:07:36,658.29371939 --> 00:07:53,242.06183533
Creo que eso ahora, Yo creo que esas implicaciones van a mi después, con las consecuencias de esto, no? O sea, con otros avances que esto derrame, por por otros lados, no ose con el enriquecimiento de, por ejemplo, de otros tipos de modelos, no este de agentes que hagan cosas, etc.
63
00:07:53,246.40966142 --> 00:07:54,729.01835707
No sea no directamente.
64
00:07:55,198.58357446 --> 00:08:08,581.19227012
Jorge, hay mucha emoción, No nada más por las posibilidades de entretenimiento, sino porque la capacidad de simular el mundo representa datos de entrenamiento para las nuevos modelos de inteligencia artificial.
65
00:08:09,172.49661794 --> 00:08:09,929.01835707
platicarnos un poco.
66
00:08:10,424.67053099 --> 00:08:21,94.23574838
Dónde ves el impacto que tipo de modelos se pueden entrenar? Y porque están tan entusiasmados de que esto puede ser algo que nos lleve a otro a otro nivel en el desarrollo de modelos más sofisticados.
67
00:08:23,259.45313968 --> 00:08:25,700.04112013
Y justamente lo lo que estaba diciendo, osea el impacto para los.
68
00:08:26,365.25851144 --> 00:08:35,365.25851144
Demás va a ser justamente con eso que dices no? Porque porque una de las cosas de las que más este carecen los, por ejemplo, los l.
69
00:08:35,365.25851144 --> 00:08:35,521.78025057
Ose.
70
00:08:35,521.78025057 --> 00:08:48,460.91068535
Los modelos como que usamos audio ahorita por hoy en día en traje PT y en todas las aplicaciones es que entienden el mundo de una manera como unidimensional a través de palabras, o sea, el lm no entiende el mundo más que en texto.
71
00:08:49,243.519381 --> 00:08:51,69.60633752
Si tú conecta estas dos tecnologías.
72
00:08:51,865.25851144 --> 00:08:59,47.86720709
Y las empatas, Tienes modelos que pueden, como nosotros imaginar antes de de de decirte algo.
73
00:08:59,47.86720709 --> 00:09:02,804.38894622
Por ejemplo, no platicábamos justamente que es algo muy humano.
74
00:09:02,804.38894622 --> 00:09:10,160.91068535
Por ejemplo, la idea de la teoría de la relatividad de la anécdota es que el se imagina una persona cayendo un edificio.
75
00:09:10,395.69329405 --> 00:09:14,569.60633753
Una velocidad no es que se imagina o sea, no se sentó a escribir.
76
00:09:15,156.56285926 --> 00:09:17,973.95416361
Palabras y hacer fórmulas para no se lo imagino.
77
00:09:18,0.04112013 --> 00:09:21,600.04112013
Y a partir de eso, armo todo una una teoría, no? Entonces es lo mismo.
78
00:09:21,600.04112013 --> 00:09:36,626.12807666
Imagínate un modelo de lenguaje que en vez de que te esté iterando en tokens con su cadena y pensamiento este tratando de resolver algo en palabras, se lo imaginara visualmente, lo tradujera, lo combinara con contexto y te daría respuestas coherentes con el mundo.
79
00:09:36,626.12807666 --> 00:09:39,756.56285926
Eso creo que una sería un gran Si totalmente.
80
00:09:39,756.56285926 --> 00:09:52,513.08459839
Yo creo que estos modelos pueden detonar una nueva capacidad, que es la imaginación en los modelos que sería imaginación visual, a diferencia de la alucinaciones que ya tienen los modelos y llevarnos a otro nivel.
81
00:09:52,513.08459839 --> 00:09:55,765.25851144
No, pues, muy interesante, dar mucho que hablar.
82
00:09:56,0.04112013 --> 00:10:00,591.34546796
Seguramente va a ser un gran in insulto para la robótica también Jorge, que tal vez en otro episodio podríamos hablar.
83
00:10:01,30.47590274 --> 00:10:09,152.21503318
pero bueno, no olviden suscribirse en dado caso, si les gusta este tipo de contenido, activar la campana para que reciba la notificación y les dejamos una pregunta.
84
00:10:09,413.08459839 --> 00:10:18,804.38894622
Si pudieran crear cualquier mundo para entrenar a una idea del futuro, qué tipo de problema estarían buscando resolver? Primero? Déjenos su respuesta en los comentarios.
85
00:10:18,804.38894622 --> 00:10:20,265.25851144
Todos lo leemos, lo respondemos.
86
00:10:20,656.56285926 --> 00:10:22,378.3019897
Y pues, bueno, hasta el siguiente episodio.
87
00:10:22,985.19428357 --> 00:10:23,498.23776183
Hasta la próxima.